Ada yang bersorak, ini adalah momen paling "terbuka" OpenAI. Memberi Codex stopkontak yang bisa diganti model apa saja, sama saja dengan mengisi sendiri parit pelindung model mereka. Apa yang mereka inginkan?
Semalam, asisten pemrograman cerdas OpenAI, Codex, tidak lagi hanya mengenal GPT buatan mereka sendiri, melainkan terbuka untuk semua model sumber terbuka.
Sinyal ini pertama kali disadari oleh komunitas pengembang.
Beberapa pengembang menemukan mode asing bernama mode sumber terbuka (OSS mode) atau juga disebut penyedia lokal (local providers) di konfigurasi baris perintah (CLI) dan kit pengembangan perangkat lunak (SDK) Codex.
Tambahkan --oss di baris perintah, dia akan menjalankan model sumber terbuka secara lokal; ingin terhubung ke yang lain, cukup ubah satu field saja.
Harus diketahui, OpenAI di masa lalu hampir identik dengan "closed source", Codex hanya mengenal GPT buatan OpenAI.
Tapi sekarang berbeda, hanya dengan satu baris konfigurasi, bisa beralih ke layanan model lokal seperti Ollama, LM Studio, dan lainnya.
Hal ini dengan cepat menjadi perbincangan hangat di kalangan pengembang.
Kepala tim OpenAI Codex, Tibo, juga tak lupa mengingatkan secara pribadi di X:
Aplikasi Codex, CLI, dan SDK, bisa dipasangkan dengan model sumber terbuka apa pun, tidak harus menggunakan yang dari OpenAI sendiri.
Pengingat ini segera dibagikan ulang oleh Pendiri Bersama Hugging Face, Thomas Wolf, dengan tambahan komentar: baru tahu hari ini, ternyata Codex sudah bisa pakai model sumber terbuka.
Beberapa netizen langsung berteriak, ini mungkin momen paling "terbuka" dalam sejarah OpenAI, sebuah hal yang luar biasa.
Komunitas bergerak lebih cepat.
Begitu dokumen resmi keluar, pengembang langsung mencoba menghubungkan beberapa model sumber terbuka ke dalamnya, dan bahkan membahas skema campuran yang lebih hemat token.
Tapi ada juga yang dengan cepat menemui tembok.
Pengembang Filip Baturan ingin menyusun skema campuran di Codex: biarkan GPT yang merencanakan, lalu model sumber terbuka yang menjadi pelaksana.
Tapi setelah dicoba, dia menemukan bahwa Codex meminta model yang terhubung juga menggunakan protokol pemanggilan alat yang sama, sementara model sumber terbuka belum tentu memilikinya.
Di satu sisi ada sorakan "paling terbuka sepanjang masa", di sisi lain ada protokol yang tidak bisa disambungkan.
Sejauh mana sebenarnya keterbukaan OpenAI kali ini?
Bagaimana Model Sumber Terbuka Terhubung ke Codex?
Keterbukaan OpenAI terhadap Codex kali ini pada dasarnya bukan membuka model itu sendiri, melainkan membuka "lapisan akses model".
Dengan kata lain, mereka tidak membuka model GPT, tetapi menambahkan "lapisan antarmuka model yang dapat dipasang-sesuai-kebutuhan" ke Codex.
Kemampuan ini diselesaikan melalui konfigurasi bernama penyedia model (model_providers).
Pengembang dapat mendaftarkan beberapa "penyedia model" dalam file konfigurasi, setiap penyedia berisi empat jenis informasi:
Alamat akses (base_url), protokol komunikasi (wire_api), metode otentikasi (env_key), serta hubungan pemetaan model (model).
Saat Codex dijalankan, dia akan memilih penyedia model yang sesuai berdasarkan konfigurasi, sehingga mengarahkan permintaan ke layanan model yang berbeda, termasuk model OpenAI sendiri, model Ollama lokal, atau API pihak ketiga seperti DeepSeek.
Contoh konfigurasi model_providers Codex. base_url adalah alamat model, sedangkan field protokol wire_api hanya mengenali satu nilai: responses.
Mistral, proxy yang dibangun perusahaan sendiri, stasiun transit pihak ketiga, semuanya bisa terhubung ke Codex dengan cara ini.
Beberapa netizen merangkum poin penting kemampuan ini sebagai: tidak terikat pada satu vendor, beralih sesuai kebutuhan, privasi dan biaya ditentukan sendiri.
Yang lebih mudah, Anda juga dapat menyimpan semua pengaturan ini sebagai "profil konfigurasi", saat debugging ingin menggunakan yang mana, cukup klik namanya di baris perintah untuk beralih.
Selain konfigurasi manual di atas, ada juga sakelar yang lebih langsung: --oss. Tambahkan parameter ini, Codex akan langsung terhubung ke layanan model sumber terbuka lokal.
Secara default hanya dua ini: Ollama dan LM Studio. Yang pertama adalah alat paling populer untuk menjalankan model besar secara lokal, yang kedua adalah pengganti desktop dengan antarmuka grafis.
Tangkapan layar penggunaan Codex --oss terhubung ke model lokal: CLI Codex (v0.92.0) di kiri menggunakan --oss untuk memanggil model lokal, LM Studio di kanan memuat openai/gpt-oss-20b (12.11GB) di port lokal 1234 untuk menyediakan layanan, semuanya berjalan offline lokal.
Artinya, melalui layanan model lokal dan konfigurasi izin jaringan, Anda dapat membuat Codex menyelesaikan pembuatan kode dan inferensi di komputer Anda sendiri, dan sampai batas tertentu mencapai operasi offline dan pemrosesan lokal.
Antarmuka Codex CLI: baris model dalam informasi startup menandai model saat ini (gpt-5.2-codex), diikuti dengan "/model to change", satu perintah saja dapat mengganti model, seluruh agen cerdas berjalan di komputer lokal.
Namun, stopkontak sudah dipasang, tidak berarti alat elektronik apa pun yang ditancapkan bisa berfungsi.
Model yang terhubung biasanya harus kompatibel dengan format antarmuka penyelesaian percakapan (Chat Completions); untuk kemampuan yang lebih kompleks seperti pemanggilan alat (function calling) apakah bisa berjalan dengan lengkap, pihak resmi tidak menjamin, harus dicoba satu per satu.
Karena protokol sering tidak sesuai, komunitas juga harus menulis sendiri alat perutean untuk menerjemahkan di tengah, dan semua ini adalah solusi yang saat ini dicoba oleh komunitas, OpenAI resmi belum mendukung hal ini.
Saat GPT dan Model Sumber Terbuka Bergabung
Bekerja Bersama di Codex
Baru saja OpenAI membuka pintu kecil, komunitas di sana sudah ramai bermain-main.
Alasannya sederhana: Codex bagus, tetapi menggunakan model OpenAI dengan biaya per token, terlalu mahal.
Karena itu banyak pengembang yang memandang ke arah model sumber terbuka.
DeepSeek adalah salah satu model sumber terbuka yang paling dikenal oleh banyak pengembang bahasa Tionghoa, pertanyaan alaminya adalah: bisakah Codex langsung menggunakan DeepSeek?
Jawaban yang diberikan CC Switch adalah: bisa, tetapi tidak bisa langsung tersambung, butuh satu lapisan "perantara" lagi.
Tutorial komunitas CC Switch: "Menggunakan DeepSeek dengan Perutean Lokal di Codex"
Tutorial komunitas mereka "Menggunakan DeepSeek dengan Perutean Lokal di Codex" menunjukkan, alasannya adalah karena Codex versi baru terutama berbasis pada OpenAI Responses API, sedangkan DeepSeek serta kebanyakan antarmuka model sumber terbuka masih berbasis Chat Completions.
Kedua set antarmuka ini tidak sepenuhnya konsisten dalam struktur permintaan, cara output streaming, serta mekanisme pemanggilan alat.
Jadi jika langsung mengisi alamat DeepSeek ke Codex, tidak akan berfungsi dengan lancar, situasi umumnya adalah parameter permintaan tidak cocok atau hasil kembali tidak dapat diparsing, menyebabkan panggilan gagal atau output abnormal, bukan sekadar "tidak bisa terhubung".
Solusi komunitas adalah menambahkan lapisan "lapisan perutean" atau "konverter protokol" lokal di tengah.
Alur dasarnya sebagai berikut:
1. Codex mengirim permintaan sesuai Responses API;
2. Lapisan perutean mengubahnya menjadi format Chat Completions;
3. Meneruskan ke model sumber terbuka seperti DeepSeek;
4. Lalu mengubah kembali hasilnya ke format Responses yang dapat dikenali Codex.
Kemampuan serupa tidak hanya disediakan oleh CC Switch.
LiteLLM, claude-code-router, serta berbagai layanan proxy yang dibuat sendiri oleh pengembang, pada dasarnya menyelesaikan masalah yang sama: memungkinkan model berbeda berinteraksi melalui spesifikasi antarmuka yang seragam.
OpenAI kali ini membuka pintu kecil, tetapi untuk benar-benar diimplementasikan, komunitas perlu "menambahkan batu bata" sendiri.
Di balik semua ini, ada cara bermain perutean campuran.
Misalnya biarkan GPT yang bertanggung jawab merencanakan: menguraikan tugas, mendesain arsitektur, memikirkan apa yang harus dilakukan. Biarkan model sumber terbuka bertanggung jawab mengeksekusi: mengubah rencana menjadi kode yang dapat dijalankan, mengubah file secara massal.
Dengan campuran seperti ini, untuk tugas yang sama, biayanya bisa dipotong lebih dari setengah.
Selain lebih hemat biaya, memasangkan Codex dengan model sumber terbuka lokal, kodenya tidak akan keluar dari komputer Anda sama sekali.
Bagi pengembang individu yang tidak ingin mengunggah proyek pribadi ke cloud, dan juga tidak ingin terus membayar API, godaan ini tidak kalah besarnya.
Perang Model Telah Berakhir
Perang Antarmuka Telah Dimulai
Beberapa tahun terakhir, semua orang mengira parit pelindung adalah model. Model siapa yang parameternya besar, skornya tinggi, jawabannya pintar, dialah yang akan menang.
Tapi kali ini, OpenAI membuat lapisan Codex menjadi antarmuka yang dapat dipasang-sesuai-kebutuhan, nilai yang disediakannya juga mulai beralih ke pintu masuk ekosistem.
Perhitungan OpenAI kemungkinan besar adalah beralih dari vendor yang menjual model, menjadi pemain yang menjual platform dan kerangka kerja: model bisa diganti sesuai keinginanmu, alatnya harus milikku.
Siapa yang menguasai pintu masuk yang dibuka pengembang setiap hari, dialah yang memegang distribusi, dan bisa menduduki posisi inti ekosistem.
Ini juga bukan pertama kalinya OpenAI melakukan penataan di ekosistem sumber terbuka.
Meskipun sejak meluncurkan GPT-2 pada 2019 mereka lama tidak merilis model bahasa besar berbobot terbuka, di bawah perkembangan cepat ekosistem sumber terbuka (seperti model Llama, DeepSeek, dll.), mereka tetap meluncurkan kembali seri model berbobot terbuka gpt-oss pada Agustus 2025.
Model-model ini kemudian dengan cepat diintegrasikan dan didukung oleh rantai alat komunitas (seperti Ollama, LM Studio, dll.), yang sekarang menjadi model yang didukung koneksi default Codex --oss.
Di lapisan konfigurasi, OpenAI memang membuka kemampuan akses model, melalui lapisan abstraksi penyedia model yang memungkinkan model pihak ketiga terhubung, tetapi bukan berarti model apa pun bisa langsung digunakan, harus sesuai dengan protokol antarmuka mereka atau melalui lapisan adaptasi untuk dikonversi.
Di lapisan protokol, mereka mempertahankan satu batasan kunci: menggunakan Responses API sebagai standar interaksi utama, sambil mengizinkan dukungan melalui lapisan kompatibilitas untuk antarmuka model lain seperti Chat Completions.
Artinya, terlepas dari model apa yang dihubungkan, perlu diselaraskan dengan struktur permintaan dan respons yang ditentukan OpenAI, tujuan akhir mereka adalah memegang standar antarmuka di tangan mereka sendiri.
Dari sudut pandang ini, lapisan protokol antarmuka yang sebelumnya mudah diabaikan ini, sedang menjadi fokus persaingan baru.
Mungkin, kali ini OpenAI ingin menggunakan sakelar konfigurasi yang tidak mencolok ini, melancarkan perang pintu masuk untuk pemrograman AI, yang membuat persaingan mereka dengan Anthropic di tahap selanjutnya, tidak lagi berada di model.
Bagi pengembang yang membuka Codex setiap hari, ini adalah kenyamanan yang nyata: bisa menjalankan model sumber terbuka, bisa menghemat token, bisa juga offline lokal.
Tapi semakin mudah digunakan, semakin dalam digunakan, semakin tidak bisa lepas dari pintu masuk ini.
Referensi:
https://x.com/thsottiaux/status/2067181377028538431
https://developers.openai.com/codex/config-advanced#oss-mode-local-providers
https://www.ccswitch.io/en/tutorials/codex-deepseek-routing-guide
Artikel ini berasal dari akun WeChat publik "Xinzhiyuan", penulis: ASI Revelation, editor: Yuanyu
















