Beberapa hari lalu, OpenAI secara resmi meluncurkan model besar baru GPT-5.4-Cyber. Sama seperti perasaan banyak netizen, model ini juga memberi kami perasaan deja vu yang sangat kuat.
Model baru ini dalam hal target pengguna, skenario aplikasi, bahkan strategi promosi, hampir sepenuhnya menyamai Claude Mythos yang diluncurkan Anthropic beberapa waktu lalu. Situasi "pertarungan jarak dekat" ini sudah sampai pada titik yang tidak lagi disembunyikan. Bahkan "The New York Times" dalam laporan terbarunya dengan tepat menunjuk: "Sama seperti Anthropic, OpenAI...".
Tren homogenisasi ini tidak hanya berhenti pada model dasar paling bawah. Jika Anda mengalihkan pandangan ke serangkaian produk yang baru-baru ini diluncurkan oleh kedua perusahaan ini, Anda akan menemukan bahwa mereka sedang menjadi cermin satu sama lain!
Di bawah lampu tak berbayang pasar modal, konvergensi ini lebih jelas. Saat ini valuasi kedua perusahaan di pasar sekunder sangat ketat, Anthropic bahkan baru-baru ini berkat kemajuan pesatnya di pasar tingkat perusahaan, harganya sedikit lebih tinggi daripada OpenAI. Penciuman modal paling sensitif, di mata mereka, kedua unicorn ini sedang menumbuhkan tanduk yang sama.
Tampaknya, homogenisasi model besar dasar pasti akan menyebabkan konvergensi aplikasi tingkat atas.
Hari ini, yang ingin saya diskusikan dengan semua orang adalah tepatnya dua alat patokan yang mewakili tingkat tertinggi bantuan pemrograman AI saat ini: Codex dari OpenAI dan Claude Code dari Anthropic. Dari perpecahan di masa lalu, hingga penyatuan kembali saat ini, bagaimana mereka langkah demi langkah tumbuh menjadi sosok yang sama?
Dari Berpisah Hingga Bersatu Kembali: Sejarah Evolusi Dua Juara
Mundurkan waktu beberapa tahun yang lalu, Codex dan Claude Code sepenuhnya adalah produk dari dua filosofi teknologi yang berbeda.
Logika dasar Codex adalah "tidak ada ilmu silat yang tak terkalahkan selain yang cepat". Ia seperti seorang pengembang senior berpengalaman 5 tahun yang mengikuti di belakang Anda, selalu siap untuk melengkapi kode.
Dalam konsep OpenAI, Codex adalah agen cerdas terminal yang ringan, interaktif tinggi, yang mengutamakan iterasi cepat dan pemrograman interaktif. Kecepatan eksekusinya sangat cepat, dengan dukungan perangkat keras Cerebras WSE-3, dapat mencapai throughput 1000 token per detik. Dalam alur kerja spesifik, Codex menyediakan tiga mode persetujuan yang jelas: saran, pengeditan otomatis, dan sepenuhnya otomatis, membuat pengembang selalu tetap dalam loop. Gagasan desain ini sangat sesuai dengan pengembang geek yang perlu membangun prototipe dengan cepat, menangani interaksi frekuensi tinggi.
Sebaliknya, Claude Code, sejak lahir membawa sifat "arsitek" yang dingin dan menahan diri.
Anthropic menyuntikkan gen untuk menangani tugas yang sangat kompleks. Ia mengandalkan jendela konteks yang besar hingga 1 juta token, dan teknologi "kompresi" unik untuk mencapai percakapan tak terbatas. Prinsip Claude Code adalah "kendali global, rencanakan sebelum bertindak". Sebelum melakukan tindakan apa pun, ia akan menggunakan teknologi pencarian agen cerdas untuk memahami seluruh alur basis kode, lalu mengoordinasi modifikasi konsistensi multi-file. Untuk tugas-tugas rekonstruksi tingkat perusahaan yang melibatkan migrasi puluhan ribu baris kode, Claude Code menunjukkan kekuatan yang menakjubkan.
Namun, seiring berjalannya waktu dan skenario aplikasi yang terus menerus menyelam, kedua alat yang awalnya sangat berbeda karakter, mulai saling mencontek pekerjaan rumah.
Sumber: MorphLLM
Dalam menangani proyek kompleks, hambatan terbesar yang dihadapi model AI tunggal adalah polusi konteks. Anda meminta AI merekonstruksi modul otentikasi, setelah membaca 40 file, sering kali lupa pola desain file pertama. Untuk mengatasi titik sakit ini, kedua perusahaan memberikan jawaban yang hampir persis sama: mengalokasikan jendela konteks independen untuk setiap sub-tugas.
OpenAI dengan cepat meluncurkan aplikasi desktop macOS baru, mengisolasi tugas dalam utas yang berbeda per proyek, dan menjalankannya secara independen di sandbox cloud. Anthropic meluncurkan arsitektur tim agen, memungkinkan pengembang membuat beberapa sub-agen, mereka berbagi daftar tugas dan dependensi, dan bekerja secara paralel di jendela independen masing-masing. Anda akan menemukan, apakah disebut "sandbox cloud" atau "tim agen", inti filosofi tekniknya telah sepenuhnya tumpang tindih.
Di lembar nilai pengujian patokan, mereka juga menunjukkan keseimbangan yang halus. GPT-5.3-Codex memimpin dalam tugas terminal Terminal-Bench 2.0 dengan skor 77.3%. Claude Code meraih skor 80.8% dalam daftar kompleks SWE-bench Verified. Mereka berdua melakukan yang terbaik di area keunggulan mereka sendiri, sambil berusaha mati-matian menutupi kelemahan mereka.
Efek OpenClaw: Tangan Tak Terlihat yang Merobohkan Tembok Tinggi
Jika strategi internal kedua perusahaan menentukan penyebab internal mereka menuju homogenisasi, maka desakan seluruh ekosistem sumber terbuka adalah kekuatan eksternal yang tidak dapat diabaikan. Di sini, kita harus menyebutkan dampak jauh yang dibawa OpenClaw ke seluruh jalur alat pemrograman AI.
Sebagai kerangka kerja alur kerja yang diluncurkan komunitas sumber terbuka, kehadiran OpenClaw dapat dikatakan merobohkan tembok ekosistem yang susah payah dibangun oleh raksasa. Ini menstandarkan proses interaksi antara model besar dan rantai alat terminal lokal. Di masa lalu, bagaimana membuat model besar memanggil commit Git lokal dengan elegan, bagaimana menjalankan skrip pengujian dengan aman di sandbox, bagaimana melakukan verifikasi penalaran multi-langkah, ini semua adalah "teknologi rahasia" kepemilikan khusus yang dibanggakan masing-masing Codex dan Claude Code.
Tapi OpenClaw mengabstraksikan proses ini menjadi protokol umum. Ini berarti, pengembang tidak perlu lagi terikat pada platform tertentu untuk mode kolaborasi tertentu. Pesta pora komunitas sumber terbuka membuat standarisasi menjadi banjir yang tidak dapat dibalik. Menghadapi situasi ini, baik OpenAI maupun Anthropic, harus merendahkan sikap untuk kompatibel dengan standar terbuka ini.
Ketika hambatan teknologi dasar diratakan oleh kekuatan sumber terbuka seperti OpenClaw, ketika semua fitur canggih menjadi konfigurasi standar industri, satu-satunya jalan keluar Codex dan Claude Code adalah melakukan involusi tanpa henti di tingkat pengalaman pengguna yang lebih halus. Ini juga mengapa kami merasa mereka semakin mirip, karena dalam kerangka standar, solusi optimal sering kali hanya satu - seperti evolusi konvergen biologis.
Codex Sedang Mengejar Claude Code
Meskipun Claude Code dan Codex sedang di jalan evolusi konvergen, perbedaan antara keduanya masih ada, bahkan Codex dalam beberapa aspek sudah lebih disukai pengembang.
Dua hari lalu, di komunitas r/ClaudeCode, seorang insinyur senior berpengalaman 14 tahun, u/Canamerican726, yang pernah bekerja di raksasa teknologi, berbagi ulasan yang sangat keras.
Secara konkret, dalam sebuah proyek kompleks yang berisi 80.000 baris kode, dia masing-masing menginvestasikan 100 jam menggunakan Claude Code dan 20 jam menggunakan Codex.
Dalam sudut pandangnya, menggunakan Claude Code seperti membimbing seorang insinyur yang dikejar deadline, kecepatan sprintnya sangat cepat, tetapi sering mengabaikan spesifikasi yang ditulis pengembang di CLAUDE.md, dan suka terus menumpuk kode dalam file yang ada untuk menyelesaikan tugas, kurang pemikiran rekonstruksi.
Sebaliknya, Codex memberinya perasaan seperti seorang veteran tenang berpengalaman 5 hingga 6 tahun. Kecepatan pemrosesannya meskipun 3 hingga 4 kali lebih lambat, tetapi akan berhenti sejenak di tengah jalan untuk berpikir dan merekonstruksi kode, dan secara ketat mematuhi batas instruksi. Otonomi tinggi ini, membuat insinyur ini berani melemparkan tugas langsung padanya, lalu dengan tenang melakukan hal lain.
Suara yang sama juga muncul di jaringan sosial seperti X. Peneliti Aran Komatsuzaki menggabungkan pengalaman penggunaannya menyebutkan, di bidang front-end Claude Code masih unggul, tetapi dalam perencanaan back-end dan menjaga informasi tetap diperbarui, Codex yang memanggil pencarian jaringan dengan frekuensi tinggi jelas lebih solid.
Bagian komentar dipenuhi dengan ringkasan berdarah dalam skenario bisnis nyata. Seorang pengembang dengan sangat tajam menunjuk, model berbasis Opus meskipun berjalan cepat, tetapi sering mengakumulasi banyak "utang pembersihan kode" untuk proyek, Codex bergerak lambat, tetapi dapat menyapu bersih sambil melanjutkan. Saya bahkan melihat ada pengguna yang merangkum hukum kelangsungan hidup, menyarankan everyone untuk segera memulai sesi baru ketika tingkat penggunaan jendela konteks mencapai 70%, jika tidak sangat mudah menerima bug tersembunyi yang disertakan sistem.
Keluhan nyata dari garis depan ini dengan jelas menunjukkan, ketika panel kemampuan dua alat hebat semakin tumpang tindih, yang menentukan归属 akhir pengembang, sering kali adalah perbedaan pengalaman kecil ini yang berkaitan dengan "biaya mengisi lubang" dan "pikiran pemeliharaan", tentu saja bagi pengguna Cina ada beberapa kesulitan khusus, seperti:
Pemikiran Dingin: Perang Bayangan Ekosistem di Balik Homogenisasi
Tentu saja, kelebihan dan kekurangan Codex dan Claude Code juga tergantung pada masing-masing pengembang, juga tergantung pada kemampuan pengembang itu sendiri, seperti yang diringkas dalam laporan ulasan u/Canamerican726 di atas: Jika Anda tidak memahami rekayasa perangkat lunak, kedua alat ini akan mengeluarkan hasil yang buruk, alat tidak sama dengan keterampilan.
Kalimat ini menusuk ilusi tertentu yang telah lama dibangun oleh alat pemrograman AI. Kami pernah mengira, selama ada asisten AI yang cukup kuat, bahkan Vobe Coder tanpa dasar apa pun dapat membuat aplikasi tingkat perusahaan sendirian. Tetapi kenyataannya, Claude Code membutuhkan "pengemudi" yang sangat fokus dan terampil, jika tidak很容易 tersesat dalam basis kode yang besar. Codex meskipun lebih mandiri, tetapi juga membutuhkan pengembang untuk menyediakan konteks sistem yang akurat untuk memanfaatkan manfaat maksimal.
Lalu, di era kemampuan alat yang sangat homogen saat ini, di mana pertahanan kedua perusahaan ini akhirnya berpindah?
Jawabannya tersembunyi dalam laporan keuangan yang membosankan dan strategi penetapan harga. Dalam tugas yang sama, jumlah token yang dikonsumsi Claude Code sering kali 3 hingga 4 kali lipat dari Codex. Biaya penggunaan lebih tinggi. Untuk tim perusahaan, menggunakan Claude Code setiap bulan需要 membayar biaya $100 hingga $200 per pengembang. Sedangkan Codex mengemas kemampuannya ke dalam paket berlangganan yang lebih terjangkau, dan melalui komunitas GitHub yang besar mengumpulkan banyak pengguna dasar.
Sumber: MorphLLM
Ambisi Anthropic adalah menanamkan Claude Code secara mendalam ke dalam alur kerja raksasa teknologi yang tidak kekurangan uang. Misalnya Stripe membuat 1370 insinyur menggunakan Claude Code, dalam 4 hari menyelesaikan migrasi kode lintas bahasa yang awalnya membutuhkan 10 orang bekerja berminggu-minggu. Perusahaan Ramp bahkan mengandalkannya untuk mempersingkat waktu respons peristiwa sebesar 80%. OpenAI mengandalkan penetrasi ekosistemnya yang ada di mana-mana, membuat Codex menjadi pilihan default banyak pengembang biasa.
Ini bukan lagi kompetisi teknologi belaka, tetapi perang消耗 tentang pengikatan ekosistem, strategi penetapan harga, serta pembentukan kembali kebiasaan pengguna.
Persimpangan Jalan Pengembang
Melihat kembali evolusi teknologi setahun terakhir, peluncuran GPT-5.4-Cyber hanyalah catatan kaki kecil dalam pertempuran panjang ini. Codex dan Claude Code sedang menuju "wajah yang sama", menandakan alat pemrograman AI dari tahap pengujian awal yang penuh variabel dan warna-warna aneh, secara resmi memasuki tahap produksi industrialisasi yang matang dan membosankan.
Sekarang, Claude Code setiap hari secara otomatis menghasilkan 135.000 commit GitHub, angka ini sudah mencapai 4% dari total commit publik seluruh jaringan. Dapat kita perkirakan, dalam waktu dekat, sebagian besar kode contoh, kasus uji dasar, serta rekonstruksi kode rutin, akan diselesaikan secara diam-diam oleh agen AI yang semakin mirip ini di latar belakang.
Sumber: MorphLLM & SemiAnalysis / GitHub Search API
Menghadapi dua alat super yang dalam kemampuan mendekati tak terbatas, dalam pengalaman saling meniru, nilai inti kami sebagai pengembang manusia还剩下什么? Mungkin, periode红利 alat akan segera berakhir sepenuhnya. Ketika setiap orang memegang senjata yang sama tajamnya, yang benar-benar menentukan胜负, bukan lagi siapa yang memiliki kecepatan pelengkapan kode yang lebih baik, tetapi siapa yang dapat mendefinisikan masalah dengan lebih baik, siapa yang memiliki visi arsitektur sistem yang lebih besar, serta siapa yang dapat menemukan keunikan yang tidak dapat digantikan milik manusia di dunia kode yang dipenuhi AI ini.
Ngomong-ngomong, Anda pilih yang mana?
Referensi tautan
https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
Artikel ini来自微信公众号"机器之心"(ID:almosthuman2014), penulis: 机器之心
















