Kedelapan 'Bapak' Transformer, Di Mana Mereka Sekarang?

marsbitDipublikasikan tanggal 2026-06-28Terakhir diperbarui pada 2026-06-28

Abstrak

Delapan penulis asli makalah Transformer “Attention Is All You Need” dari Google Brain kini telah meninggalkan perusahaan. Mereka kini tersebar di berbagai perusahaan dan bidang di industri AI. Ashish Vaswani mendirikan Essential AI, namun kabarnya sedang dalam proses direkrut oleh Nvidia. Noam Shazeer, setelah keluar-masuk Google, kini bergabung dengan OpenAI. Niki Parmar bergabung dengan Anthropic setelah sebelumnya mendirikan Essential AI bersama Vaswani. Jakob Uszkoreit beralih ke bioteknologi dengan mendirikan Inceptive. Llion Jones menjadi CTO di Sakana AI di Tokyo. Aidan N. Gomez adalah CEO dan salah satu pendiri Cohere, perusahaan AI untuk bisnis. Łukasz Kaiser tetap berada di penelitian dan menjadi kontributor kunci di OpenAI. Illia Polosukhin beralih ke blockchain sebagai salah satu pendiri NEAR Protocol. Meskipun telah berpisah dan mengambil jalur karir yang berbeda, visi bersama mereka tetap sama: terus mencari arsitektur AI baru yang lebih baik daripada Transformer yang mereka ciptakan sembilan tahun lalu.

Editor | Panda

Beberapa hari lalu, Google kehilangan dua karyawan pentingnya secara berturut-turut.

Pada 18 Juni, Noam Shazeer, salah satu penulis bersama makalah Transformer, mengumumkan pengunduran dirinya di X dan bergabung dengan OpenAI. Dua hari kemudian, peraih Hadiah Nobel Kimia 2024 dan kepala tim AlphaFold, John Jumper, juga mengumumkan keluar dari Google DeepMind dan akan bergabung dengan Anthropic.

Dua berita ini membuat pasar modal bereaksi keras: saham induk Google, Alphabet, sempat merosot lebih dari 7%, menyebabkan kapitalisasi pasar menguap lebih dari 3000 miliar dolar AS. Banyak lembaga analisis menghubungkan penjualan ini dengan "kehilangan talenta". Analis Gil Luria dari D.A. Davidson menyatakan bahwa perpindahan Shazeer ke OpenAI dan Jumper ke Anthropic secara berurutan menimbulkan kekhawatiran pasar bahwa Google mulai tertinggal dalam persaingan merebut talenta AI.

Kepergian Shazeer kali ini sangat menarik diperhatikan—ini adalah kali kedua ia meninggalkan Google.

Pada 2021, ia keluar dan mendirikan Character.AI karena tidak puas dengan ketidakmauan perusahaan untuk merilis chatbot yang ia pimpin. Pada Agustus 2024, Google kembali membeli lisensi teknologi Character.AI dengan harga sekitar 2,7 miliar dolar AS, sekaligus membawanya kembali ke DeepMind sebagai Wakil Presiden Teknik proyek Gemini, memimpin proyek tersebut bersama Jeff Dean. Kurang dari dua tahun kemudian, ia akhirnya pergi lagi, kali ini menuju ke rival terberat, OpenAI.

Dengan demikian, kedelapan penulis bersama makalah "Attention Is All You Need" yang diterbitkan sembilan tahun lalu telah meninggalkan Google seluruhnya.

Pengguna X, Tyler Maran, membuat sebuah gambar yang memetakan perjalanan karier mereka saat ini, dan gambar ini viral di media sosial.

Namun, gambar ini mungkin akan segera usang. Dalam dua hari terakhir, beredar kabar bahwa Nvidia diam-diam merekrut tim inti Essential AI, termasuk Ashish Vaswani, salah satu penulis makalah Transformer dan pendiri bersama sekaligus CEO Essential AI. Hingga berita ini diterbitkan, baik Nvidia maupun Essential AI belum memberikan tanggapan resmi.

Memanfaatkan kesempatan ini, mari kita tinjau secara lengkap perjalanan karier sembilan tahun kedelapan orang yang dijuluki "Bapak Transformer" ini dan di mana mereka benar-benar berada saat ini.

Perlu dijelaskan bahwa urutan penulis dalam makalah "Attention Is All You Need" adalah acak. Catatan kaki makalah dengan jelas menyatakan: Semua penulis berkontribusi setara, urutan acak, sehingga tidak ada yang disebut "penulis pertama" atau "penulis korespondensi". Artikel ini akan memperkenalkan kedelapan orang ini sesuai urutan nama dalam makalah asli.

"Asal Usul Segalanya": Delapan Orang Google yang Tidak 'Biasa'

Untuk memahami pilihan mereka hari ini, kita harus kembali ke tahun 2017. Saat itu, metode dominan di bidang penerjemahan mesin adalah Jaringan Saraf Berulang (RNN), di mana model harus memproses kalimat kata demi kata secara berurutan, seperti antrian di jalan satu arah, tidak dapat melakukan komputasi paralel, sehingga pelatihan menjadi lambat dan mahal.

Delapan orang dari Google Brain memutuskan untuk mencoba ide yang hampir nekat: membuang seluruh struktur perulangan, hanya menyisakan "mekanisme perhatian", memungkinkan model melihat seluruh kalimat sekaligus dan menentukan kata mana yang perlu diperhatikan. Kalimat judul makalah "Attention Is All You Need", mengadaptasi lagu The Beatles "All You Need Is Love", kemudian menjadi format yang banyak ditiru dalam judul makalah lainnya.

Penjelasan kontribusi penulis dalam makalah mencatat secara singkat apa yang dilakukan setiap orang:

Jakob Uszkoreit pertama kali mengusulkan penggunaan self-attention untuk menggantikan struktur berulang dan memimpin validasi awal ide ini;

Ashish Vaswani bersama Illia Polosukhin merancang dan mengimplementasikan model Transformer awal, terlibat hampir di setiap tahap proyek;

Noam Shazeer mengusulkan scaled dot-product attention, mekanisme multi-head attention, dan metode representasi posisi tanpa parameter; ia juga merupakan sosok yang hampir terlibat dalam segala hal;

Niki Parmar merancang, mengimplementasikan, dan men-debug berbagai varian model yang tak terhitung jumlahnya di kode awal dan kemudian di kerangka kerja tensor2tensor;

Llion Jones juga mencoba banyak varian model baru dan bertanggung jawab atas kode awal, optimasi efisiensi inferensi, dan pekerjaan visualisasi;

Łukasz Kaiser dan Aidan N. Gomez menghabiskan waktu berhari-hari membangun berbagai modul tensor2tensor, menggantikan kode awal, dan secara signifikan meningkatkan hasil eksperimen dan efisiensi penelitian.

Penjelasan ini juga mengungkap detail tidak langsung: meskipun urutan penulis makalah acak, Uszkoreit, Vaswani, Polosukhin, dan Shazeer jelas memainkan peran yang lebih inti di tingkat arsitektur, sementara Parmar, Jones, Kaiser, dan Gomez memegang peran penting dalam implementasi teknik dan pembangunan sistem—ini juga merupakan catatan awal perbedaan karakter dan keahlian masing-masing ketika kedelapan orang ini kemudian memilih jalur yang berbeda.

Nama "Transformer" sendiri memiliki anekdot tersendiri. Uszkoreit menyukai pengucapan kata tersebut, sehingga tim secara internal menyebut diri mereka "Team Transformer", dan sampul dokumen desain awal bahkan menampilkan enam karakter dari serial animasi Transformers.

Sejak diterbitkan, makalah ini telah dikutip lebih dari 260.000 kali, menjadi salah satu makalah paling banyak dikutip di abad ke-21.

Ashish Vaswani

Vaswani lahir pada 1986, berasal dari India. Ia mendapatkan gelar sarjana Ilmu Komputer dari BIT Mesra, India pada 2002, kemudian melanjutkan studi ke AS, mengambil gelar doktor di University of Southern California di bawah bimbingan David Chiang, dengan fokus penelitian pada penerjemahan mesin statistik dan pemodelan bahasa neural. Setelah menyelesaikan studi doktoral, ia bekerja sebagai ilmuwan komputer di USC Information Sciences Institute selama dua tahun sebelum resmi bergabung dengan Google Brain sebagai peneliti pada 2016, di mana ia bekerja hingga 2021.

Menurut penjelasan kontribusi penulis, Vaswani bersama Illia Polosukhin merancang dan mengimplementasikan model Transformer awal, merupakan salah satu tokoh inti yang "terlibat hampir di setiap tahap proyek".

Setelah meninggalkan Google, Vaswani bersama Niki Parmar, mantan Wakil Presiden Teknik OpenAI David Luan, dan lainnya mendirikan Adept AI pada 2021, menjabat sebagai Chief Scientist, dengan tujuan membangun "model tindakan" yang dapat beroperasi secara otonom di dalam perangkat lunak apa pun.

Adept pernah mengumpulkan dana lebih dari 400 juta dolar AS, valuasi sekitar 1 miliar dolar AS, namun produknya tertunda dan terjadi perbedaan pendapat internal. Vaswani dan Parmar memilih keluar sejak dini—masa jabatannya sebagai Chief Scientist di Adept berakhir pada November 2022.

Pada awal 2023, Vaswani kembali bekerja sama dengan Parmar untuk mendirikan Essential AI, dengan Vaswani sebagai CEO. Perusahaan ini mendapatkan investasi strategis dari Google, Nvidia, dan AMD: putaran seed senilai 8,3 juta dolar AS dipimpin Thrive Capital, putaran A senilai 56,5 juta dolar AS pada akhir 2023 dipimpin March Capital, dengan partisipasi dari Google, Nvidia, AMD, KB Investment, Franklin Templeton, dan lainnya. Pada awal 2026, perusahaan menyelesaikan putaran B senilai 175 juta dolar AS yang dipimpin Lightspeed Venture Partners dengan partisipasi Thrive Capital, valuasi mencapai 1 miliar dolar AS, secara resmi menjadi unicorn.

Pada akhir 2025, perusahaan merilis seri model open-source pertamanya, Rnj-1 (dinamai dari matematikawan India, Ramanujan).

Namun, dalam dua hari terakhir, suasana berubah. Dilaporkan, Nvidia sedang merekrut tim inti Essential AI, termasuk Vaswani sendiri, yang nantinya akan terlibat dalam pengembangan model open-source Nvidia, Nemotron.

Sumber menyebutkan alasannya cukup realistis: pendanaan Essential AI sedang mengalami hambatan, dan mengambil Vaswani dan timnya dari kubu pesaing Nvidia, AMD (AMD adalah investor strategis awal Essential AI dan perusahaan ini lama bergantung pada GPU AMD), merupakan transaksi yang menguntungkan. Beberapa peneliti Essential AI (termasuk Alok Tripathy, Saurabh Srivastava) telah memperbarui profil LinkedIn, menunjukkan mereka telah bergabung dengan Nvidia. Namun, hingga saat ini, baik Nvidia maupun Essential AI belum mengonfirmasi kabar ini secara resmi.

Noam Shazeer

Shazeer lahir di Philadelphia pada 1976, seorang Yahudi Ortodoks; ayahnya, Dov Shazeer, adalah seorang insinyur berlatar belakang guru matematika, sementara saudara perempuannya ditahbiskan sebagai rabi oleh Hebrew College. Ia menunjukkan bakat luar biasa sejak muda, pada 1994 ia menjadi anggota tim AS dalam International Mathematical Olympiad dan meraih medali emas dengan nilai sempurna. Ia kemudian melanjutkan studi matematika dan ilmu komputer di Duke University, penerima Beasiswa Memorial Angier B. Duke, dan juga memenangkan kompetisi matematika Putnam.

Pada 2000, Shazeer bergabung dengan Google, karya terkenal awalnya adalah memperbaiki fitur koreksi ejaan Google Search.

Menurut penjelasan kontribusi penulis makalah Transformer, ia mengusulkan scaled dot-product attention, mekanisme multi-head attention, dan metode representasi posisi tanpa parameter, menjadikannya orang yang "terlibat hampir dalam setiap detail" selain Vaswani dan Polosukhin.

Setelah menjadi penulis bersama makalah Transformer pada 2017, ia bersama rekannya Daniel De Freitas membuat chatbot Meena, namun Google memilih untuk tidak merilisnya secara publik karena pertimbangan kehati-hatian. Keduanya memilih mengundurkan diri pada 2021 dan mendirikan Character.AI, yang pernah mendapatkan pendanaan lebih dari 150 juta dolar AS dari a16z dan lainnya, menjadi aplikasi chat role-play yang cukup populer.

Pada Agustus 2024, cerita berubah: Google mencapai kesepakatan lisensi dengan Character.AI, dilaporkan senilai 2,7 miliar dolar AS. Shazeer dan De Freitas kembali ke Google DeepMind dengan segelintir kolega, ia ditunjuk sebagai Wakil Presiden Teknik, memimpin proyek Gemini bersama Jeff Dean dan Oriol Vinyals. Karena ia memegang sekitar 30-40% saham Character.AI, transaksi ini diperkirakan membuatnya mencairkan saham pribadi senilai 750 juta hingga 1 miliar dolar AS. Pada 2026, ia terpilih menjadi anggota National Academy of Engineering AS, rekam jejaknya tampak sangat cemerlang.

Namun, hanya beberapa bulan kemudian, ia memilih pergi lagi, kali ini menuju OpenAI, dilaporkan akan bertanggung jawab atas arah bernama "Penelitian Arsitektur", tepat pada saat OpenAI sedang merekrut banyak orang untuk persiapan IPO (perusahaan telah mengajukan dokumen S-1 secara rahasia ke SEC pada 8 Juni, dengan valuasi rumor mencapai 8520 miliar dolar AS).

CEO OpenAI Sam Altman secara terbuka menyatakan: "Sejak hari pertama OpenAI didirikan, ia adalah salah satu orang yang paling ingin saya ajak bekerja sama", dan mengatakan perekrutan ini "telah direncanakan selama sepuluh tahun penuh".

Bagi Google, ini adalah "pembelian kembali yang gagal" dengan biaya tinggi: orang yang dibayar 2,7 miliar dolar AS dua tahun lalu untuk dibawa kembali, kini bergabung dengan pesaing utama, dan ini menjadi salah satu pemicu langsung anjloknya saham Google minggu ini.

Niki Parmar

Parmar lahir di Pune, India, mengambil sarjana di Pune Institute of Computer Technology, jurusan Teknologi Informasi. Selama kuliah, ia tertarik pada kecerdasan buatan dan pembelajaran mesin melalui kursus online yang diajarkan oleh Andrew Ng dan Peter Norvig, kemudian melanjutkan studi S2 Ilmu Komputer di University of Southern California, di bawah bimbingan profesor Morteza Dehghani, meneliti masalah ilmu sosial dengan metode pembelajaran mesin.

Pada 2015, Parmar bergabung dengan Google Research sebagai software engineer, kemudian pindah ke Google Brain pada 2017 sebagai research software engineer—dilaporkan, ia adalah peneliti termuda dan satu-satunya tanpa gelar doktor di tim Google Brain saat itu.

Menurut penjelasan kontribusi penulis, ia merancang, mengimplementasikan, dan men-debug berbagai varian model yang tak terhitung jumlahnya di kode awal dan kerangka kerja tensor2tensor. Setelah makalah diterbitkan, ia terus mendorong Transformer ke luar bidang bahasa, terlibat dalam penelitian yang memperluas mekanisme self-attention ke generasi gambar dan visi komputer.

Pada 2021, Parmar meninggalkan Google dan bersama Ashish Vaswani, David Luan, dan lainnya mendirikan Adept AI, menjabat sebagai Chief Technology Officer. Sama seperti Vaswani, ia keluar dari Adept sejak dini, dan pada awal 2023 kembali mendirikan Essential AI bersama Vaswani sebagai pendiri bersama.

Namun, ia tidak menunggu sampai putaran B dan status unicorn Essential AI selanjutnya. Pada akhir 2024, Parmar diam-diam meninggalkan Essential AI dan bergabung dengan Anthropic, mengumumkannya secara publik pada Februari 2025. Ia menulis di X: "Hari ini adalah hari yang baik untuk berbagi seperti biasanya: Saya bergabung dengan Anthropic pada Desember lalu."

Ia kemudian terlibat dalam pengembangan Claude 3.7 Sonnet—salah satu peluncuran model terpenting dalam sejarah Anthropic. Saat ini ia adalah anggota tim teknis (Member of Technical Staff) di Anthropic, fokus pada penelitian kemampuan mutakhir dan pekerjaan di bidang pembelajaran penguatan.

Dua penulis bersama yang pernah sangat dekat dan dua kali bersama-sama mendirikan perusahaan, akhirnya menuju ke dua tujuan yang sangat berbeda: Parmar menarik diri diam-diam lebih dari setahun sebelumnya, dengan tenang bergabung dengan lab papan atas; sementara Vaswani memilih terus mendorong Essential AI maju, hingga minggu ini diambil oleh tangan yang dijulurkan pesaing.

Jakob Uszkoreit

Uszkoreit lahir dalam keluarga ahli bahasa. Ayahnya, Hans Uszkoreit, adalah ahli bahasa komputasi terkenal. Saat putranya mengajukan hipotesis "mekanisme perhatian saja sudah cukup", ayahnya sendiri meragukannya. Uszkoreit mendapatkan gelar doktor dari Technical University of Berlin, kemudian mencapai level "Distinguished Scientist" di Google Brain.

Menurut penjelasan kontribusi penulis, Uszkoreit-lah yang pertama kali mengusulkan penggunaan mekanisme self-attention untuk menggantikan jaringan saraf berulang dan memimpin validasi awal ide ini—benih hipotesis ini sebenarnya telah tertanam dalam makalah "decomposable attention model" yang ia tulis bersama Ankur Parikh, Oscar Täckström, dan Dipanjan Das pada 2016.

Nama "Transformer" juga dipilih karena ia menyukai pengucapannya; tim secara internal menyebut diri "Team Transformer", dan sampul dokumen desain awal menampilkan enam karakter dari serial animasi Transformers.

Pada akhir 2020, AlphaFold2 dari DeepMind membuktikan bahwa model gaya Transformer dapat memecahkan masalah tingkat "cawan suci biologi" seperti pelipatan protein. Ia juga semakin menyadari bahwa yang menghalangi pembelajaran mendalam benar-benar mengubah biologi bukanlah algoritma, melainkan data. "Ini hampir menjadi kewajiban moral," kenangnya kemudian.

Jadi pada 2021, ia bersama profesor biokimia Stanford University dan pengembang game desain RNA terkenal Eterna, Rhiju Das, mendirikan Inceptive, dengan kantor pusat di Berkeley dan tim penelitian tetap di Berlin—ia sendiri tinggal di Berlin, sementara karyawan tersebar di Zurich, London, Vancouver, dan berbagai kota di pantai timur AS. Inti pemikiran perusahaan adalah melakukan eksperimen sebaliknya: bukan memiliki data dulu baru melatih model, tetapi menggunakan robot dan manusia untuk menghasilkan data eksperimen RNA baru dalam skala besar, lalu memberikannya kepada model untuk dipelajari.

Inceptive telah mengumpulkan pendanaan sekitar 120 juta dolar AS dari Nvidia, a16z, Obvious Ventures, Section 32, dan lainnya. Perkembangan terbaru terjadi bulan ini: awal Juni, perintis terapi interferensi RNA, Alnylam Pharmaceuticals, menandatangani kerja sama strategis dengan Inceptive, memanfaatkan model dasar Inceptive untuk mempercepat desain kandidat obat siRNA, dengan pembayaran awal 30 juta dolar AS, dilaporkan nilai potensial total kerja sama ini mencapai sekitar 2 miliar dolar AS. Uszkoreit menyatakan dalam pernyataannya: "Sebagian besar desain obat masih bergantung pada trial and error—menguji ribuan molekul, berharap salah satunya berhasil. Pendekatan Inceptive berbeda: kehidupan mengikuti aturan yang sangat kompleks, hanya AI yang dapat mempelajarinya."

Dari kedelapan penulis, ia adalah satu-satunya yang benar-benar beralih ke bioteknologi, dan ini justru membuktikan ramalan yang ditinggalkan makalah tersebut bertahun-tahun lalu: potensi mekanisme perhatian jauh melampaui penerjemahan mesin.

Llion Jones

Jones berasal dari Wales, lulusan University of Birmingham. Ia bergabung dengan Google sebagai software engineer pada 2011, bekerja lebih dari sepuluh tahun, menjadi salah satu dari sedikit penulis yang tidak memiliki gelar doktor dan menemukan jalannya murni melalui intuisi teknik.

Menurut penjelasan kontribusi penulis, ia mencoba banyak varian model baru dan bertanggung jawab atas kode awal, optimasi efisiensi inferensi, dan pekerjaan visualisasi.

Ia kemudian mengingat momen penentu itu: "Kami baru mulai mencoba memotong beberapa bagian model, hanya untuk melihat seberapa buruk hasilnya. Yang mengejutkan, hasilnya justru lebih baik." Inilah saat pertama kali hipotesis "struktur berulang sebenarnya berlebihan" divalidasi.

Pada 2023, Jones bersama David Ha, juga mantan karyawan Google, mendirikan Sakana AI di Tokyo. "Sakana" dalam bahasa Jepang berarti "ikan". Ha menjabat sebagai CEO, Jones sebagai CTO, dan pendiri bersama lainnya, Ren Ito, sebagai COO.

Jones sekarang menetap di Tokyo, di media sosial menyebut diri sebagai "Peneliti AI asal Wales yang tinggal di Tokyo". Perusahaan ini memiliki jalur penelitian dengan warna anti-tren yang jelas: daripada hanya menumpuk daya komputasi dan parameter, lebih baik mencontoh logika evolusi alam, membiarkan sekelompok model yang lebih kecil bekerja sama seperti kawanan ikan. Hasil penelitian perwakilan perusahaan termasuk Continuous Thought Machine dan proyek "AI Scientist" yang dapat melakukan penelitian ujung-ke-ujung secara otonom. Baru-baru ini, perusahaan ini bahkan merilis model Sakana Fugu yang berkinerja mutakhir.

Sakana AI telah mengumpulkan total pendanaan 379 juta dolar AS, termasuk putaran B yang diselesaikan pada Maret 2026, dengan Mitsubishi Electric juga sebagai salah satu investornya. Pada Maret 2026, perusahaan juga mendapatkan kerja sama multi-tahun dengan Mitsubishi UFJ Financial Group (MUFG). MUFG berencana menggunakan teknologi Sakana untuk mereformasi sistem perbankan, dilaporkan kerja sama ini dapat membuat perusahaan dengan valuasi sekitar 15 miliar dolar AS ini menghasilkan keuntungan dalam setahun.

Jones sendiri telah menyatakan keraguannya terhadap "scaling" murni di berbagai kesempatan. Pada Maret 2026, dalam acara internal perbankan, ia mengatakan penelitian AI saat ini menghadapi realitas yang canggung: investasi dan talenta yang mengalir deras seharusnya menghasilkan lebih banyak terobosan, tetapi efek sebenarnya mungkin justru sebaliknya: investor mendorong hasil, persaingan mendorong peluncuran pertama, ruang bagi peneliti untuk "mengeksplorasi secara bebas" justru tertekan. Ia menyebutkan, Sakana secara internal mempertahankan sebagian kecil kebebasan penelitian "tanpa KPI", karena terobosan berikutnya pasti datang dari investasi jangka panjang yang tidak memperhitungkan konsekuensi—inilah cara Transformer lahir dari kantor Google Brain saat itu.

Ia juga mengatakan satu kalimat yang sering dikutip: agar arsitektur baru benar-benar menggantikan Transformer, tidak cukup hanya "lebih baik", tetapi harus "jelas, tanpa keraguan, lebih baik".

Aidan N. Gomez

Gomez adalah yang termuda di antara kedelapan penulis. Saat makalah diterbitkan, ia hanyalah seorang magang sarjana berusia 20 tahun di Google Brain, sedang mengambil gelar ganda ilmu komputer dan matematika di University of Toronto.

Menurut penjelasan kontribusi penulis, ia dan Łukasz Kaiser menghabiskan waktu berhari-hari membangun berbagai modul kerangka kerja tensor2tensor, menggantikan kode awal, dan secara signifikan meningkatkan hasil eksperimen dan efisiensi penelitian. "Saat itu saya hanya ingin memahami bagaimana mekanisme perhatian benar-benar bekerja," kenangnya kemudian, "sama sekali tidak menyangka itu akan menjadi 'arsitektur segala sesuatu'." Setelah makalah, ia mengambil gelar doktor di University of Oxford, menghentikan studi sementara untuk berwirausaha, dan baru mendapatkan gelar doktor secara resmi pada 2024—dapat dikatakan ia menyelesaikan gelar sambil membangun perusahaan.

Pada 2019, Gomez bersama Ivan Zhang dan Nick Frosst mendirikan Cohere, memposisikan perusahaan sebagai penyedia layanan AI tingkat perusahaan, sengaja menghindari perlombaan pembakaran uang chatbot konsumen, fokus pada privasi data, penerapan lokal, dan kemampuan multibahasa, dengan klien kebanyakan perusahaan besar dan pemerintah berbagai negara. Pada 2023, Gomez masuk dalam daftar 100 Orang Paling Berpengaruh di bidang AI oleh TIME, ia dan dua pendiri bersama juga menduduki peringkat pertama dalam daftar Perintis Tren AI oleh majalah Maclean's tahun itu; pada April 2025, ia terpilih menjadi anggota dewan direktur perusahaan mobil listrik Rivian.

Pendekatan yang relatif "tidak seksi" ini justru menghasilkan data keuangan yang bagus: hingga pertengahan 2026, pendapatan berulang tahunan Cohere telah melebihi 200 juta dolar AS, tumbuh 6 kali lipat dalam setahun terakhir, margin kotor sekitar 70%, total pendanaan mendekati 1,7 miliar dolar AS, valuasi sekitar 7 miliar dolar AS; perusahaan merekrut Francois Chadwick, yang terlibat dalam IPO Uber, sebagai CFO pertama pada Agustus 2025, dan jendela penjualan saham karyawan di pasar sekunder telah dibuka satu putaran, Gomez sendiri berkali-kali menyatakan IPO "segera", namun hingga saat ini perusahaan belum mengajukan prospektus ke regulator.

Gomez belakangan semakin menjadi juru bicara AI dalam arti geopolitik. Minggu ini, ia menulis artikel di majalah Fortune, menyerukan negara-negara untuk menghadapi masalah "kedaulatan digital". Artikel tersebut secara langsung menyebutkan insiden pembatasan akses model Anthropic baru-baru ini, memperingatkan negara-negara untuk tidak "menyewa" masa depan mereka kepada segelintir raksasa teknologi terpusat, dan mengusulkan pembangunan ekosistem yang benar-benar beragam, di mana negara-negara dapat bergantung pada penyedia AI yang berbeda, sambil mempertahankan nilai, bahasa, dan sistem hukum mereka sendiri.

Ia juga secara terbuka menyatakan bahwa kekhawatiran eksternal tentang risiko eksistensial "kiamat AI" dibesar-besarkan, risiko nyata yang lebih ia khawatirkan adalah informasi palsu yang diperbesar secara otomatis di media sosial. Saat ini, Gomez tidak hanya membicarakan model itu sendiri, tetapi juga siapa yang berhak memutuskan AI seperti apa yang digunakan dunia.

Łukasz Kaiser

Kaiser berasal dari Polandia, pelatihan akademis awalnya adalah ilmu komputer teoretis seperti logika, teori automata, teori model algoritma, dan teori permainan: ia mendapatkan gelar ganda S2 matematika dan ilmu komputer dari University of Wrocław, menyelesaikan gelar doktor di RWTH Aachen University Jerman, kemudian memiliki jabatan tetap di French National Centre for Scientific Research (CNRS) dan Paris Diderot University, fokus pada penelitian murni logika dan teori automata. Kemudian ia beralih ke aplikasi, bekerja di Google Brain hampir delapan tahun, selama itu juga menjadi penulis bersama TensorFlow, dan menerbitkan makalah awal tentang "apakah memori aktif dapat menggantikan perhatian" bersama Samy Bengio, serta "algoritma pembelajaran Neural GPU" bersama Ilya Sutskever.

Menurut penjelasan kontribusi penulis, ia dan Aidan N. Gomez menghabiskan waktu berhari-hari membangun kerangka kerja tensor2tensor, secara signifikan meningkatkan hasil eksperimen dan efisiensi penelitian.

Dari kedelapan penulis, ia adalah satu-satunya yang tidak memilih berwirausaha, tetap berada di lab besar untuk melakukan penelitian murni.

Pada 2021, ia bergabung dengan OpenAI, saat itu ChatGPT belum diluncurkan. Di OpenAI, ia terlibat dalam pengembangan Codex (yang kemudian menjadi dasar teknologi GitHub Copilot) dan patokan pemrograman HumanEval yang menyertainya, juga terlibat dalam penelitian kumpulan data soal matematika GSM8K, pekerjaan ini menunjukkan sejak dini bahwa "membiarkan model berpikir lebih lama dan mengambil sampel lebih banyak selama penalaran" dapat secara signifikan meningkatkan akurasi—inilah cikal bakal paradigma model penalaran kemudian.

Ia juga adalah salah satu penulis yang namanya tercantum dalam laporan teknis GPT-4, kemudian menjadi kontributor inti model penalaran pertama OpenAI, o1 (dirilis September 2024), dianggap sebagai peran tingkat "kepala penelitian", kemudian berlanjut ke o3 dan paradigma penalaran yang lebih baru, hingga seri GPT-5 saat ini.

Baru-baru ini dalam podcast MAD yang dibawakan Matt Turck, ia mengatakan Transformer telah terbukti secara matematis dapat memecahkan masalah apa pun, asalkan model diizinkan menghasilkan langkah-langkah penalaran perantara yang cukup banyak. Dalam arti tertentu, ini adalah anotasi yang tertunda dan lebih tepat terhadap makalah sembilan tahun lalu itu.

Illia Polosukhin

Polosukhin berasal dari Kharkiv, Ukraina, sarjana matematika terapan, dan juga juara kompetisi International Collegiate Programming Contest (ICPC). Menurut kenangannya sendiri, setelah menonton "The Matrix" pada usia sepuluh tahun, ia mengembangkan ketertarikan yang hampir seperti obsesi terhadap kecerdasan buatan. Pada 2014, ia bergabung dengan Google, terlibat dalam penelitian terkait TensorFlow, juga melakukan penelitian tentang pemahaman bacaan mesin dan sistem tanya jawab.

Menurut penjelasan kontribusi penulis, ia bersama Ashish Vaswani merancang dan mengimplementasikan model Transformer awal, bagian yang ia tangani terutama memvalidasi efektivitas arsitektur ini dalam tugas penerjemahan mesin.

Setelah makalah diterbitkan, ia meninggalkan Google pada 2017, bersama Alexander Skidanov mendirikan perusahaan kecerdasan buatan yang awalnya bernama NEAR.AI. Namun, mereka segera menyadari bahwa membangun infrastruktur terdesentralisasi mungkin lebih menarik daripada membuat model, sehingga perusahaan beralih menjadi proyek blockchain NEAR Protocol sekitar tahun 2018.

NEAR menggunakan teknologi sharding bernama Nightshade, dan menyediakan jaringan lapis dua yang kompatibel dengan Ethereum melalui Aurora. Jaringan utama diluncurkan pada 2020, hingga saat ini telah mengumpulkan pendanaan lebih dari 530 juta dolar AS dari a16z, Coinbase, Tiger Global Management, Hashed, Dragonfly Capital, dan lainnya.

Saat ini, Polosukhin berusaha menyatukan kembali dua identitas awalnya: pada Maret 2026, ia mengatakan kepada media, "pengguna blockchain masa depan akan menjadi agen AI, bukan manusia", dan memposisikan NEAR sebagai "lapisan penyelesaian" ekonomi agen. Pada April 2026, ia secara terbuka menyerukan pembangunan kerangka regulasi yang lebih baik untuk menangani agen AI otonom; ia percaya institusi dan sistem yang ada belum siap menangani masalah tanggung jawab dan risiko sistemik yang dibawa oleh sistem semacam ini, menyerukan mekanisme akuntabilitas yang lebih jelas dan pengawasan gaya "human-in-the-loop".

Saat ini ia menetap di Portugal. Di antara dua identitas "menulis makalah LLM fondasional" dan "menjalankan perusahaan blockchain bernilai puluhan miliar dolar AS", orang yang dapat memiliki keduanya sekaligus di seluruh dunia mungkin hanya dia.

Delapan Jalan, Terus Mengeksplorasi

Pada Maret 2024, dalam konferensi GTC Nvidia, tujuh dari delapan penulis (Niki Parmar tidak hadir karena suatu hal) untuk pertama kalinya tampil bersama sebagai sebuah kelompok, menerima wawancara dari Jensen Huang.

Huang berkata: "Segala sesuatu yang kita nikmati hari ini, dapat ditelusuri kembali ke momen itu."

Di akhir percakapan, ia memberikan kepada setiap orang sebuah plakat peringatan superkomputer DGX-1 Nvidia yang bertanda tangan, bertuliskan "Anda mengubah dunia (You transformed the world)". Pada November 2024, NEC C&C Foundation Jepang memberikan C&C Award tahun itu kepada "tim Transformer" yang terdiri dari delapan orang ini, berbagi panggung dengan tiga insinyur senior yang meneliti teknologi transmisi kabel laut lintas samudera. Dua jenis pembangun infrastruktur dasar dari bidang yang sangat berbeda, ditempatkan dalam penghargaan yang sama.

Sembilan tahun berlalu, delapan jejak kehidupan ini telah tersebar ke tempat-tempat yang hampir tidak akan bersilangan lagi: jalur layanan perusahaan di Silicon Valley, lab algoritma evolusioner di Tokyo, perusahaan biologi molekuler di Berlin, protokol blockchain di Portugal, dan beberapa lab AI papan atas yang masih mengatur ulang kombinasinya minggu ini.

Tetapi jika kita menyatukan perkataan mereka selama bertahun-tahun, akan ditemukan penilaian bersama yang berulang kali muncul: tidak ada yang benar-benar percaya Transformer akan menjadi titik akhir.

Aidan N. Gomez mengatakan dunia membutuhkan sesuatu yang lebih baik dari Transformer; Llion Jones mengatakan arsitektur berikutnya harus "jelas, tanpa keraguan, lebih baik" untuk menggantikannya; Łukasz Kaiser masih menggunakan bahasa matematika, berusaha menjelaskan sejauh mana arsitektur yang lahir sembilan tahun lalu ini dapat membawa manusia.

Ini mungkin warisan paling abadi yang ditinggalkan makalah ini: kedelapan penulisnya tersebar di seluruh penjuru, tetapi tidak satu pun berhenti mencari jawaban berikutnya.

Referensi

https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/

https://x.com/TylerMaran/status/2067772926695522454

https://www.nvidia.com/zh-tw/on-demand/session/gtc24-s63046/

Artikel ini berasal dari akun WeChat "机器之心" (ID: almosthuman2014), penulis: 关注AI的

Pertanyaan Terkait

QSiapa saja delapan penulis makalah 'Attention Is All You Need' yang disebut 'Transformer's eight dads'?

AKedelapan penulis tersebut adalah Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, dan Illia Polosukhin.

QApa kontribusi utama Noam Shazeer dalam makalah Transformer, dan ke perusahaan mana dia baru-baru ini pindah?

ANoam Shazeer mengusulkan mekanisme 'scaled dot-product attention', 'multi-head attention', dan metode representasi posisi tanpa parameter. Dia baru-baru ini mengumumkan keluar dari Google DeepMind dan bergabung dengan OpenAI.

QDari kedelapan penulis Transformer, siapa yang tetap bekerja di lab penelitian besar dan tidak memulai startup?

AŁukasz Kaiser adalah satu-satunya dari kedelapan penulis yang tetap bekerja di lab penelitian besar (OpenAI) dan tidak memulai startup.

QJakob Uszkoreit, salah satu penulis, kini mendirikan perusahaan di bidang apa, dan apa filosofi intinya?

AJakob Uszkoreit mendirikan perusahaan bioteknologi bernama Inceptive yang berfokus pada desain RNA. Filosofi intinya adalah menggunakan AI untuk mempelajari aturan kompleks biologi, bukan hanya mengandalkan trial and error dalam desain obat.

QMenurut artikel, apa kesamaan pandangan dari beberapa penulis mengenai masa depan arsitektur Transformer?

ABeberapa penulis, seperti Aidan N. Gomez dan Llion Jones, sepakat bahwa dunia membutuhkan arsitektur yang lebih baik dari Transformer, dan penggantinya harus 'jelas dan tidak diragukan lagi lebih baik'.

Bacaan Terkait

Keseimbangan Kekuatan Kembali Apple dan "Micron cs": Membongkar Struktur Profit di Balik iPhone

Pernahkah Anda mempertanyakan bagaimana keuntungan dari penjualan iPhone didistribusikan di antara berbagai pemasok komponen? Sebuah analisis menunjukkan pergeseran kekuatan dalam rantai pasokan Apple. Dulu, pemasok memori seperti Micron (MU) hanya menerima bagian kecil, sekitar 1.6%-2.3% dari harga iPhone X. Laporan dari akun media sosial @BluthCapital menyoroti ketidakseimbangan ini, dengan menyebut Apple membeli chip seharga $5 dan menjualnya kembali seharga $99 kepada konsumen. Data terbaru menunjukkan, dari total keuntungan satu unit iPhone, Apple mengambil porsi terbesar sekitar 25%, sedangkan raksasa memori seperti Micon hanya memperoleh kurang dari 3%. Laporan keuangan Apple Q2 2026 mengungkapkan, laba bersih per unit iPhone sekitar $320-340, dengan margin bersih mencapai 33%-36%. Sementara itu, biaya memori telah meningkat secara signifikan. Pada era iPhone X (2017), biaya memori hanya sekitar 2% dari Biaya Material (BOM). Namun, pada iPhone 17 (2026), proporsi ini melonjak menjadi 12%-15% dari BOM, sekitar $60-80, didorong oleh kenaikan harga memori secara global. Peningkatan tajam harga memori ini, yang disebut CEO Apple Tim Cook sebagai fenomena "sekali dalam 40 tahun", utamanya dipicu oleh permintaan yang sangat besar dari industri AI. Server AI membutuhkan DRAM 8-10 kali lebih banyak dibandingkan server tradisional, menyebabkan pemasok seperti Samsung, SK Hynix, dan Micon mengalihkan produksi ke produk berpenghasilan tinggi seperti HBM (High Bandwidth Memory), yang mengurangi pasokan untuk elektronik konsumen seperti iPhone. Ketimpangan pasokan ini mengubah dinamika kekuatan, memberikan leverage negosiasi yang lebih besar kepada produsen memori. Bahkan, dikabarkan Apple sedang mencoba mendiversifikasi pasokannya dengan mengajukan izin untuk membeli chip memori dari perusahaan China, CXMT. Singkatnya, era di mana Apple mendominasi dengan menekan harga pemasok komponen seperti memori sedang mengalami perubahan. Kekuatan kini bergeser seiring dengan melonjaknya permintaan memori dari sektor AI, memaksa perusahaan seperti Apple untuk menyesuaikan strategi dan menghadapi kenaikan biaya yang signifikan.

Odaily星球日报1j yang lalu

Keseimbangan Kekuatan Kembali Apple dan "Micron cs": Membongkar Struktur Profit di Balik iPhone

Odaily星球日报1j yang lalu

Jawaban Lokal untuk Komputasi Luar Angkasa: Lebih Efisien dengan Foton, Jalur Musk dan Huang Terlalu Berbelit

Perlombaan komputasi luar angkasa telah menjadi perlombaan senjata nyata, dengan Musk dan Jensen Huang (CEO Nvidia) menekankan pentingnya kecerdasan di tempat data dihasilkan dan potensi satelit AI bertenaga surya sebagai solusi komputasi paling hemat biaya pada 2032. Namun, komputasi di luar angkasa menghadapi tantangan teknis yang jauh lebih keras daripada di darat: radiasi partikel energi tinggi yang menyebabkan kesalahan chip, kesulitan dissipasi panas di lingkungan vakum, dan pasokan daya yang sangat terbatas. Di sinilah **komputasi fotonik** muncul sebagai jawaban potensial. Chip komputasi fotonik menggunakan foton (cahaya) sebagai pembawa informasi, yang memiliki keunggulan alami untuk lingkungan luar angkasa: 1. **Tahan Radiasi**: Foton tidak bermuatan listrik, sehingga tidak rentan terhadap gangguan langsung dari partikel energi tinggi. 2. **Rendah Panas**: Proses komputasi dengan cahaya dalam waveguide hampir tidak menghasilkan panas, mengatasi masalah dissipasi panas yang kritis. 3. **Rendah Daya**: Konsumsi daya statis mendekati nol, cocok dengan sumber energi terbatas satelit. Keunggulan ini memungkinkan komputasi fotonik mencapai kepadatan komputasi yang lebih tinggi dengan berat dan volume muatan yang sama dibandingkan chip elektronik tradisional, karena membutuhkan sistem pendukung (pendingin, pelindung radiasi) yang lebih sederhana dan ringan. Sementara chip elektronik mendekati batas fisik penyusutan transistor (quantum tunneling), komputasi fotonik meningkatkan kinerja dengan memperluas skala dan memanfaatkan multidimensi cahaya (panjang gelombang, polarisasi), menawarkan jalur pengembangan yang berbeda. Meski menjanjikan, komputasi fotonik masih perlu mengatasi tantangan seperti integrasi skala besar, memisahkan memori dan komputasi, serta validasi rekayasa untuk kondisi peluncuran (getaran tinggi) dan lingkungan orbit. Jalur menuju komputasi berbasis luar angkasa yang komersial dan terukur masih panjang, tetapi komputasi fotonik dan interkoneksi fotonik ("komputasi & koneksi cahaya") muncul sebagai kartu truf potensial untuk mendorong batas kemampuan konstelasi komputasi di masa depan.

marsbit2j yang lalu

Jawaban Lokal untuk Komputasi Luar Angkasa: Lebih Efisien dengan Foton, Jalur Musk dan Huang Terlalu Berbelit

marsbit2j yang lalu

Trading

Spot
活动图片