Dalam persaingan kecerdasan buatan yang terus memanas, diskusi seputar DeepMind, OpenAI, dan Anthropic tidak lagi sekadar tentang "model siapa yang lebih kuat", tetapi telah berevolusi menjadi pertanyaan yang lebih mendalam: bagaimana sebenarnya lab AI top mengorganisir penelitian, memilih jalur teknologi, dan membuat pertimbangan jangka panjang antara daya komputasi, modal, dan keamanan.
Dalam wawancara InfoQ baru-baru ini dengan Sebastian Mallaby, penulis buku "The Infinity Machine" (Otak AI Google) dan sejarawan teknologi serta keuangan ternama, kami mencoba memahami logika pertumbuhan DeepMind dari perspektif yang lebih dekat dengan "pengamat internal", serta perbedaan struktural nyata antara DeepMind dengan OpenAI dan Anthropic.
Sebagai pengamat yang telah lama melacak Demis Hassabis dan timnya, Mallaby berpendapat bahwa keunggulan DeepMind tidak hanya berasal dari daya komputasi dan pendanaan yang disediakan Google, tetapi juga dari cara organisasi yang unik: memungkinkan ilmuwan mengeksplorasi secara bebas dalam jangka panjang, sekaligus mampu membentuk tim serangan dengan cepat pada momen-momen kritis untuk mendorong terobosan. Mekanisme inilah yang memungkinkannya terus menerus menaklukkan masalah yang membutuhkan investasi lebih dari sepuluh tahun, seperti AlphaGo dan AlphaFold.
Sementara itu, perbedaan dalam pertimbangan "keamanan versus kecepatan" di antara berbagai lab juga sedang menjadi variabel penting yang mempengaruhi lanskap persaingan AGI. Dan seiring dengan penskalaan AI (scaling) yang berkembang dari fase pelatihan ke fase inferensi hingga tingkat agen di masa depan, struktur pendorong kemajuan AI itu sendiri juga sedang berubah.
Dalam arti ini, persaingan AI saat ini tidak lagi hanya tentang perlombaan kemampuan model, tetapi merupakan permainan jangka panjang yang berputar di sekitar mode organisasi, metode penelitian, dan alokasi sumber daya sistem.
Mengapa DeepMind Bisa Sukses?
InfoQ: Dalam buku Anda, Anda menyebutkan bahwa mentor Hassabis di MIT, Tomaso Poggio, pernah mengatakan bahwa banyak peraih Nobel yang ia temui sangat berbakat dan beruntung. Sebagian kecil peraih Nobel memiliki bakat luar biasa, dan apa pun yang mereka teliti pasti akan memenangkan penghargaan. Pada tahun 2009, Hinton bertemu Hassabis dan menganggapnya sebagai orang yang lebih kompetitif daripada dirinya. Jika Anda harus menggambarkan Hassabis dengan beberapa kata, apa saja? Mengapa demikian?
Mallaby: Jika saya harus menggunakan tiga kata untuk menggambarkannya, saya akan mengatakan berbakat alami, kompetitif, dan ramah rendah hati.
Jenius tentu saja tidak perlu diragukan lagi. Kompetitif adalah hasrat hatinya yang mendalam untuk menang, untuk mencapai sesuatu yang luar biasa. Saya rasa ini terkait dengan partisipasinya dalam turnamen catur internasional sejak kecil. Pada usia enam tahun, ia sudah berada dalam persaingan yang intens, dan karenanya menjadi sangat kompetitif. Semangat kompetitif ini menjadi pendorong baginya.
Namun, sebaliknya, jika seseorang hanya kompetitif dan berbakat, tetapi tidak ramah, maka orang lain tidak akan mau bekerja untuknya, tidak akan menyukainya, bahkan mungkin berusaha menghalanginya. Keunggulannya justru terletak pada fakta bahwa semua orang menyukainya. Setelah berinteraksi dengannya, orang akan merasa dia jujur, memiliki nilai-nilai yang baik, dan berharap kecerdasan buatan dapat membawa kesejahteraan bagi umat manusia. Karena itulah, orang-orang bersedia mendukung usahanya. Saya sulit membayangkan, tanpa kebaikan ini, apakah dia masih bisa mencapai kesuksesan seperti sekarang.
InfoQ: Jadi menurut Anda kesuksesan DeepMind saat ini terkait dengan kerendahan hati dan kebaikan pendirinya, Hassabis? Dibandingkan dengan lab AI lainnya, apa keunikan DeepMind?
Mallaby: Ya, saya pikir semua ini terkait erat dengan kepribadian Hassabis.
Keunikan DeepMind pertama-tama terletak pada pendiriannya pada tahun 2010, saat itu kecerdasan buatan bahkan belum bisa mengenali foto kucing. Teknologi terkait sama sekali belum matang pada waktu itu, tetapi masih ada orang yang bersedia bergabung dengan perusahaan ini dan mendedikasikan diri pada usaha yang belum sukses. Investasi dan visi jauh ke depan inilah yang membuat DeepMind memimpin industri selama sekitar sepuluh tahun pertama, hingga kehadiran ChatGPT, ketika perlombaan mulai memanas. Dan selama sepuluh tahun sebelum itu, mereka selalu unggul jauh, semua ini berkat start yang sangat awal, dan ini jelas langsung berkat Hassabis. Sejak usia 18 tahun, sebelum masuk Universitas Cambridge, dia sudah yakin akan kemungkinan kecerdasan buatan, dan sejak dini telah berkomitmen pada visi ini. Ini mungkin juga sifat lain yang membentuknya: Dia tidak hanya kompetitif, jenius, dan baik hati, tetapi juga seorang perintis yang memiliki wawasan jauh ke depan.
InfoQ: Dalam buku Anda, Anda menyebutkan bahwa Hassabis sebenarnya tidak menyukai manajemen bisnis. Bentuk organisasi idealnya adalah "Bell Labs + lembaga penelitian akademik". Tim DeepMind selalu berkantor independen di Inggris, banyak sistem awal tim mengizinkan ilmuwan meneliti dalam jangka panjang tanpa tuntutan produk jangka pendek, dan makalah mereka dapat diterbitkan secara publik, ini sangat berbeda dengan banyak perusahaan di Silicon Valley. Apakah kondisi yang terlihat "terlalu bebas" ini akan menyulitkan manajemen Hassabis? Biasanya orang yang terbiasa bebas, terutama para jenius, tidak suka dibatasi.
Mallaby: Saya pikir poin kunci DeepMind adalah mereka memberikan kebebasan yang sangat besar kepada talenta-top ini. Para peneliti dapat menentukan sendiri arah penelitian, menerbitkan makalah akademik, dan memiliki kebebasan penelitian seperti di universitas.
Tetapi jika DeepMind hanya memiliki kebebasan, itu hanya akan menjadi sekelompok orang yang melakukan penelitiannya masing-masing, dan akhirnya tidak menghasilkan produk yang terbentuk. Hassabis menggabungkan eksplorasi bebas dan konsentrasi serangan — ketika dia menilai bahwa suatu arah penelitian telah memenuhi kondisi untuk mencapai terobosan besar, dia akan memerintahkan: "Oke, jalur ini bisa diluncurkan, kita akan membentuk tim khusus, maju dengan kecepatan penuh, menerapkan manajemen terpusat dari atas ke bawah."
Dia menyebut tim semacam ini sebagai "strike team" (tim serangan). Dari pengembangan agen cerdas game Atari paling awal, hingga AlphaGo, kemudian AlphaZero hingga serangkaian model termasuk AlphaFold, di belakangnya ada tim serangan seperti ini. Dalam tim serangan, akan ada penanggung jawab yang memimpin secara terpadu, semua orang berlari menuju tujuan yang sama, ada tekanan waktu dan tenggat waktu, dengan intensitas kerja yang sangat tinggi.
Jadi kejeniusan Hassabis terletak pada penggabungan eksplorasi bebas dan transformasi hasil — memanfaatkan terobosan ilmu teoritis untuk meluncurkan produk seperti AlphaGo.
Alasan dia memahami kebebasan akademik adalah karena dia sendiri pernah mengambil gelarjana, memahami mode penelitian universitas; sedangkan pemikiran membentuk tim serangan berasal dari pengalamannya di industri game — dia pernah bekerja di perusahaan game, dan juga mendirikan sendiri satu perusahaan, sangat memahami bagaimana perusahaan game mengejar tenggat waktu dan mengirimkan produk tepat waktu. Dia menggabungkan kedua mode ini dengan sempurna.
InfoQ: Bagaimana lab AI top seperti DeepMind mengorganisir dan mengelola talenta? Misalnya bagaimana merekrut ilmuwan? Bagaimana mengelola peneliti top? Apakah akan memberi mereka gaji tinggi atau lebih banyak sumber daya?
Mallaby: Pada tahap awal, gaji yang diberikan perusahaan sebenarnya tidak tinggi, karena pendanaan mereka sangat terbatas pada waktu itu. Meskipun akan memberikan opsi perusahaan, kebanyakan orang yang bergabung tidak menganggap opsi ini akan berharga di masa depan — karena AI pada waktu itu tidak memiliki produk matang maupun model monetisasi yang jelas.
Oleh karena itu, pada tahap awal startup, menarik talenta yang baik sebenarnya sangat sulit. Saya pikir, Demis bisa melakukan ini sebagian besar karena dia dan pendiri bersama Shane Legg sendiri adalah ilmuwan yang sangat dihormati, yang membuat peneliti lain bersedia bergabung dengan tim mereka.
Selain itu, alasan beberapa orang bergabung adalah mereka tidak ingin menangani urusan "non-riset" dalam startup, seperti berurusan dengan pengacara, menghubungi investor, mempertimbangkan tempat kerja, dll. Hal-hal ini dianggap merepotkan dan membosankan. Jika Demis bersedia menangani pekerjaan organisasi dan manajemen ini, mereka dapat fokus pada penelitian ilmiah yang mereka kuasai. Oleh karena itu, beberapa orang (seperti peneliti Mnih yang terlibat dalam proyek Atari) menyebutkan, inilah alasan mereka bergabung.
Namun setelah tahun 2014, situasi berubah secara signifikan. Setelah diakuisisi Google, DeepMind mendapatkan dukungan dana yang memadai, tidak hanya dapat memberikan kompensasi yang lebih kompetitif, tetapi juga membangun lingkungan kerja yang lebih stabil dan lengkap, termasuk kondisi kantor yang lebih baik dan makanan gratis berkualitas tinggi. Secara keseluruhan, setelah akuisisi, pengalaman kerja meningkat secara signifikan.
Selain itu, seiring dengan perkembangan teknologi yang terus berlanjut, penelitian juga semakin bergantung pada daya komputasi. Untuk membuat model benar-benar mencapai efek terobosan, dibutuhkan banyak semikonduktor canggih dan sumber daya komputasi. Oleh karena itu, bagi ilmuwan, apakah mereka dapat memperoleh daya komputasi yang memadai menjadi faktor kunci. Dan bekerja di DeepMind, mereka dapat langsung menggunakan daya komputasi dan sumber daya chip Google, yang juga menjadi alasan penting untuk menarik talenta top bergabung.
InfoQ: DeepMind tidak sepenuhnya dalam kondisi "berjuang untuk bertahan hidup" ketika diakuisisi Google, Anda juga menyebutkan dalam berbagi sebelumnya bahwa CEO Meta Mark Zuckerberg pernah mengundang Hassabis untuk makan malam membahas akuisisi, Elon Musk juga pernah melemparkan tawaran, artinya DeepMind sudah memiliki aura tersendiri sebelum masuk ke sistem Google. Apakah ini bisa ditafsirkan bahwa DeepMind memiliki daya ungkit yang sangat tinggi dalam sistem Alphabet? Apakah ini salah satu faktor kesuksesan DeepMind?
Mallaby: Ya, saya pikir, fakta bahwa ada perusahaan lain yang juga berminat mengakuisisi mereka, sebenarnya meningkatkan daya tawar mereka ketika akhirnya menjual ke Alphabet.
Namun, saya juga berpikir bahwa poin yang lebih kunci terletak pada kepemimpinan Alphabet — terutama Larry Page, dan kemudian Sundar Pichai yang menggantikan — setelah berinteraksi dengan Demis, mereka cepat menyadari bahwa dia adalah orang yang sangat spesial. Mereka sangat ingin mempertahankannya, dan bersedia melakukan hal-hal sesuai pemikirannya, karena mereka menganggapnya sangat berharga.
Saat mengakuisisi DeepMind, pelopor deep learning dari Kanada Geoffrey Hinton pernah bercanda: "Bahkan jika hanya membeli Demis sendiri, itu sudah bernilai 100 hingga 150 juta poundsterling." Ini sebenarnya mencerminkan penilaian tinggi mereka terhadap Demis — dia bukan hanya seorang entrepreneur, tetapi juga orang dengan wawasan tingkat jenius.
Karena itulah, Google setelah akuisisi memberikan perhatian dan dukungan sumber daya yang sangat tinggi kepada DeepMind, termasuk banyak dana penelitian. Ini juga salah satu alasan penting mengapa DeepMind kemudian terus meraih kesuksesan — pada dasarnya, karena pengakuan dan kepercayaan Google terhadap Demis, dan kesediaan untuk mendukung arah penelitiannya dalam jangka panjang.
InfoQ: Meskipun memiliki daya ungkit tinggi, tetapi Google pada akhirnya adalah perusahaan komersial, bagaimana DeepMind menyeimbangkan antara penelitian jangka panjang dan hasil jangka pendek?
Mallaby: Untuk waktu yang cukup lama, fokus DeepMind一直是是 penelitian jangka panjang, bukan productization. Pada dasarnya tidak meluncurkan produk komersial yang sebenarnya, meskipun pernah mencoba beberapa aplikasi medis, itu lebih karena dorongan co-founder Mustafa Suleyman, bukan permintaan inti Google.
Google pada waktu itu mengizinkan, bahkan mendukung DeepMind untuk fokus pada penelitian dasar. Mereka menginvestasikan hampir $1 miliar per tahun untuk mendukung proyek-proyek penelitian ini — ini adalah investasi yang sangat besar, tetapi bagi Google yang memiliki kas berlimpah, ini dapat ditanggung.
Situasi ini berubah secara fundamental pada tahun 2022. Dengan peluncuran ChatGPT, Google tiba-tiba menyadari bahwa mesin pencari tradisional mungkin akan terganggu oleh cara pencarian berbasis model bahasa besar. Ancaman ini membuat Google gugup, sehingga mereka cepat beralih, berharap bersaing dengan OpenAI, dan mulai meminta DeepMind beralih dari fokus penelitian ilmiah ke arah yang lebih ke produk, terutama mengembangkan model bahasa besar.
Awalnya saya juga berpikir, apakah Demis akan merasa tidak nyaman dengan ini, karena pada dasarnya adalah seorang ilmuwan.
Tapi kemudian ketika berkomunikasi dengannya, pandangannya sangat menarik. Dia berkata: "Anda harus ingat, sebelum mendirikan DeepMind, saya mengoperasikan perusahaan startup saya sendiri, Elixir Studios, yang merupakan perusahaan game, kami membuat produk. Saya tidak menol terhadap pembuatan produk, dan saya sendiri juga orang yang sangat kompetitif, saya juga ingin menang dalam persaingan ini."
Dia juga menyebutkan, pada tahap ini, perkembangan AI telah memasuki keadaan baru: membangun model bahasa besar, di satu sisi adalah membangun produk, di sisi lain itu sendiri juga memajukan batas ilmiah.
Bahkan, sejak kemunculan ChatGPT, kita telah melihat banyak kemajuan teknologi baru terus bermunculan, seperti:
- Model dengan jendela konteks lebih panjang (dapat mengingat lebih banyak informasi)
- Model multimodal yang dapat memproses gambar, video, dan suara
- Model dengan kemampuan penalaran kompleks
- Dan model agen (Agent) yang dapat menjalankan tugas
Eksplorasi batas depan ini sendiri terjadi dalam "bentuk produk". Oleh karena itu, pada tahap saat ini, penelitian ilmiah dan pengembangan produk bukanlah hubungan pilihan, tetapi dua jalur yang dapat didorong bersamaan.
Menghasilkan Miliaran Dolar, Tidak Sebanding dengan Memenangkan Hadiah Nobel
InfoQ: Dalam beberapa tahun pertama setelah akuisisi, apa konflik budaya terbesar antara DeepMind dan Google? Sejauh mana Google mengizinkan DeepMind menjaga independensi penelitian?
Mallaby: Perbedaan budaya ini terutama berpusat pada masalah "keamanan". DeepMind ingin membangun mekanisme tata kelola yang lebih independen dan khusus, untuk memastikan AI tidak hanya digunakan untuk melayani kepentingan komersial satu perusahaan. Mereka membayangkan mendirikan lembaga seperti "komite peninjau etika dan keamanan", yang anggotanya mungkin termasuk tokoh seperti mantan Presiden AS Obama, dan lembaga ini yang akan memutuskan bagaimana AI harus digunakan.
Untuk ide ini, Google terkadang tampaknya mendukung secara permukaan, tetapi sebenarnya tidak benar-benar berniat mewujudkannya. Oleh karena itu, kedua belah pihak, bersama pengacara, penasihat investasi, dll., terlibat dalam permainan bolak-balik selama tiga tahun.
Selama waktu ini, Demis bahkan pernah mencoba mencari jalan keluar lain, seperti menghubungi pendiri Alibaba Jack Ma, berharap mendapatkan dukungan dana untuk mengoperasikan DeepMind secara independen lagi. Ini bisa dibilang konflik "budaya" inti antara mereka.
Namun, pada tingkat penelitian, perbedaan mereka sebenarnya tidak mencolok. Google selalu sangat mendukung DeepMind melakukan penelitian terdepan, seperti proyek AlphaGo.
Bahkan, selama AlphaGo bertanding di Korea, co-founder Google Sergey Brin, serta CEO saat itu Eric Schmidt dan petinggi lainnya secara pribadi pergi ke lokasi untuk menonton pertandingan, mereka sangat terlibat dalam proyek ini, dan sangat menikmati momen bersejarah ini.
InfoQ: Anda menyebutkan bahwa antara Google dan DeepMind pernah terjadi konflik budaya yang sengit, dan dalam buku Anda Anda juga menyebutkan bahwa Demis hampir pergi meninggalkan Google bersama timnya. Tetapi mengapa akhirnya memutuskan untuk tinggal, apakah Google melakukan kompromi tertentu?
Mallaby: Sebenarnya, pada akhirnya, yang paling ingin dilakukan Demis pada waktu itu adalah penelitian. Karena jika benar-benar harus mendirikan perusahaan baru untuk mandiri, dia tidak hanya harus berkeliling mencari investasi, tetapi juga mempekerjakan sekelompok pengacara untuk "berkonfrontasi" dengan departemen hukum Google, yang pasti akan membuat pihak Google marah besar. Baginya, daripada terjerat dalam sengketa bisnis yang tak ada habisnya, dia jelas lebih suka mencurahkan semua energinya untuk menaklukkan masalah ilmiah AI.
Jadi saya pikir, inilah alasan dia akhirnya memilih untuk tinggal.
Ada poin yang sangat menarik: markas besar Demis berada di London, bukan Silicon Valley. Di Silicon Valley, kegilaan kewirausahaan "Anda harus memiliki perusahaan sendiri" hampir seperti keyakinan; tetapi di London, atmosfer ini tidak begitu agresif. Demis jelas lebih memilih untuk berpegang pada niat awal saat pertama kali menjual perusahaan ke Google.
Di depannya, sebenarnya ada dua jalan yang sangat berbeda: satu adalah dengan berjuang secara independen untuk membangun kerajaan bisnis yang besar, menjadi orang super kaya dengan kekayaan puluhan miliar; yang lainnya adalah mendalami bidang sains, menciptakan AI yang sesungguhnya, dan akhirnya memenangkan Hadiah Nobel.
Jelas, dibandingkan dengan puluhan miliar dolar itu, dia lebih mendambakan medali Nobel.
InfoQ: Bisakah kita mendiskusikan sebuah hipotesis, jika DeepMind tidak diakuisisi Google, seperti apa jadinya hari ini?
Mallaby: Di Inggris tempat saya tinggal, sering terdengar suara: "Sayang sekali, seandainya DeepMind tidak dijual ke Google, kita sekarang akan memiliki raksasa AI Inggris yang independen."
Tapi saya sama sekali tidak setuju dengan pandangan ini.
Saya pikir DeepMind pada waktu itu benar-benar kekurangan uang. Anda完全可以 melihat akuisisi ini dari sudut pandang yang berbeda: ini sama sekali bukan "kerugian bagi industri AI Inggris", sebaliknya, ini adalah kemenangan besar bagi Inggris. Seorang entrepreneur Inggris yang jenius seperti Demis, dengan kemampuannya meyakinkan raksasa Amerika, dengan rela hati menginvestasikan hampir $1 miliar per tahun ke lab AI di London.
Bayangkan, orang Amerika membawa uang tunai dalam jumlah besar untuk berinvestasi di Inggris, bukankah ini hal yang sangat baik?
Jika Demis tidak menjual perusahaannya ke Google pada waktu itu, dengan bakat dan semangat pantang menyerahnya, dia pasti juga akan sukses. Kemungkinan besar dia akan tetap independen, atau beralih untuk mengambil investasi dari orang-orang besar seperti Elon Musk. Tetapi jalan itu pasti akan jauh lebih sulit, karena uang yang dimiliki akan menyusut, dan juga harus menghadapi berbagai "gesekan internal" setiap hari — lagipula Musk adalah orang yang sangat suka bertarung.
Tanpa dukungan keuangan Google, keajaiban seperti AlphaGo mungkin akan tertunda lama baru muncul. Namun bagaimanapun juga, Demis akhirnya akan menjadi pemimpin di bidang AI. Itu adalah misinya, juga bakatnya — selama dia ingin melakukan sesuatu, mungkin tidak ada yang bisa menghentikannya di dunia ini.
Di Balik AlphaGo dan AlphaFold, Adalah Kemampuan Memilih Masalah
InfoQ: AlphaGo bisa dibilang membuat DeepMind langsung terkenal. Di dalam Google, seiring dengan kesuksesan AlphaGo, apakah petinggi Google mengevaluasi ulang nilai AGI? Menurut Anda, apakah kemenangan ini mengubah daya ungkit DeepMind di dalam grup? Terwujud dalam aspek apa?
Mallaby: Bagi setiap orang di Google, kemenangan DeepMind dalam AlphaGo seperti alarm yang mengejutkan.
Melalui pertandingan itu, semua orang benar-benar melihat kekuatan mengerikan yang dikandung AI. Sebelumnya, Sergey Brin pernah berpendapat: "Membuat sistem yang bisa bermain Go pasti sulit sekali." Hasilnya, Demis membuktikan dengan fakta bahwa dia salah. Petinggi Google不得不承认, kecepatan evolusi AI telah jauh melampaui ekspektasi mereka.
Sejak saat itu, anggaran研发 mulai melonjak drastis. Anggaran DeepMind原本 sudah很高, setelah AlphaGo bahkan bertambah lagi.
Bisa dibilang, kemenangan ini menjadi筹码 paling kuat bagi Demis, memungkinkannya meyakinkan Google untuk terus menerus mengucurkan uang. Dan setahun kemudian (2017) kemunculan AlphaZero semakin memperkuat posisinya, membuktikan bahwa investasi ini sepenuhnya worth it.
InfoQ: Baik AlphaGo maupun AlphaFold,都非常受到业内关注. Menurut Anda, apa kesamaan metodologi antara AlphaGo dan AlphaFold?
Mallaby: Mereka sebenarnya都是 contoh "mesin tak terbatas".
Ambil contoh Go, pemain pertama awalnya dapat memilih titik mana pun dari 361 persimpangan untuk menempatkan bidak, kemudian giliran pemain kedua memiliki 360 pilihan. Selanjutnya secara berurutan 359, 358...... Jika kemungkinan ini dikalikan,很快就会得到一个极其庞大的数字 — setiap langkah, setiap respons,以及 respons terhadap respons, akan membentuk ruang kemungkinan yang berkembang secara eksponensial.
Jadi, ini adalah ruang pencarian yang sangat besar, kumpulan kemungkinan yang hampir tak terbatas. Saya menyebutnya "mesin tak terbatas". Artinya, sistem seperti AlphaGo pada dasarnya adalah mesin yang dapat mengekstrak "makna" dari langkah-langkah yang hampir tak terbatas.
Jika Anda melihat struktur protein — gambar sebuah protein, Anda akan melihat bagaimana ia terlipat. Di dalamnya ada banyak lekukan kecil, dan setiap lekukan dapat berubah ke arah yang berbeda. Oleh karena itu, kombinasi struktur yang mungkin dibentuk oleh protein bahkan lebih besar daripada Go, dalam arti tertentu, sudah sangat mendekati "tak terbatas".
Tetapi DeepMind仍然 menemukan一种 mesin, yang dapat memprediksi struktur protein yang benar dari semua kombinasi yang mungkin — jumlah atom yang terlibat dalam kombinasi ini bahkan melebihi jumlah atom di alam semesta. Jadi, dari sudut pandang ini, itu juga adalah "mesin tak terbatas". Saya pikir inilah hubungan inti antara keduanya: bagaimana mengekstrak hasil yang bermakna dari data dan kemungkinan yang begitu besar.
AlphaFold memang merupakan pencapaian yang sangat penting dan bersejarah, secara global. Lalu, mengapa DeepMind memilih untuk membuka sumbernya (open source)?
Di satu sisi, adalah出于 pertimbangan membantu dunia, mendorong kemajuan sains; di sisi lain, juga karena DeepMind认为, alasan mereka dapat membuat AlphaFold sebagian besar berkat akumulasi jangka panjang dari komunitas ilmiah.
Misalnya kompetisi CASP — ini dimulai oleh akademisi, diadakan setiap dua tahun sekali, membuat tim penelitian berbeda berlomba memprediksi struktur protein. Sebelum DeepMind menang pada tahun 2020, kompetisi ini telah berlangsung sekitar 18 tahun.
Artinya, sebelum DeepMind menyelesaikan masalah ini, seluruh bidang telah memiliki banyak pekerjaan penelitian dasar. Oleh karena itu, DeepMind juga berharap dengan cara memberi kembali ke dunia akademik, untuk mengungkapkan terima kasih — mereka membuka sistem AlphaFold, sehingga seluruh bidang dapat menggunakan hasil prediksi ini.
Jika mereka hanya memanfaatkan hasil penelitian terbuka semua orang, tetapi tidak mempublikasikan penelitian mereka sendiri, itu akan tampak tidak pantas secara moral. Jadi, ini juga salah satu alasan penting mereka memilih open source.
Tentu, ada juga faktor realitas: dalam aplikasi komersial, seperti pengembangan obat, hanya AlphaFold 2 (versi yang kemudian memenangkan Hadiah Nobel) sebenarnya还不够.
Anda tidak hanya perlu mengetahui struktur protein, tetapi juga memahami bagaimana protein berinteraksi satu sama lain, protein dengan molekul lain. Inilah yang coba dipecahkan oleh AlphaFold 3 dan 4.
Dan AlphaFold 4 tidak open source, ini adalah sistem proprietary. Ini juga berarti itu sedang berangsur-angsur memasuki tahap productization, sehingga DeepMind dan Google memilih untuk menyimpannya di internal.
InfoQ: Baik AlphaGo maupun AlphaFold都是 pencapaian yang sangat hebat, lalu bagaimana DeepMind memilih "topik yang layak diinvestasikan selama sepuluh tahun"? Apa saja dasar penilaian yang dapat direplikasi?
Mallaby: Demis sering menyebut sebuah konsep,叫作 "selera ilmiah" (Scientific Taste).
Dia memiliki intuisi yang tajam: dapat "mencium" masalah yang belum terpecahkan di bidang AI mana yang虽然 sangat menantang, tetapi只要 berjuang mati-matian selama dua tahun pasti dapat menembus jendela kaca itu. Dia sangat ahli dalam melakukan taruhan strategis semacam ini. Kemampuan ini tidak hanya berasal dari pemahaman mendalamnya tentang batas depan sains, tetapi juga karena dia melihat melalui logika operasi kelompok ilmuwan.
Dia pernah menceritakan sebuah kisah menarik tentang AlphaFold kepada saya.
Pada tahun 2018, tim telah mengembangkan selama dua tahun, sistem yang dibuat虽然 merupakan yang terkuat di dunia, tetapi masih jauh dari mencapai tujuan akhir dapat memprediksi "semua bentuk protein". Itu hanya lebih kuat dari AI lain, tetapi masih jauh dari memecahkan masalah. Pada waktu itu, kepala tim Andrew Senior bahkan agak putus asa berkata kepada Demis: "Kami tidak bisa memecahkan masalah ini, terlalu sulit. Kami sudah mencoba yang terbaik, sistem versi 2018 berkinerja baik, sudah memimpin seluruh umat manusia, tapi tolong jangan paksa kami untuk memprediksi semua protein di alam, itu根本不可能."
Tetapi Demis secara intuitif认为, memprediksi semua protein adalah mungkin. Untuk memverifikasi penilaiannya, dia secara pribadi menghadiri setiap lokakarya teknis tim AlphaFold.
Dia tidak banyak bicara dalam rapat, tetapi mengamati dengan tenang apakah diskusi tim "lancar" (fluent).
Yang dimaksud "lancar" adalah apakah semua orang terus menerus dan cepat memunculkan inspirasi penelitian baru. Demis认为, selama inspirasi masih mengalir — meskipun beberapa ide sekarang看起来不一定 benar — selama semua orang masih memiliki "kemampuan menghasilkan ide baru", itu berarti ruang untuk kemajuan ilmiah jauh dari habis.
Berdasarkan pengamatan ini, Demis memutuskan untuk menahan tekanan, menolak menutup proyek. Dia tidak hanya tidak mendengarkan saran mundur dari kepala lama, malah mengganti komandan, mempromosikan John Jumper yang muda.
Jumper yakin sukses ada di depan, Demis memberinya dukungan tanpa syarat. Dua tahun kemudian, mereka menghasilkan hasil penelitian ilmiah yang足以 memenangkan Hadiah Nobel.
Kisah ini memberi tahu kita: sebagai pemimpin, Anda tidak hanya membutuhkan selera ilmiah yang menilai "apa yang bisa berhasil", tetapi juga harus belajar duduk di ruang rapat, menangkap percikan api benturan pemikiran, mendengarkan suara aliran inspirasi.
InfoQ: AlphaGo, AlphaFold都只是 percobaan tahap pada jalur AGI. Apakah Anda setuju dengan pernyataan ini?
Mallaby: Ya, bisa dibilang begitu. Saya pikir mereka memang mendorong perkembangan ilmu kecerdasan buatan. Dan di ujung jalur panjang ini, akan ada kecerdasan buatan umum (AGI).
Namun dari sudut pandang lain, Anda juga dapat认为, kesuksesan model bahasa besar berasal dari jalur teknologi lain dalam penelitian AI, jalur ini tidak termasuk pembelajaran penguatan,因此 tidak sama dengan jalur AlphaGo.
Dan, itu juga有一定的 pemisahan dengan AlphaFold. AlphaFold memang menggunakan model Transformer, tetapi itu adalah bentuk khusus dari Transformer. Penelitian terkait AlphaFold dan Transformer, terkonsentrasi大致 antara 2018 hingga 2020, lebih tepatnya pada 2019 hingga 2020.
Sementara itu, OpenAI sudah membangun model bahasa besar berdasarkan arsitektur Transformer. Oleh karena itu, saya lebih cenderung melihat ini sebagai jalur teknologi independen lain dalam kemajuan AI.
Jadi, secara makro, terobosan penting apa pun di bidang AI akan mendorong perkembangan di masa depan; tetapi dari asal-usul teknologi yang lebih spesifik, kelahiran model bahasa besar sebenarnya relatif independen.
Lanskap Nyata Persaingan AGI
InfoQ: Berdasarkan pemahaman Anda tentang industri AI, apa perbedaan inti antara DeepMind, OpenAI, dan Anthropic?
Mallaby: Pertama, perbedaan besar terletak pada hubungannya dengan Google. Seperti yang saya katakan sebelumnya, DeepMind memiliki dukungan dana besar dari Google, ini adalah keunggulan yang sangat besar. Karena bahkan hari ini, biaya melatih model-model ini masih sangat tinggi, dan pendapatan yang mereka hasilkan sebenarnya tidak banyak.
Jadi pada tahap ini, Anda harus memiliki dukungan dana yang memadai, dan Demis sangat beruntung, memiliki Google di belakangnya. Sebaliknya, Anthropic dan OpenAI需要 terus mencari investor untuk pendanaan, ini sendiri sudah sulit — ini adalah perbedaan yang sangat kunci.
Namun di aspek lain, mereka sebenarnya sangat mirip. Misalnya, mereka semua memiliki model bahasa besar sendiri, dan model-model ini secara keseluruhan levelnya都很高. Pada titik waktu yang berbeda, mungkin satu akan memimpin dua lainnya, tetapi kepemimpinan ini dinamis berubah.
Jika melihat perbedaan mereka dari sudut pandang lain, dapat dimulai dari "keamanan". Anthropic sangat重视 keamanan, bahkan belum lama ini karena masalah aplikasi AI dalam sistem militer, pernah berselisih dengan Pentagon.
Sedangkan performa DeepMind dalam hal ini agak berbeda. Saya pikir Demis sendiri juga重视 keamanan, termasuk dalam aplikasi militer, tetapi dia tidak berkonfrontasi langsung dengan pemerintah. Jadi Anda bisa mengatakan, Anthropic adalah perusahaan yang paling bersedia mengambil risiko untuk mendorong isu keamanan; DeepMind (dan Google) berada di tengah.
Adapun OpenAI, sangat menarik. Dari penampilan eksternal, tampaknya tidak begitu menekankan keamanan — misalnya ketika Anthropic berselisih dengan Pentagon, sikap OpenAI lebih seperti: "Tidak masalah, kami dapat menyediakan AI."
Ini sampai batas tertentu juga mirip dengan strategi mereka saat meluncurkan ChatGPT: mereka tidak keberatan meluncurkan produk yang mungkin berisiko, tetapi memilih untuk merilis terlebih dahulu kemudian beriterasi. Sebaliknya, Anthropic dan DeepMind都 pernah因为 lebih hati-hati, dan tidak merilis beberapa model.
Jadi jika membuat peringkat kasar:
- Paling agresif (paling tidak konservatif): OpenAI
- Tengah: Google DeepMind
- Paling menekankan keamanan: Anthropic
Anda menyebutkan OpenAI最近 merekrut pendiri proyek open source OpenClaw Peter Steinberger, juga bertanya apakah ini akan menjadi ancaman bagi Google atau DeepMind, terutama dalam kondisi OpenClaw sekarang很火.
Saya pikir, di dalam Google DeepMind本身, sudah ada大量 peneliti agen yang优秀. Bahkan jika merekrut seseorang yang membuat OpenClaw,也不太可能 mengubah整个 lanskap persaingan.
Poin kunci lain: OpenClaw memang mengesankan, tetapi juga具有一定的 risiko. Tantangan sebenarnya adalah, bagaimana membuat sistem yang既 kuat又 aman — hanya dengan begitu, itu benar-benar memiliki nilai aplikasi skala besar. Dan apakah Peter dapat melakukan ini, sebenarnya masih belum dapat dipastikan.
InfoQ: Google, OpenAI, xAI, Anthropic serta perusahaan China DeepSeek, Alibaba, Tencent dll., Menurut Anda siapa yang paling mendekati AGI?
Mallaby: Definisi AGI (Kecerdasan Buatan Umum) selalu tidak tepat, orang sebenarnya tidak memiliki standar yang seragam dan jelas.
Dari sudut pandang tertentu, Anda完全可以 memahami seperti ini: model bahasa besar yang优秀 ini本身, memiliki "sifat umum" (general), "sifat buatan" (artificial) serta一定程度 "kecerdasan" (intelligent). Oleh karena itu,也有人会认为 — AGI dalam arti tertentu sebenarnya sudah muncul.
Tetapi ini pada dasarnya tergantung pada bagaimana Anda mendefinisikan AGI.
Cara pemahaman yang lebih pragmatis adalah: AGI seharusnya adalah mesin yang sangat berguna di dunia nyata, terutama dalam lingkungan bisnis, dapat melakukan pekerjaan yang原本 dilakukan manusia. Dengan kata lain, itu bukan hanya "pintar", tetapi "bisa bekerja".
Pada dimensi ini, Anda dapat melihat beberapa kemajuan yang非常具体. Misalnya, sistem seperti Claude Code, sudah dapat menulis kode dengan sangat efisien, sehingga struktur kebutuhan perusahaan terhadap programmer mungkin berubah — dulu mungkin butuh 20 insinyur, di masa depan mungkin hanya butuh 10, karena setengah kode diselesaikan oleh model.
Tentu, ini bukan kemampuan yang dimiliki secara eksklusif oleh satu perusahaan. Perusahaan lain juga melakukan hal serupa: misalnya OpenAI Codex, serta model pembuatan kode Google DeepMind sendiri, beberapa model China juga tidak kalah dalam pembuatan kode.
Jadi masalahnya menjadi: siapa yang terbaik sekarang? Mungkin saat ini bisa dibilang Claude, tetapi enam bulan kemudian,很可能 lanskap就会变化.
Dengan kata lain, dalam pertanyaan "apakah mendekati AGI", kita telah memasuki tahap baru: kuncinya tidak lagi hanya "ada atau tidak", tetapi "siapa yang lebih实用 pada tugas apa, penggantian更强", serta apakah kemampuan ini dapat ditingkatkan secara berkelanjutan dan stabil.
InfoQ: Lalu menurut Anda, terobosan AGI lebih mungkin berasal dari skala model, atau algoritma baru?
Mallaby: Kemajuan yang kita capai sejauh ini, sebenarnya adalah hasil dari berbagai aspek bekerja bersama.
Penting untuk dipahami: apakah kemajuan dari Google, OpenAI, atau Anthropic, meskipun mereka memang terus memperluas skala daya komputasi (scaling compute), tetapi ini bukan segalanya. Pada saat yang sama, mereka juga terus menyempurnakan algoritma, mengoptimalkan implementasi teknik, dan melakukan berbagai inovasi teknologi, ini semua bersama-sama mendorong perkembangan seluruh ilmu AI.
Jadi, pada dasarnya ini adalah proses驱动 kombinasi "skala + teknologi". Dan saya juga认为, masa depan大概率仍然会 melanjutkan jalur kombinasi ini.
Tentu, sekarang banyak orang mendiskusikan一个问题: apakah penskalaan daya komputasi akan遇到瓶颈? Pandangan saya adalah,每当 orang认为 "skala hampir到 batas",总是会出现 cara penskalaan baru.
Misalnya, model dasar awal mendapatkan peningkatan巨大 dengan memperluas skala pelatihan, tetapi kemudian keuntungan marginal ini可能开始下降.于是,又出现了 jalur penskalaan baru — misalnya memperluas "model inferensi" pada tahap inferensi, ini又带来了 ruang peningkatan kinerja baru.
Melihat ke masa depan, mungkin还会出现 dimensi penskalaan baru, seperti penskalaan agen atau kecerdasan embodied.
Oleh karena itu, penilaian saya adalah: penskalaan本身 tidak akan hilang, itu hanya terus muncul dalam bentuk yang berbeda, dan仍然会 menjadi keunggulan kompetitif inti yang ada dalam jangka panjang.
Artikel ini来自微信公众号 "AI前线" (ID:ai-front), penulis: Dong Mei, editor: Cai Fangfang






