Model Raksasa Menyapu Bersih Semua Ujian, Tapi Justru Jauh dari AGI: Apa yang Dibongkar Makalah Ini?

marsbitDipublikasikan tanggal 2026-05-28Terakhir diperbarui pada 2026-05-28

Abstrak

Teks ini membahas perdebatan definisi AGI (Kecerdasan Buatan Umum) yang belum memiliki standar pengukuran yang diterima secara universal. Berbagai pihak, seperti OpenAI, Microsoft, dan para CEO, memiliki tolok ukur dan ramalan waktu yang berbeda-beda. Sebuah makalah oleh Michael Timothy Bennett dari Australian National University menawarkan definisi baru AGI sebagai "ilmuwan buatan"—yaitu, sistem yang mampu beradaptasi secara luas, efisien, dan ilmiah di bawah kendala sumber daya terbatas (komputasi, memori, energi) seperti layaknya ilmuwan manusia. Penulis mengkritik standar lama seperti Tes Turing dan uji benchmark manusia karena telah "dikuasai" oleh model bahasa besar (LLM) tanpa mendekatkan kita pada kecerdasan umum yang sesungguhnya. LLM saat ini dinilai hanya melakukan "aproksimasi maksimalisasi skala", menyimpan jawaban perkiraan untuk berbagai tugas dalam bobot jaringannya, namun gagal pada masalah di luar distribusi data pelatihan dan tidak memiliki kemampuan aktif seperti merancang eksperimen atau memahami hubungan sebab-akibat. Teks ini merinci tiga kemampuan kunci AGI sejati menurut kerangka "ilmuwan buatan": 1. Dari "boneka pasif" menjadi "peneliti aktif": Mampu merencanakan eksperimen secara mandiri untuk memperoleh informasi. 2. Dari "tahu apa" menjadi "tahu mengapa": Memiliki pemahaman kausal, bukan hanya korelasi. 3. Menyeimbangkan "eksplorasi" dan "eksploitasi": Mengalokasikan sumber daya komputasi secara dinamis di bawah kendala. Tiga pendekatan meto...

Jika ada yang mengatakan AGI (Kecerdasan Buatan Umum) sudah tercapai, bagaimana Anda membedakan apakah dia berkata jujur atau hanya membual?

Dalam perjanjian rahasia yang terungkap antara OpenAI dan Microsoft, tolok ukurnya adalah laporan keuangan—sebuah sistem AI yang mampu menghasilkan setidaknya 100 miliar dolar keuntungan bisa disebut AGI. Di mulut Jensen Huang, tolok ukurnya adalah waktu—pasti terwujud dalam lima tahun; sementara Elon Musk berkali-kali mengeluarkan prediksi "akan tercapai tahun depan".

Para pemimpin industri bicara sendiri-sendiri bukan karena ada yang berbohong, tapi karena konsep AGI itu sendiri tidak memiliki satu pun tolok ukur yang diterima secara umum. Seperti yang dikatakan Bennett, seorang peneliti berpikiran independen dalam bidang studi AGI, AGI telah direduksi oleh gembar-gembor dan spekulasi menjadi "tes Rorschach"—setiap orang hanya melihat bayangan dalam pikiran mereka sendiri, bukan fakta objektif; dan ilmuwan dari Santa Fe Institute, Melanie Mitchell, juga berpendapat bahwa debat ini hanya bisa diselesaikan melalui penelitian ilmiah jangka panjang. (Tautan makalah: https://arxiv.org/pdf/2503.23923)

Ini adalah dilema paling absurd yang dihadapi industri AI saat ini: Kami berlarI secepatnya mengejar sebuah tujuan yang bahkan garis finisnya pun belum jelas.

2025, Siapa yang Menggambar Ulang Garis Start AGI?

Menghadapi kekosongan definisi ini, dunia akademis mulai padat "mengisi pos" pada 2025. Bengio dan sarjana lainnya menekankan "kemampuan multifungsi" dan "keterampilan"; DeepMind mengusulkan "AGI Terdistribusi", berusaha mematahkan mitos kesempurnaan tunggal.

Tapi peneliti dari Australian National University, Michael Timothy Bennett, dalam sebuah makalah yang diajukan ke arXiv akhir Maret, memberikan jawaban yang sangat provokatif namun juga paling tepat sasaran.

Dia menunjukkan bahwa definisi sebelumnya berputar-putar, tetap berkutat pada perbandingan dengan "dewasa berpendidikan". Bennett mengadopsi definisi kecerdasan oleh sarjana Pei Wang—melihat kecerdasan sebagai kemampuan adaptasi di bawah sumber daya terbatas—yang pada dasarnya melompat keluar dari kerangka "menyerupai manusia", dan mendefinisikan AGI sebagai sebuah "ilmuwan buatan".

Dia mengusulkan bahwa AGI yang sejati seharusnya merupakan sistem yang, di bawah batasan realistik seperti komputasi, memori, dan energi, dapat beradaptasi secara luas, efisien, dan ilmiah terhadap lingkungan dan tugas baru, seperti ilmuwan manusia.

Makna tersirat dari pernyataan ini adalah: Standar menilai AGI seharusnya bukan seberapa mirip ia meniru manusia, tapi seberapa kuat kemampuannya "menemukan pengetahuan baru".

Mengapa diperlukan tolok ukur baru? Karena tolok ukur lama—Tes Turing dan uji patokan manusia—sudah dihancurkan oleh model raksasa, tapi justru kita semakin jauh dari kecerdasan umum yang sebenarnya.

Di tahun 2025, jika Anda bertanya pada model raksasa terkemuka "mana yang lebih besar, 9.11 atau 9.9", ia masih mungkin dengan yakin menjawab 9.11 lebih besar, karena 11 lebih besar dari 9. Saat menyelesaikan pembuktian ketidaksetaraan matematika yang kompleks, bahkan jika model raksasa menebak jawaban yang benar, proses penalarannya sering kali runtuh secara logika.

Bennett secara tepat menyebutkan penyebabnya: Model raksasa saat ini berjalan di jalur "aproksimasi maksimalisasi skala"—menggunakan data dan daya komputasi yang masif untuk menyimpan jawaban perkiraan dari berbagai tugas di dalam bobot jaringan terlebih dahulu. Begitu menghadapi masalah di luar distribusi yang belum pernah dilihat, kebocoran langsung terlihat.

Yang lebih fatal, model raksasa tidak memiliki "kemampuan aktif". Ia tidak dapat secara aktif melakukan eksperimen untuk memverifikasi hipotesis, tidak dapat membangun rantai kausal secara mandiri, apalagi menyeimbangkan antara "melanjutkan eksplorasi" dan "memanfaatkan yang diketahui".

Kembali ke perbandingan 9.11 dan 9.9—model raksasa bukan tidak bisa berhitung, tapi ia sama sekali tidak membangun model kausal tentang perbandingan angka. Ia hanya menebak fragmen teks yang paling mirip yang pernah dilihatnya menggunakan probabilitas.

Jurang antara "kemampuan meniru" dan "kemampuan beradaptasi" inilah yang menjadi inti yang ingin diukur oleh standar AGI baru ini.

Skala Baru Kecerdasan: Membongkar "Ilmuwan Buatan"

Standar yang diusulkan Bennett ini patut diperhatikan karena ia menurunkan dimensi AGI dari sebuah pertanyaan filosofis yang kabur menjadi masalah teknik yang dapat diukur.

Menurutnya, AGI yang sejati, pola perilakunya harus selaras sempurna dengan paradigma penelitian ilmuwan manusia:

Pertama, dari "boneka tali" menjadi "eksperimenter aktif".

AI hari ini adalah pembelajar pasif sepenuhnya, hanya bisa "melihat" data yang diberikan manusia. Tapi ilmuwan tidak. Jika seorang ilmuwan terkunci di ruangan asing, dia tidak akan berdiri diam menunggu informasi, tetapi akan mendorong pintu, menarik gagang, memeriksa jendela—inilah "eksperimen aktif". AGI yang sejati harus mampu merencanakan eksperimen secara mandiri, dan memperoleh informasi kunci melalui interaksi aktif.

Kedua, dari "tahu apa" ke "tahu mengapa".

Ini adalah kelemahan terbesar AI saat ini. Model raksasa adalah "pembelajar korelasi" ekstrem, ia tahu "hujan" sering disertai "basah tanah", tapi tidak tahu siapa yang menyebabkan siapa. Hanya dengan memahami kausalitas, barulah ia mengerti saat langit cerah tapi tanah basah, untuk menyimpulkan bahwa truk penyiram air yang lewat, bukan hujan akan turun. Tanpa pemahaman kausal, AI selamanya hanya bisa berputar di dalam distribusi data pelatihan, dan ini sama sekali tidak terkait dengan "umum".

Ketiga, Berjalan di Atas Tali Antara "Eksplorasi" dan "Eksploitasi".

Jika hanya bereksplorasi tanpa mengeksploitasi, seberapa banyak pengetahuan yang dikuasai tidak bisa menyelesaikan masalah di depan mata; jika hanya mengeksploitasi tanpa bereksplorasi, begitu lingkungan berubah langsung tidak berdaya. AGI harus menyeimbangkan kontradiksi ini secara dinamis di bawah sumber daya terbatas—mengetahui apa yang tidak diketahui, dan mengalokasikan daya komputasi berdasarkan itu.

Selain itu, Bennett menambahkan dimensi yang sangat realistis: batasan energi. Menulis "energi" ke dalam definisi berarti ia menarik garis batas yang jelas: Kecerdasan sejati bukan memiliki sumber daya tak terbatas, tapi beradaptasi dengan elegan di bawah sumber daya terbatas. AI yang perlu mengonsumsi satu pembangkit listrik tenaga nuklir untuk memecahkan masalah baru hanyalah kalkulator mahal, bukan AGI.

Reset Rute Menuju AGI: Berpisah dari Scaling Law Tunggal

Berdasarkan kerangka di atas, Bennett memecah meta-metode saat ini untuk membangun sistem cerdas menjadi tiga kategori:

Scale-maxing (Maksimalisasi Skala): Jalur utama model raksasa saat ini, menumpuk parameter, data, dan daya komputasi mati-matian. Tapi kemacetan sudah muncul: efisiensi sampel dan energi sangat rendah.

Simp-maxing (Maksimalisasi Kesederhanaan): Mengejar kesederhanaan struktur model yang ekstrem, menganut pisau cukur Occam. Tapi kesederhanaan adalah properti bentuk, bukan properti fungsi—"paling sederhana" di bawah mesin Turing yang berbeda mungkin sangat berbeda, membuatnya sulit lepas dari jebakan subjektivitas.

W-maxing (Maksimalisasi Pelemahan Batasan): Melemahkan batasan fungsi sebisa mungkin, membiarkan sistem mencari solusi optimal sendiri. Eksperimen menunjukkan, hanya dengan W-maxing saja dapat mencapai peningkatan tingkat generalisasi 110%-500% pada tugas tertentu, tapi ia memerlukan pencarian ruang bentuk perangkat keras yang tak terbatas, sehingga kesulitan optimisasi sangat tinggi.

Kesimpulan Bennett sangat jelas: Meskipun Scale-maxing saat ini mendominasi mutlak, AGI sama sekali tidak bisa dicapai hanya dengan keindahan kekerasan dari rute tunggal, ia pasti merupakan fusi dari berbagai meta-metode.

Jika definisi "ilmuwan buatan" diterima secara luas, industri AI akan menyambut pergeseran paradigma yang mendalam.

Standar penilaian akan benar-benar berubah. Kita tidak perlu lagi melihat model raksasa mengekor berapa banyak poin lagi dalam peringkat ujian manusia, tapi membangun serangkaian "patokan adaptasi": melemparkan AI ke lingkungan fisik yang belum pernah dilihat, melihat apakah ia dapat menemukan pola dalam interaksi terbatas; memberinya permainan baru, melihat apakah ia dapat memahami aturan lebih cepat dari manusia; bahkan memintanya memecahkan masalah ilmiah nyata, melihat apakah ia dapat mengajukan hipotesis secara mandiri dan merancang eksperimen untuk memverifikasi. Intinya bukan lagi "berapa banyak yang Anda tahu", tapi "berapa banyak yang dapat Anda temukan".

Rute teknologi juga akan berubah mengikuti. Scaling Law murni akan segera menyentuh puncak, karena data yang diterima secara pasif tidak dapat menghasilkan kausalitas. Pencarian dan aproksimasi, maksimalisasi skala dan pelemahan batasan—pencapaian AGI pasti merupakan fusi dari berbagai alat dan meta-metode, bukan perpanjangan dari rute tunggal.

Alasan pentingnya makalah Bennett, bukan karena dia memberikan jawaban akhir AGI, tapi karena dia membersihkan sepotong kecil cermin kabur yang bernama "kecerdasan". Dia membuat kita melihat bahwa realisasi AGI bukanlah iterasi linear model raksasa, tapi sebuah reset rute.

Seperti apa seharusnya AGI itu? Jawabannya tidak terletak pada percakapan yang semakin menyerupai manusia, tapi pada kemampuan yang secara aktif mempertanyakan "mengapa", dan secara mandiri memverifikasi jawabannya. Ketika AI benar-benar keluar dari kabut "tes Rorschach", ia tidak lagi hanya meniru rupa manusia, tapi memiliki semangat ilmuwan. (Artikel ini pertama kali diterbitkan di Titan Media APP, penulis | Silicon Valley tech news, editor | Zhao Hongyu)

Pertanyaan Terkait

QMenurut artikel, apa masalah utama dalam mendefinisikan AGI?

AMenurut artikel, masalah utama adalah tidak adanya standar atau definisi yang disepakati secara universal untuk AGI. Konsep ini seperti 'tes Rorschach', di mana setiap orang memproyeksikan pemahaman dan harapan mereka sendiri, bukan fakta objektif.

QApa definisi AGI yang diusulkan oleh Bennett dalam penelitiannya?

ABennett mendefinisikan AGI sebagai 'ilmuwan buatan', yaitu sistem yang mampu beradaptasi secara luas, efisien, dan ilmiah terhadap lingkungan dan tugas baru di bawah kendala sumber daya seperti komputasi, memori, dan energi, seperti halnya ilmuwan manusia.

QMengapa tes standar lama seperti ujian manusia tidak lagi efektif untuk mengukur kemajuan AGI?

ATes standar lama seperti ujian manusia sudah dapat dipecahkan dengan baik oleh model AI besar, tetapi kinerja tinggi ini sering kali hanya mencerminkan kemampuannya dalam mengingat dan meniru pola dari data pelatihan, bukan kemampuan adaptasi, pemahaman sebab-akibat, atau penemuan pengetahuan baru di luar data yang ada.

QApa saja karakteristik utama yang harus dimiliki oleh AGI sejati menurut kerangka 'ilmuwan buatan'?

AKarakteristik utamanya meliputi: 1. Kemampuan sebagai 'eksperimen aktif' yang dapat merencanakan dan melakukan interaksi aktif, 2. Pemahaman sebab-akibat ('mengetahui mengapa'), bukan hanya korelasi, 3. Kemampuan menyeimbangkan eksplorasi (mencari pengetahuan baru) dan eksploitasi (menggunakan pengetahuan yang ada), serta 4. Beroperasi secara efisien di bawah kendala sumber daya seperti energi.

QApa saja tiga meta-metode untuk membangun sistem kecerdasan yang dianalisis Bennett, dan apa metode yang dominan saat ini?

ATiga meta-metode tersebut adalah: 1. Scale-maxing (maksimalisasi skala): menumpuk parameter, data, dan daya komputasi (metode dominan saat ini), 2. Simp-maxing (maksimalisasi kesederhanaan): mengejar struktur model yang sangat sederhana, dan 3. W-maxing (maksimalisasi pelemahan kendala): melemahkan batasan fungsional agar sistem menemukan solusi optimal sendiri. Bennett berpendapat bahwa AGI akan membutuhkan kombinasi dari berbagai metode ini, bukan hanya satu jalur.

Bacaan Terkait

Bitcoin: Mengapa Mempertahankan $59.000 Bisa Menjadi Ujian Terbesar BTC Sejauh Ini

Bitcoin (BTC) telah bangkit dari tekanan bearish yang berlangsung berbulan-bulan, kini diperdagangkan di sekitar $64.000 setelah sempat menyentuh titik terendah sekitar $57.800 pada 1 Juli. Level $59.000 menjadi area penting karena separuh lebih trader memiliki basis biaya di sana, sehingga banyak yang mempertahankan zona tersebut agar tidak rugi. Namun, analis memperingatkan bahwa level ini belum tentu menjadi dasar terakhir, karena perilaku pemegang jangka pendek masih beragam antara kapitalisasi dan akumulasi. Di sisi lain, pemegang jangka panjang (LTH) menunjukkan pola holding yang kuat, dengan metrik Binary CDD turun ke 0 yang mengindikasikan tidak ada penjualan. Rasio SOPR saat ini berada di 0,89—level yang sebelumnya pada 2020 dan 2023 diikuti rally. Untuk melanjutkan kenaikan, Bitcoin perlu menembus resistance $64.336, dan rasio SOPR harus naik di atas 1. Permintaan dari investor AS melalui ETF spot Bitcoin juga kunci. Aliran dana positif pada Juli ini, senilai $200,17 juta, menjadi sinyal optimis. Jika aliran ini berlanjut, bersama dengan kekuatan pemegang jangka panjang, Bitcoin berpotensi mempertahankan momentum pemulihannya.

ambcrypto50m yang lalu

Bitcoin: Mengapa Mempertahankan $59.000 Bisa Menjadi Ujian Terbesar BTC Sejauh Ini

ambcrypto50m yang lalu

Laporan Pembiayaan Mingguan | Crypto.com Raih Investasi USD 400 Juta, Jalur CeFi dan Stablecoin Terus Menarik Dana

**Laporan Mingguan Pendanaan: Crypto.com Raup Investasi $4 Miliar, Sektor CeFi dan Stablecoin Tetap Jadi Magnet Modal** Pasar pendanaan kripto menunjukkan konsentrasi modal ke transaksi besar. Data semester I-2026 mencatat aliran modal $133 miliar namun hanya 435 putaran pendanaan, turun 78% dari puncak 2022. Minggu lalu (13-19 Juli), pasar primer kripto mencatat **17** transaksi pendanaan dengan total **$812 juta**. Fokus utama adalah: * **Keuangan Terpusat (CeFi) & Stablecoin:** Crypto.com dapat $4 miliar (valuasi $200B). Alpaca ($135 juta) dan Flex ($70 juta) juga danai perluasan infrastruktur berbasis stablecoin. * **Infrastruktur & Perdagangan:** ADI Chain ($50 juta) dan Cyclops ($20 juta) fokus pada infrastruktur pembayaran stablecoin. * **AI & Robotika:** Sektor ini sangat panas dengan Fireworks ($15 miliar), Walden Robotics ($3 miliar), dan Closer Dynamics (~$2 miliar) raup dana besar untuk komersialisasi. * **Sektor Lain:** DeFi, pasar prediksi, dan Web3+AI juga ada aktivitas pendanaan, namun lebih kecil. Trend: Modal mengalir kuat ke CeFi, infrastruktur pembayaran/stablecoin, dan proyek AI & robotika skala besar, mencerminkan kepercayaan pada adopsi institusional dan teknologi inti.

marsbit1j yang lalu

Laporan Pembiayaan Mingguan | Crypto.com Raih Investasi USD 400 Juta, Jalur CeFi dan Stablecoin Terus Menarik Dana

marsbit1j yang lalu

Bear Market Paling Lembut? Pelaku Jual BTC Mundur, ARK dan Bitwise Sama-sama Optimis

Artikel ini membahas kondisi pasar Bitcoin (BTC) yang saat ini berfluktuasi di sekitar $75.000, dengan indeks ketakutan berada di level 35. Laporan dari berbagai analis dan lembaga memberikan pandangan beragam: ARK Invest mencatat penurunan BTC sekitar 14% di Q2 2026, dengan indikator teknis masih bearish. Namun, peningkatan persediaan dari pemegang jangka panjang dianggap sebagai sinyal potensial habisnya tekanan jual. Bitwise menyebut penurunan saat ini sebagai "bear market paling moderat" secara struktural, dengan para investor institusi melihatnya sebagai peluang akumulasi. Mereka mencatat bahwa dasar setiap siklus Bitcoin terus naik, mencerminkan matangnya aset ini. Data dari Polymarket menunjukkan probabilitas BTC jatuh di bawah $50.000 tahun ini adalah 33%. Analisis teknis dari Bit menunjukkan bahwa titik terendah gelombang C mungkin telah terbentuk, dengan area support kunci antara $59.000 dan $70.000. Namun, analis glassnode memperingatkan risiko pembentukan puncak jangka pendek jika BTC gagal menembus $66.000 secara efektif. Di sisi lain, trader Doctor Profit melaporkan telah menutup semua posisi short crypto-nya dan mulai membeli BTC spot lagi di level $64.000, menjadikannya alokasi jangka panjang pertama sejak September 2025. Ia berpendapat bahwa perilaku kawanan (herd behavior) di pasar, di mana banyak investor menunggu harga turun lebih dalam, justru bisa membuat dasar pasar terbentuk lebih awal dari perkiraan umum. Secara keseluruhan, nada dari banyak lembaga mulai berubah menjadi lebih optimis jangka panjang, meskipun ketidakpastian makro dan risiko penurunan lebih lanjut masih diakui.

Foresight News1j yang lalu

Bear Market Paling Lembut? Pelaku Jual BTC Mundur, ARK dan Bitwise Sama-sama Optimis

Foresight News1j yang lalu

Evolusi Tata Kelola di Era AI & Web3: Dimensi Kompetisi dan Jalur Eksplorasi m&W

Era AI & Web3 sedang mengalami evolusi dari "peningkatan produktivitas" ke "pembentukan ulang hubungan produksi." Dengan berkembangnya AI Agent, kolaborasi jangka panjang antara manusia dan AI memunculkan pertanyaan mendasar: bagaimana membangun hubungan kepercayaan, menilai kontribusi kompleks, dan menciptakan mekanisme distribusi nilai yang adil dan berkelanjutan? Web3 telah menyediakan fondasi teknis untuk ekonomi digital, namun di era AI Agent, diperlukan sistem tatanan baru yang mencakup identitas, kredit, kolaborasi, dan insentif ekonomi. m&WDAO mengusulkan eksplorasi EcoFi (Keuangan Ekologis / Tatanan Ekologis), yang bertujuan menghubungkan aset kognitif manusia, kemampuan eksekusi AI Agent, dan mekanisme ekonomi on-chain untuk menciptakan model tatanan baru bagi ekonomi kolaborasi manusia-mesin. Dibandingkan dengan proyek lain seperti Colony (kolaborasi organisasi), SingularityNET (pertukaran kemampuan AI), Gitcoin Passport (verifikasi identitas), serta Farcaster dan Lens Protocol (jaringan informasi), m&W berfokus pada pembangunan fondasi kredit untuk kolaborasi manusia-AI. Eksplorasi m&W berkembang dalam tiga tahap: 1. **m&W 1.0: Penjangkaran Kredit** – Menyaring node berkualitas tinggi (Builder) melalui mekanisme "tumbukan proton" dan mengendapkan kontribusi berkelanjutan mereka menjadi aset kredit SBT (Soulbound Token) yang tidak dapat dialihkan. 2. **m&W 2.0: Ekonomi Kolaborasi** – Menerapkan protokol EcoFi untuk menghubungkan kredit dengan tugas kolaborasi nyata, menggunakan sistem verifikasi berlapis (AI, Builder berkredit tinggi, arbitrase OG) untuk menilai dan memberi harga pada kontribusi non-struktural. 3. **m&W 3.0: Tatanan Cerdas** – Memetakan kredit manusia yang terakumulasi ke dalam *digital twin* AI Agent, memberikan dasar kepercayaan bagi Agent untuk berpartisipasi aktif dalam jaringan ekonomi, membuka jalan menuju ekonomi kolaboratif manusia-mesin. Tantangan utama termasuk memulai dengan pertumbuhan yang lambat karena seleksi ketat, menyeimbangkan verifikasi AI dengan tata kelola manusia, serta memastikan stabilitas ekonomi token jangka panjang. Pada intinya, m&W tidak sekadar membangun aplikasi AI atau meniru model DAO yang ada, tetapi bereksperimen dengan hubungan produksi baru untuk era AI, menghubungkan kredit kontribusi manusia, kemampuan kolaborasi AI Agent, mekanisme on-chain, dan sistem insentif ekonomi. Tujuannya adalah membangun dasar kredit, aturan kolaborasi, dan tatanan ekonomi yang andal untuk jaringan kolaborasi manusia-mesin di masa depan, mewujudkan misi menggunakan blockchain untuk menciptakan tatanan dalam jaringan cerdas.

链捕手1j yang lalu

Evolusi Tata Kelola di Era AI & Web3: Dimensi Kompetisi dan Jalur Eksplorasi m&W

链捕手1j yang lalu

2026 IMO China Kuasai Peringkat dengan Skor Sempurna, Shanghai High School Sapu Bersih Medali Emas, GPT-5.6 Menghadirkan Kembali Momen AlphaGO

Selamat kepada Tim China! Dalam kompetisi International Mathematical Olympiad (IMO) 2026 di Shanghai, China meraih juara dengan spektakuler. Tim China memenangkan medali emas untuk seluruh anggotanya, meraih skor total 232 dan unggul 25 poin dari peringkat kedua. Tiga siswa, Deng Leyan dan Zhang Bolun dari Shanghai High School, serta Liu Che dari High School Affiliated to East China Normal University, meraih emas dengan skor sempurna. Ini adalah kemenangan tim ke-26 China sejak pertama kali menang pada 1989, dengan 8 edisi berturut-turut memiliki anggota dengan skor sempurna. Selain itu, satu peserta dari Inggris, satu dari Korea Selatan, dan dua dari Amerika Serikat juga meraih emas sempurna. Amerika Serikat meraih posisi runner-up, diikuti oleh Rusia di posisi ketiga. IMO 2026, yang diselenggarakan di Shanghai High School, menandai pertama kalinya kompetisi ini diadakan di sebuah sekolah menengah. Shanghai High School telah mengumpulkan total 20 medali emas IMO sepanjang sejarah, dengan tren kuat dalam beberapa tahun terakhir. Tahun ini juga menyoroti perkembangan AI dalam matematika. Dilaporkan, model AI seperti GPT-5.6 Pro berhasil memecahkan keenam soal IMO 2026 dalam percobaan pertama tanpa bantuan manusia, menunjukkan lompatan kemampuan dari pencarian solusi berulang ke penalaran yang tepat dan langsung. AI semakin mendekati tingkat kesempurnaan yang ditunjukkan oleh para juara olimpiade manusia.

marsbit2j yang lalu

2026 IMO China Kuasai Peringkat dengan Skor Sempurna, Shanghai High School Sapu Bersih Medali Emas, GPT-5.6 Menghadirkan Kembali Momen AlphaGO

marsbit2j yang lalu

Trading

Spot

Model Raksasa Menyapu Bersih Semua Ujian, Tapi Justru Jauh dari AGI: Apa yang Dibongkar Makalah Ini?

Abstrak

2025, Siapa yang Menggambar Ulang Garis Start AGI?

Skala Baru Kecerdasan: Membongkar "Ilmuwan Buatan"

Reset Rute Menuju AGI: Berpisah dari Scaling Law Tunggal

Pertanyaan Terkait

Bacaan Terkait

Bitcoin: Mengapa Mempertahankan $59.000 Bisa Menjadi Ujian Terbesar BTC Sejauh Ini

Laporan Pembiayaan Mingguan | Crypto.com Raih Investasi USD 400 Juta, Jalur CeFi dan Stablecoin Terus Menarik Dana

Bear Market Paling Lembut? Pelaku Jual BTC Mundur, ARK dan Bitwise Sama-sama Optimis

Evolusi Tata Kelola di Era AI & Web3: Dimensi Kompetisi dan Jalur Eksplorasi m&W

2026 IMO China Kuasai Peringkat dengan Skor Sempurna, Shanghai High School Sapu Bersih Medali Emas, GPT-5.6 Menghadirkan Kembali Momen AlphaGO

Trading

Kategori Populer

Tag Populer