Gemini 3.5 Telah Datang! Malam Ini, Google Menyingkirkan Google dengan Tangan Sendiri

链捕手Dipublikasikan tanggal 2026-05-20Terakhir diperbarui pada 2026-05-20

Abstrak

Pada Google I/O 2026, perusahaan meluncurkan serangkaian terobosan besar dalam kecerdasan buatan. Gemini Omni, model "pintar" pertama yang benar-benar multimodal, mampu membuat video berkualitas tinggi dari input teks, gambar, audio, atau video, dengan pemahaman mendalam tentang logika dunia fisik. Gemini 3.5 Flash, model andalan baru, mengungguli pendahulunya Gemini 3.1 Pro dalam hampir semua tolok ukur dan menawarkan kecepatan empat kali lebih cepat daripada pesaing. Antigravity 2.0 berkembang dari IDE menjadi platform pengembangan agen mandiri, dengan demo di mana 93 agen berhasil membangun kernel sistem operasi dari nol dalam 12 jam. Gemini Spark diperkenalkan sebagai agen AI pribadi yang berjalan 24/7 di cloud, mengotomatiskan tugas kompleks di seluruh produk Google seperti Gmail dan Docs. Google juga mengumumkan perubahan harga, termasuk paket AI Ultra baru seharga $100, dan mengintegrasikan Gemini 3.5 Flash ke dalam Aplikasi Gemini serta mode AI Penelusuran Google. Acara ini menandai langkah besar menuju AI yang lebih otonom dan canggih.

Penulis: Xinzhiyuan

 

Google I/O 2026, penuh semangat dan gebrakan!

Baru saja, Sundar Pichai dan Demis Hassabis muncul di panggung bersama, meluncurkan semua gebrakan yang telah dipersiapkan selama setengah tahun terakhir sekaligus.

Tanpa sedikit pun kejutan, bintang terbesar malam ini, Gemini Omni resmi diperkenalkan!

Sebagai model besar yang benar-benar 'serba bisa', Omni dapat menerima input dalam bentuk apa pun dan menghasilkan konten apa pun. Dan untuk pertama kalinya mendukung output video, layaknya 'Nano Banana versi video'.

Klimaks lain malam ini, milik Gemini 3.5 Flash.

Di hampir semua tes benchmark, 3.5 Flash berhasil mengungguli model flagship pendahulunya sendiri, Gemini 3.1 Pro. Kecepatan output juga langsung berlipat ganda, bahkan lebih dari 4 kali lebih cepat dibandingkan GPT-5.5 dan Opus 4.7. 3.5 Pro yang lebih kuat, akan dirilis bulan depan.

Selain itu, sejumlah produk andalan baru juga diperkenalkan:

  • Antigravity 2.0: Aplikasi desktop independen baru, berevolusi dari IDE menjadi platform pengembangan Agen

  • Gemini Spark: Agen AI pribadi, berjalan di cloud 7x24 jam

  • Pembaruan Gemini App: Kode nama Neural Expressive, diubah ke penagihan berbasis daya komputasi

  • Paket Berlangganan AI Ultra: Tambahan versi $100, paket tertinggi turun dari $250 menjadi $200

  • Pembaruan Terbesar Google Search dalam 25 Tahun: Terintegrasi dengan 3.5 Flash, menambahkan kotak pencarian cerdas, pembuatan otomatis mini-aplikasi, dll

    ......

Bisa dibilang, kepadatan isi I/O ini, paling tinggi sepanjang tahun.

Peluncuran Perdana Gemini Omni: Lahirnya AI 'Serba Bisa'

Seperti yang diisyaratkan video teaser, Gemini Omni yang telah lama dinantikan akhirnya datang. Hassabis sendiri naik panggung mengumumkan, "Kami mengambil langkah penting berikutnya—Gemini Omni, sebuah model baru yang dapat membuat konten dari input apa pun".

Penampilannya menjelaskan segalanya. Kali ini Google ingin membangun mesin kreasi AI yang 'serba bisa'. Ini menggabungkan kecerdasan Gemini dengan AI generatif terkuat, memaksimalkan ketiga dimensi: pemahaman dunia, multimodalitas, dan penyuntingan. Intinya, dengan memberikan kombinasi gambar, audio, video, teks apa pun, ia dapat menghasilkan video berkualitas tinggi. Dan, video dapat diedit dengan cara mengobrol.

Yang lebih krusial, Omni tidak hanya 'terlihat seperti', ia benar-benar memahami dunia fisik. Kata-kata asli Hassabis adalah, sistem sebelumnya sering gagal saat mensimulasikan konsep seperti gravitasi, energi kinetik, tetapi Omni mencapai 'perubahan signifikan'. Ia menyuntikkan 'pengetahuan dunia' dan 'kemampuan penalaran' Gemini ke dalam pembuatan video.

  • Beri prompt "Jelaskan pelipatan protein dengan animasi tanah liat", video yang dihasilkan menunjukkan setiap langkah rantai asam amino melipat menjadi heliks alfa dan lipatan beta secara ilmiah akurat, secara visual adalah animasi stop-motion yang indah.

  • Atau misalnya, mengonfigurasi 26 huruf alfabet Inggris dengan objek terkait. C adalah Kapibara, D adalah bola disko, L adalah lampu lava. Omni tidak hanya menempelkan materi, ia benar-benar menghubungkan bahasa, gambar, dan semantik.

Harus diakui, langkah dari realistis ke bermakna, ini terlalu besar.

Di atas panggung, Hassabis mengeluarkan video selfie dan mulai mengeditnya langsung. Lingkaran yang digambar sembarangan di telapak tangan berubah menjadi lubang hitam, jalan tempat berjalan-jalan di sore hari berubah menjadi adegan cyberpunk. Satu kalimat menulis ulang gambar, satu kalimat mengubah dunia. Apa pun dapat menjadi kanvas untuk menciptakan realitas baru. Contoh lain, selfie bermain api di telapak tangan, selembar kertas digambar lingkaran langsung menjadi lubang hitam, berbagai permainan imajinatif dapat diwujudkan.

Dan, ini bukan sekali selesai. Anda dapat melanjutkan obrolan. Video yang dihasilkan Gemini Omni, karakternya konsisten, logika fisiknya valid, memori pemandangannya koheren.

  • Mulai dari cuplikan asli pertunjukan biola. Putaran kedua, "pindahkan pemain biola ke lingkungan gambar ini", lampirkan gambar referensi padang rumput bersalju, pemandangan langsung beralih, gerakan, pencahayaan semuanya menyesuaikan dengan lingkungan baru.

  • Putaran ketiga, "pindahkan kamera ke belakang bahu pemain biola", sudut pandang berputar, tetapi gerakan bermain dan musik benar-benar berkelanjutan.

Tidak peduli bagaimana pemandangan berubah, subjek dalam gambar tidak akan rusak.

Yang membuat orang semakin berpikir, adalah fleksibilitas input Omni. Gambar, teks, video, audio, referensi apa pun dapat dicampurkan sebagai input, menghasilkan output yang koheren. Anda bahkan dapat membuat Avatar sendiri, membuat versi AI dari Anda muncul di adegan apa pun, dengan suara Anda, melakukan hal-hal yang belum pernah Anda lakukan.

Saat ini, Omni Flash telah resmi diluncurkan, versi API akan dibuka dalam beberapa minggu ke depan. Sementara Omni Pro yang lebih kuat juga sedang dalam perjalanan. Berkat kemampuan integrasi kuat Google, Omni telah langsung terintegrasi dengan Gemini App, Google Flow, dan YouTube Shorts, pengguna YouTube Shorts bahkan dapat menggunakannya secara gratis.

Flash Mengungguli Pro: 3.5 Menulis Ulang Definisi 'Flagship'

Setelah Gemini Omni, sorotan utama lain di I/O ini, adalah peluncuran flagship baru Gemini 3.5 Flash. Definisi Google untuknya adalah, model pengkodean dan agen terkuat sejauh ini.

Di tempat, Sundar Pichai sendiri mengumumkan, "3.5 Flash mengungguli Gemini 3.1 Pro di hampir semua tes benchmark"! Ingat, 3.1 Pro adalah model flagship yang Google luncurkan baru tiga bulan lalu, sekarang, model level Flash saja sudah mengunggulinya.

Tak disangka, Google berhasil memberikan hasil yang menakjubkan dalam waktu singkat:

  • Terminal-Bench 2.1 (pengkodean): 76.2%

  • GDPval-AA (tugas Agen dunia nyata): 1656 Elo

  • MCP Atlas (penggunaan alat skala besar): 83.6%

  • CharXiv Reasoning (pemahaman multimodal): 84.2%

Keempat tes benchmark di atas, dibandingkan dengan Gemini 3.1 Pro, 3.5 Flash mengalami lompatan signifikan. Dalam hal kecepatan, 3.5 Flash menempati kuadran sendiri, 289 token/detik, lebih dari 4 kali lebih cepat dari model mutakhir lainnya. Selain itu, 3.5 Flash dalam beberapa tes benchmark, performanya setara, bahkan cukup untuk mengungguli GPT-5.5, Claude Opus 4.7. Harus diakui, 3.5 Flash cepat dan kuat, hampir tak ada lawan.

Parameter terlalu abstrak, lebih baik lihat demonstrasi nyata. Hanya dalam sekejap, 3.5 Flash dapat mencerna makalah akademis yang rumit, dan menulis situs web visualisasi dengan interaksi sempurna. Dalam tugas agen, melalui Antigravity, ia dapat menyelesaikan alur kerja multi-langkah, secara otomatis mengklasifikasikan dan menamai aset yang berserakan. Atau, menggunakan dua Agen, dalam waktu enam jam mereproduksi makalah AlphaZero, dan menulis game yang dapat berjalan lengkap.

93 Agen Membuat OS, Hanya 12 Jam

Dapat dilihat, semua kemampuan 3.5 Flash ini diwujudkan melalui Antigravity 2.0 yang baru. Hari ini, platform pengembangan Agen Google, Antigravity, telah ditingkatkan ke versi 2.0, dari IDE menjadi aplikasi desktop independen, sepenuhnya mengadopsi desain berbasis-Agen.

Varun naik panggung memberikan Demo yang membuat semua orang terpaku. Dia meminta Antigravity menggunakan 3.5 Flash, membangun sistem operasi dari nol. 93 sub-Agen bekerja secara paralel, mengirimkan lebih dari 15000 permintaan model, memproses 2.6 miliar token, 12 jam kemudian, sebuah proyek yang benar-benar kosong menjadi kernel OS yang fungsional lengkap. Scheduler, manajemen memori, sistem file, setiap baris kode ditulis, diuji, diaudit oleh Agen. Biaya API kurang dari $1000.

Kemudian, dia mencoba menjalankan DOOM di sistem operasi yang ditulis AI ini. Upaya pertama gagal, tidak ada driver video dan keyboard. Lalu dia langsung memasukkan perintah perbaikan di Antigravity 2.0, Agen mulai otomatis menulis kode driver. Setelah menunggu sebentar, tampilan DOOM muncul di layar, seluruh ruangan gemuruh.

Kesimpulannya, peningkatan inti yang dibawa Antigravity 2.0 meliputi:

  • Sub-Agen dapat dibuat secara dinamis, Agen utama membagi tugas menjadi sub-tugas dan membagikannya, berjalan paralel tanpa gangguan;

  • Manajemen tugas asinkron membuat operasi yang memakan waktu lama tidak lagi memblokir thread utama;

  • Scheduled Tasks dapat mengatur 'tugas terjadwal' untuk dieksekusi otomatis oleh Agen, misalnya memeriksa status PR sekali sehari, menjalankan skrip pemeriksaan kesehatan setiap jam.

  • Perintah garis miring baru: /goal membuat Agen menyelesaikan semuanya sekaligus, /grill-me sebaliknya membuat Agen memahami kebutuhan sebelum bertindak, /browser secara eksplisit mengontrol penggunaan browser.

Namun, ini semua adalah kemampuan yang telah berjalan internal. Kecepatan pemrosesan token Google dengan Antigravity, pada Maret adalah 500 miliar per hari. Kini, melaju gila 3 triliun per hari. Dan, Flash versi 12 kali lebih cepat ini, mulai hari ini sudah dapat digunakan di Antigravity.

3.5 Flash sekaligus menjadi model default untuk Gemini App dan Mode AI Google Search, untuk semua pengguna global. Pengembang dapat menggunakannya melalui Antigravity 2.0, Gemini API, Google AI Studio. Pengguna korporat dapat mengakses melalui Gemini Enterprise Agent Platform. Yang lebih dahsyat, 3.5 Pro sedang dalam pengujian internal, akan dirilis bulan depan.

Asisten Pribadi 7x24 jam: Google Spark Akhirnya Datang

Rilis besar ketiga malam ini, tentu saja adalah Gemini Spark! Sundar Pichai memberikan posisi yang sangat jelas: Agen AI pribadi Anda. Bahkan ketika laptop ditutup, ia tidak berhenti. Ia berjalan di mesin virtual khusus di cloud, dapat beroperasi 7x24 jam online.

Gemini Spark didukung oleh Gemini 3.5 + kerangka kerja Antigravity, terintegrasi secara mendalam dengan 'paket lengkap perkantoran' Google. Wakil Presiden Produk Josh Woodward naik panggung mendemonstrasikan dua skenario, langsung membuat seluruh ruangan gembira.

  • Pertama adalah skenario kerja: Masukkan perintah, "bantu saya merancang email untuk tim, rangkum semua informasi tentang peluncuran Gemini Live dalam seminggu terakhir". Spark otomatis mengambil informasi dari Gmail, Docs, riwayat obrolan, bahkan memanggil keterampilan 'ghostwriter' yang ditulis Woodward sendiri, membuat email secara otomatis sesuai dengan nada bicara pribadinya. Seluruh proses diselesaikan di latar belakang, manusia hanya perlu meninjau dan mengirim. Benar, Spark mendukung keterampilan kustom (skills), membuatnya belajar cara bicara, preferensi, cara kerja Anda.

  • Kedua adalah skenario kehidupan: Merencanakan pesta lingkungan. Spark setelah menerima tugas, melangkah demi langkah. Ia membuat lembar pelacakan RSVP di Google Sheets, terhubung langsung ke Gmail, siapa yang membalas akan diperbarui otomatis. Untuk tetangga yang belum mendaftar, Spark otomatis menyusun email pengingat, membuat draf dan mengirimkannya setelah dikonfirmasi. Kemudian, ia juga membuat deck presentasi Google Slides, bahkan informasi tentang kastil udara yang akan ditempatkan di lingkungan dituliskan. Sepanjang proses tidak membuka satu pun aplikasi.

Tidak hanya itu, Spark juga memiliki kemampuan input suara yang kuat. Di tempat, Woodward mengeluarkan ponsel, langsung mengirim tiga tugas dengan suara: "Temukan semua rapat dengan Sundar, tandai dengan warna merah muda cerah", "Tulis surat undangan untuk tetangga baru John untuk bergabung dalam daftar pesta blok", "Buat dokumen yang mencantumkan hal-hal yang perlu dilakukan untuk anak sebelum akhir tahun ajaran, diurutkan berdasarkan tenggat waktu".

Suara langsung diubah menjadi instruksi teks, Spark otomatis membagi suara kontinu menjadi tiga thread tugas independen, dijalankan paralel di latar belakang.

Dalam hal harga, langganan AI Ultra $100 per bulan dapat menggunakan Spark Beta. Paket Ultra tertinggi turun dari $250 menjadi $200. Spark akan membuka Beta untuk pengguna AI Ultra AS mulai minggu depan.

Malam Ini, Google Membuka Pintu Masuk ASI

Melihat kembali I/O ini, yang benar-benar membuat bulu kuduk merinding, bukan satu produk tertentu. Melainkan semua kemampuan datang bersamaan.

Pemahaman multimodal penuh, generasi multimodal penuh, Agen online 24 jam—ketiga potongan teka-teki ini, Google satukan dalam satu malam. Omni mengubah satu kalimat menjadi dunia, tidak memerlukan manusia menyediakan materi apa pun; 93 Agen membuat sistem operasi dari nol, tidak memerlukan manusia menulis satu baris kode; Spark bekerja untuk Anda 7×24 jam, tidak memerlukan manusia membuka satu aplikasi.

Ketika AI tidak lagi memerlukan manusia 'memberi bahan', tetapi memahami, memutuskan, mengeksekusi, dan mengulangi sendiri—tujuan jalan ini, disebut ASI (Kecerdasan Super).

Tidak ada yang bisa memberikan jadwal pasti. Tetapi Google I/O malam ini, membuat semua orang menyadari satu hal: Di jalan menuju kecerdasan super, sudah tidak ada hambatan 'secara teknis tidak dapat dilakukan'. Sisanya, hanya kecepatan penyebaran rekayasa. Enam bulan lalu kita masih memperdebatkan apakah AGI adalah gelembung. Enam bulan kemudian, Google sudah menggunakan Agen untuk menulis sistem operasi. Akselerasi industri ini, telah melampaui jangkauan intuisi manusia.

Referensi:

  • https://youtu.be/wYSncx9zLIU

  • https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

  • https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/

  • https://antigravity.google/blog/introducing-google-antigravity-2-0

  • https://antigravity.google/blog/google-io-2026-feature-deep-dive

Editor: Peach Moses

 

 

 

 

 

 

 

 

 

 

 

 

Pertanyaan Terkait

QApa itu Gemini Omni dan mengapa disebut sebagai 'AI serba bisa'?

AGemini Omni adalah model baru yang diperkenalkan Google di I/O 2026. Disebut sebagai 'AI serba bisa' atau 'omnimodal' karena dapat menerima input dalam bentuk apa pun (teks, gambar, audio, video) dan menghasilkan konten apa pun, termasuk video. Model ini memadukan kecerdasan Gemini dengan kemampuan generatif AI terkuat, memungkinkan pembuatan dan pengeditan video hanya dengan percakapan.

QBagaimana performa Gemini 3.5 Flash dibandingkan dengan model sebelumnya dan pesaingnya?

AGemini 3.5 Flash menunjukkan peningkatan yang sangat signifikan. Dalam hampir semua pengujian patokan, ia mengungguli model unggulan Google sebelumnya, Gemini 3.1 Pro. Kecepatan outputnya dua kali lebih cepat daripada 3.1 Pro, dan hingga 4 kali lebih cepat dibandingkan model pesaing seperti GPT-5.5 dan Claude Opus 4.7. Ia unggul dalam tugas pengkodean, agen dunia nyata, penggunaan alat skala besar, dan pemahaman multimodal.

QApa itu Antigravity 2.0 dan apa contoh kemampuan yang ditunjukkan dalam demo Google I/O?

AAntigravity 2.0 adalah platform pengembangan agen AI yang ditingkatkan dari IDE menjadi aplikasi desktop mandiri. Dalam demo, Antigravity 2.0 yang ditenagai oleh Gemini 3.5 Flash berhasil membangun sebuah sistem operasi dari nol. Sebanyak 93 sub-agen bekerja paralel, membuat lebih dari 15.000 permintaan model, memproses 2,6 miliar token, dan menghasilkan OS kernel yang berfungsi penuh hanya dalam 12 jam.

QApa itu Gemini Spark dan bagaimana cara kerjanya sebagai 'agen AI pribadi'?

AGemini Spark adalah agen AI pribadi yang berjalan 7x24 jam di mesin virtual khusus di cloud. Ditenagai oleh Gemini 3.5 dan kerangka kerja Antigravity, ia terintegrasi mendalam dengan ekosistem Google (Gmail, Docs, Sheets, dll.). Spark dapat menerima tugas kompleks (melalui teks atau suara), memecahnya menjadi utas terpisah, dan mengeksekusinya di latar belakang dengan menggunakan aplikasi yang relevan, seperti membuat spreadsheet, menulis email, atau membuat presentasi, semuanya otomatis tanpa intervensi manual.

QMenurut artikel, apa implikasi dari pengumuman di Google I/O 2026 terhadap perkembangan AI di masa depan?

AArtikel menyimpulkan bahwa Google I/O 2026 menandai titik balik besar. Dengan peluncuran Gemini Omni (generasi multimodal lengkap), Gemini 3.5 Flash dan Antigravity 2.0 (kemampuan agen otomatis yang sangat kuat), serta Gemini Spark (agen pribadi yang selalu aktif), Google telah menyatukan tiga potongan teka-teki kunci: pemahaman penuh modalitas, generasi penuh modalitas, dan agen yang beroperasi 24/7. Ini menunjukkan bahwa hambatan teknis menuju ASI (Kecerdasan Super Buatan) mungkin sudah teratasi, dan yang tersisa hanyalah kecepatan penerapan teknikal. Percepatan industri ini dianggap melampaui intuisi manusia.

Bacaan Terkait

PA Visual | Satu Gambar Pahami Peristiwa Web3 Penting yang Patut Diperhatikan di Bulan Juni

"PA Pictorial: Peta untuk Memahami Peristiwa Web3 Penting yang Perlu Diperhatikan pada Juni" Jelajahi Kalender Kripto terbaru PANews dengan cakupan lebih lengkap, penyaringan fleksibel, dan ekspor yang mudah. Pada Juni, pasar kripto dipadati oleh keputusan suku bunga makro, data ekonomi penting, pelepasan token, dan acara teknologi tradisional. Poin-poin intinya meliputi: 📌 Amerika Serikat merilis data NFP dan CPI bulan Mei. The Fed menerbitkan Buku Beige dan menggelar konferensi pers kebijakan, dengan preferensi risiko pasar tetap dipengaruhi ekspektasi makro. 🏦 Bank Sentral Eropa dan Bank of Japan akan mengumumkan keputusan suku bunga, menjadikan likuiditas global dan jalur suku bunga sebagai salah satu tema utama pasar di Juni. 🪙 Beberapa token seperti SUI dan ENA akan mengalami pelepasan (unlock), perlu diperhatikan risikonya. 🚀 Perkembangan proyek: Coinbase akan meluncurkan futures indeks saham perpetual perdana, CME Group berencana meluncurkan futures indeks kripto Nasdaq; SharpLink akan dimasukkan ke dalam Indeks Russell 2000 dan 3000. ⚠️ Penyaringan proyek terus berlanjut: Layanan seperti browser Bitcoin Ordinals, Ord.io, secara bertahap berhenti beroperasi. Perhatikan pengaturan penarikan dan migrasi aset. 🌐 Acara penting lainnya: Pembukaan Piala Dunia, pembukaan Apple WWDC26, penawaran saham SpaceX, pertemuan IPO S&T UBTECH di pasar STAR, dll. Dengan makroekonomi, pelepasan token, regulasi, penyaringan proyek, dan acara teknologi yang berlangsung bersamaan, pasar pada Juni mungkin terus mencari arah baru di tengah ekspektasi likuiditas, perubahan kebijakan, dan rotasi ekosistem. Kunci inti peristiwa global dan alur utama Web3 Juni 2026 dalam satu peta!

marsbit47m yang lalu

PA Visual | Satu Gambar Pahami Peristiwa Web3 Penting yang Patut Diperhatikan di Bulan Juni

marsbit47m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

Dalam satu minggu terakhir Mei, dua raksasa teknologi China, Alibaba dan ByteDance, memamerkan dua pendekatan berbeda dalam strategi AI mereka. Alibaba, sebagai perusahaan publik, fokus pada integrasi AI untuk monetisasi langsung. Mereka menghubungkan model Qwen dengan platform e-commerce seperti Taobao, menciptakan fitur seperti "pencocokan harga AI" dan "pakaian virtual AI". Melalui protokol ACT, mereka membangun infrastruktur untuk transaksi berbasis agen AI. Pendapatan eksternal Alibaba Cloud tumbuh 40%, menunjukkan model bisnis "MaaS" (Model-as-a-Service) mereka yang berhasil. Namun, pendekatan ini mungkin mengorbankan penelitian mendasar untuk keunggulan jangka pendek. Sebaliknya, ByteDance, yang masih swasta, berinvestasi besar dalam penelitian AI jangka panjang. Departemen Seed mereka, dengan anggaran belanja modal (capex) yang meningkat pesat, bertujuan "menjelajahi batas atas kecerdasan". Mereka merilis model pembuatan video Seedance 2.0 yang memimpin peringkat global dan mempublikasikan penelitian mendalam tentang "model dunia". Perusahaan ini memberikan kebebasan bagi tim risetnya tanpa tekanan kuartalan dari pasar modal. Perbedaan kunci ini lebih disebabkan oleh status kepemilikan daripada filosofi semata. Sebagai perusahaan publik, Alibaba terikat pada harapan ROI jangka pendek investor. ByteDance, yang belum IPO, memiliki kemewahan untuk berfokus pada terobosan teknologi jangka panjang. Analisis menyimpulkan bahwa jalan strategis AI sebuah perusahaan di China sangat ditentukan oleh apakah perusahaan tersebut terdaftar di bursa atau tidak, yang membentuk pilihan antara "menjual AI" dan "membuat AI".

marsbit55m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

marsbit55m yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

**Mengapa Lebih Banyak AI Agent Tidak Sama dengan Produktivitas Lebih Tinggi?** Meskipun teknologi memungkinkan kita meluncurkan banyak AI Agent dengan mudah dan murah, produktivitas nyata tidak serta-merta meningkat. Ini karena munculnya konsep "Pajak Orkestrasi"—biaya tersembunyi untuk mengelola, menilai, dan menggabungkan hasil kerja semua Agent tersebut. Pekerjaan ini harus kembali ke satu sumber daya serial yang tidak dapat diduplikasi: perhatian dan penilaian manusia. **Manusia adalah 'GIL' dalam Sistem.** Seperti Global Interpreter Lock (GIL) dalam Python, semua Agent dapat berjalan paralel, tetapi untuk keputusan penting (seperti tinjauan arsitektur, kode, atau penyelesaian konflik), mereka harus "mengambil kunci" dari Anda—sang pengembang. Hukum Amdahl berlaku: percepatan maksimum dari paralelisasi dibatasi oleh bagian kerja yang harus tetap serial, yaitu kapasitas penilaian manusia. Menambah Agent hanya membuat antrian tinjauan lebih panjang, memperbesar beban konteks, dan menyebabkan kelelahan kognitif. **Kelelahan dan Utang Tersembunyi.** Banyaknya Agent yang aktif memberi ilusi produktivitas tinggi, tetapi rasa sibuk itu tidak sama dengan hasil berkualitas. Jika Anda "menyerah secara kognitif" dan tidak meninjau hasil dengan benar, Anda menumpuk utang teknis dan utang kognitif—masalah yang akan muncul nanti. Pajak orkestrasi harus dibayar, baik secara sadar melalui proses yang terencana, atau diam-diam melalui penurunan kualitas. **Solusi: Kelola Perhatian Seperti Sistem Produksi.** Kuncinya adalah merancang alur kerja dengan menghormati batas perhatian manusia sebagai sumber daya langka: 1. **Kontrol Jumlah Agent:** Sesuaikan jumlah Agent dengan kemampuan *review* Anda, bukan dengan apa yang UI izinkan. Batasi ke angka rendah. 2. **Klasifikasi Tugas:** Pisahkan tugas independen (cocok untuk Agent paralel) dari tugas kompleks yang membutuhkan penilaian mendalam (kerjakan secara serial). 3. **Tinjau Secara Berkelompok (*Batch Review*):** Kurangi biaya alih konteks dengan meninjau hasil beberapa Agent sekaligus. 4. **Gunakan Waktu Serial untuk Penilaian:** Fokuskan perhatian hanya pada bagian yang memerlukan penilaian manusia. Biarkan Agent menangani bagian yang dapat diverifikasi otomatis (seperti tes). 5. **Lindungi Waktu Fokus Anda:** Kadang, tindakan paling produktif adalah berhenti mengoordinasi banyak Agent dan fokus pada satu masalah inti. Kemampuan sebenarnya di era AI bukanlah menjalankan banyak Agent, tetapi merancang sistem yang secara sadar mengelilingi dan melindungi kapasitas penilaian serial manusia—sumber daya paling berharga dalam proses pengembangan.

marsbit2j yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

marsbit2j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit8j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit8j yang lalu

Trading

Spot
Futures
活动图片