# Artikel Terkait LLM

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "LLM", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Gemini 3.5 Pro Bocoran Rahasia, Depan Mengungguli Fable 5

**Gemini 3.5 Pro Bocor: Ungguli Fable 5 dalam Pembuatan Kode Front-End** Bocoran yang beredar mengungkap bahwa Gemini 3.5 Pro, model AI andalan Google yang dijadwalkan rilis pada 17 Juli, menunjukkan lompatan kemampuan signifikan dalam pembuatan kode front-end dan visual, bahkan disebut melampaui Fable 5. Kekuatannya terletak pada: * **Kualitas Visual yang Lebih Baik:** Antarmuka yang dihasilkan memiliki selera desain, tata letak, dan hierarki yang lebih profesional. * **Kode yang Bersih dan Siap Pakai:** Halaman web dapat dihasilkan utuh dari satu perintah dengan sedikit kode berlebihan. * **Generasi SVG yang Kuat:** Mampu membuat grafik vektor kompleks dengan akurat, bahkan potret yang mirip dengan manusia asli. * **"Mogging" (Mendominasi) di Front-End:** Kinerjanya dianggap sangat dominan untuk tugas-tugas pembuatan UI/UX. Namun, Gemini 3.5 Pro tetap memiliki kelemahan. Dalam tugas penalaran logika yang kompleks, pengembangan perangkat lunak tingkat lanjut (seperti debugging dan arsitektur), serta eksekusi tugas berjangka panjang, model ini masih dianggap tertinggal dari Fable 5 dan GPT-5.6. Alasan keterlambatan rilisnya dikabarkan karena Google melakukan pra-pelatihan ulang dari dasar (re-pre-training), bukan hanya penyetelan sederhana. Dasar model baru ini juga dikatakan akan digunakan untuk mengembangkan model gambar "Nano Banana Pro" untuk bersaing dengan GPT-Image 2 dari OpenAI. Bocoran ini menggambarkan intensitas persaingan di dunia AI. Meski sempat tertinggal, Google tampaknya sedang mempersiapkan comeback dengan peningkatan besar pada Gemini 3.5 Pro. Semuanya menunggu konfirmasi resmi pada tanggal rilis yang diisukan.

marsbit07/06 12:29

Gemini 3.5 Pro Bocoran Rahasia, Depan Mengungguli Fable 5

marsbit07/06 12:29

Baru Saja, Karya Klasik DeepMind Kembali Mengukuhkan Dirinya sebagai Legenda, Penghargaan Utama ICML 2026 Diumumkan

Pengumuman Penghargaan ICML 2026 telah dirilis. Dua makalah tentang model difusi memenangkan Penghargaan Kertas Terkemuka, mengisyaratkan pergeseran fokus riset dari eksplorasi konsep ke pemeriksaan mendalam dan pembangunan infrastruktur yang kokoh. Salah satunya, "The Flexibility Trap," dari tim Universitas Tsinghua, mempertanyakan manfaat sebenarnya dari urutan generasi acak dalam model bahasa difusi. Yang lainnya meningkatkan presisi sampling. Penghargaan Kertas Posisi Terkemuka diberikan kepada makalah yang mengkritik komunitas alignment AI karena tanpa sadar membangun "toolkit sensor." Penghargaan Test of Time diberikan kepada makalah klasik DeepMind 2016, "Asynchronous Methods for Deep Reinforcement Learning" (A3C). Lima makalah penelitian dan satu makalah posisi menerima Honorable Mention, mencakup topik seperti lokasi munculnya kejujuran dalam model, atribusi gerakan dalam video, memorisasi model bahasa, konsistensi model difusi, dan fenomena "grokking." Kumpulan penghargaan ini mencerminkan tren penelitian AI yang beralih ke fase penyelidikan yang lebih dalam dan kritis.

marsbit07/06 02:41

Baru Saja, Karya Klasik DeepMind Kembali Mengukuhkan Dirinya sebagai Legenda, Penghargaan Utama ICML 2026 Diumumkan

marsbit07/06 02:41

Karpathy Baru-Baru Ini Mengkritik: Satu Kalimat Membuat Seluruh Pengembang Agent Diam Seribu Bahasa

Karpathy, peneliti inti tim pra-pelatihan di Anthropic, mengejutkan komunitas pengembang AI Agent dengan pernyataan tegasnya: "Kesalahan terbesar di bidang AI saat ini adalah orang-orang terburu-buru memaksa Agent bekerja, tanpa memahami model dasar yang mendasarinya terlebih dahulu." Dia berbagi pelajaran berharga dari proyek "World of Bits" tahun 2016 di OpenAI, yang bertujuan membuat Agent menggunakan komputer, tetapi gagal karena teknologi saat itu (seperti reinforcement learning) belum matang. Menurutnya, fokus yang benar saat itu adalah pada pengembangan model bahasa. Karpathy memberikan tiga saran penting: 1. Berhenti memaksa Agent melakukan segalanya; perbaiki dan pahami model dasarnya terlebih dahulu. 2. Membuat demo mudah, tetapi mengubahnya menjadi produk yang matang membutuhkan waktu hingga sepuluh tahun, seperti yang terlihat pada contoh mobil otonom dan VR. 3. Agent bukanlah produk itu sendiri; kemampuan dasar model lah yang merupakan produk sejati. Agent akan muncul secara alami jika fondasinya kuat. Ia juga mendorong para pengembang untuk belajar dari neurosains, seperti struktur otak manusia (misalnya, hipokampus untuk memori), untuk merancang Agent yang lebih baik. Pesan utamanya adalah: meskipun perusahaan besar seperti OpenAI unggul dalam pelatihan model bahasa besar, dalam pengembangan Agent, pengembang independen dan startup berada di garis terdepan. Tidak ada raksasa teknologi yang memiliki keunggulan lima tahun di bidang ini, sehingga peluang inovasi terbuka lebar bagi mereka yang gesit dan berani mencoba. Intinya, Karpathy tidak melarang pengembangan Agent, tetapi menekankan pentingnya fondasi yang kuat dan kesiapan untuk komitmen jangka panjang.

marsbit07/06 02:35

Karpathy Baru-Baru Ini Mengkritik: Satu Kalimat Membuat Seluruh Pengembang Agent Diam Seribu Bahasa

marsbit07/06 02:35

Pemenang Penghargaan Khusus Tsinghua, Gu Yuxian, Bergabung dengan DeepSeek

DeepSeek saat ini sedang dalam proses rekrutmen besar-besaran untuk berbagai posisi. Pada saat yang sama, versi resmi DeepSeek V4 akan diluncurkan pertengahan bulan ini. Dalam daftar penulis makalah DeepSeek V4, terdapat nama **Yuxian Gu**, seorang doktoral Universitas Tsinghua angkatan 2021 dan penerima Beasiswa Prestasi Khusus untuk Mahasiswa Pascasarjana tahun 2025. Diketahui bahwa **Gu Yuxian telah resmi bergabung dengan DeepSeek**. Gu Yuxian, yang juga pernah mendapatkan Beasiswa Doktoral Apple tahun 2025 dan Beasiswa In-Tech Ant Group, menyatakan bahwa "Inovasi algoritma menjadi kunci untuk menembus hambatan komputasi ketika sumber daya perangkat keras terbatas." Ia adalah doktoral tingkat akhir di Departemen Ilmu Komputer Universitas Tsinghua, dengan gelar sarjana juga dari universitas yang sama. Halaman pribadinya menunjukkan bahwa ia belajar di Kelompok Penelitian AI Interaktif (Conversational AI, CoAI) Universitas Tsinghua, dibimbing oleh Profesor Huang Minlie. Penelitiannya berfokus pada peningkatan efisiensi dalam seluruh siklus hidup model bahasa besar (LLM), mencakup tahap pra-pelatihan, adaptasi, dan inferensi. Ia mengembangkan penelitian dari tiga arah utama: **Penyaringan Data Pra-Pelatihan, Distilasi Pengetahuan dalam Kompresi Model, dan Arsitektur Model yang Efisien.** Di halaman Google Scholar-nya, **kutipan makalah Gu Yuxian telah mendekati 5000**, dengan dua makalah yang dikutip lebih dari 1000 kali. Sebagai penulis pertama, Gu Yuxian telah mempublikasikan banyak makalah di konferensi AI terkemuka internasional seperti NeurIPS, ICLR, dan ACL. Pada tahun 2024, ia dan rekan-rekannya mengusulkan metode distilasi pengetahuan untuk menyuling model bahasa besar menjadi model yang lebih kecil, menciptakan **"MiniLLM"** yang menghasilkan jawaban yang lebih akurat dan berkualitas lebih tinggi. Metode ini telah diadopsi oleh komunitas dan platform industri terkemuka seperti Google, Alibaba, dan NVIDIA. Pada tahun 2025, makalah **"Jet-Nemotron"** memperkenalkan seri baru model bahasa berarsitektur hybrid yang mencapai akurasi model perhatian penuh state-of-the-art (SOTA) sekaligus memiliki efisiensi yang luar biasa.

marsbit07/06 02:09

Pemenang Penghargaan Khusus Tsinghua, Gu Yuxian, Bergabung dengan DeepSeek

marsbit07/06 02:09

Penghasilan Tahunan $100 Juta, Dua Teman Sekamar UC Berkeley Generasi 90an, Menciptakan Bisnis AI Paling Menguntungkan

Dua teman sekamar di UC Berkeley, keduanya berusia 90-an, menciptakan bisnis AI yang sangat menguntungkan: Arena. Bermula dari proyek penelitian sumber terbuka bernama Chatbot Arena pada 2023, platform ini telah berkembang menjadi "gelanggang" benchmark model AI global yang netral. Pengguna dapat membandingkan respons dari dua model anonim dan memilih yang terbaik, menghasilkan peringkat berbasis Elo yang diakui industri. Dengan lebih dari 10 juta penilaian pengguna, 700 juta percakapan, dan 82 juta suara, Arena menjadi standar de facto untuk pengujian model besar. Raksasa seperti OpenAI, Google, dan Anthropic mengirimkan model mereka ke sini, bahkan OpenAI menguji GPT-5 secara diam-diam di platform ini. Kunci kesuksesan monetisasinya adalah layanan komersial "AI Evaluations", diluncurkan September lalu. Layanan ini memungkinkan perusahaan membayar untuk pengujian mendalam oleh komunitas jutaan pengguna Arena, memberikan analisis performa model di dunia nyata. Hanya dalam 8 bulan, pendapatan tahunan layanan ini telah mencapai $100 juta. Perusahaan ini didirikan oleh CEO Anastasios Angelopoulos (ahli matematika/machine learning), CTO Wei-Lin Chiang (pembuat Vicuna), dan profesor UC Berkeley Ion Stoica sebagai penasihat. Mereka mengumpulkan $100 juta dalam pendanaan seed dan $150 juta dalam Seri A, dengan valuasi mencapai $1.7 miliar. Arena terus berinovasi dengan memperkenalkan "Agent Mode" untuk mengevaluasi agen AI dalam tugas panjang seperti coding dan penelitian, melampaui sekadar penilaian percakapan. Bisnis mereka membuktikan bahwa dalam demam emas AI, menyediakan alat pengukuran yang andal (seperti "menjual sekop dan air") bisa lebih berharga daripada menambang sendiri.

marsbit07/06 00:22

Penghasilan Tahunan $100 Juta, Dua Teman Sekamar UC Berkeley Generasi 90an, Menciptakan Bisnis AI Paling Menguntungkan

marsbit07/06 00:22

Pujian dari Hinton, Presentasi Kontributor Inti Gemini: Akan Ada Miliaran AI Superhuman Selevel Einstein di Masa Depan

Adam Brown, kontributor inti Gemini dan pemimpin tim Blueshift di DeepMind, menyampaikan pidato berjudul "Training Sand to Think: Artificial General Intelligence & Future of Physics". Dia menceritakan perkembangan AI yang pesat, dari kemampuan seperti TK hingga level doktoral, dan memproyeksikan masa depan fisika. Brown menekankan bahwa model bahasa besar (LLM) bukanlah program yang ditulis, tetapi "ditumbuhkan" melalui pelatihan. Hukum penskalaan (*Scaling Law*), yang didorong oleh cara berpikir fisikawan, menjadi kunci revolusi AI, di mana peningkatan skala komputasi, data, dan model secara konsisten meningkatkan kinerja. AI telah melampaui berbagai uji benchmark akademis, mulai dari matematika SMA (MATH), kualifikasi doktoral (GPQA), hingga ujian relativitas umum dan mekanika kuantum tingkat lanjut. Bahkan, AI telah mencapai level medalis emas dalam Olimpiade Matematika Internasional (IMO) dan, yang lebih penting, berhasil memecahkan konjektur matematika "Unit Distance" Erdős yang berusia 80 tahun secara mandiri. Dengan menarik paralel dari perkembangan komputer catur, Brown memprediksi tahapan "manusia-centaur" (kolaborasi manusia-AI) menuju era "AI superhuman" dalam penelitian ilmiah. Meskipun AI saat ini masih memiliki kelemahan seperti otonomi rendah dan perencanaan yang lemah, AI sudah mampu mengubah lanskap fisika sebagai tutor pribadi, asisten pemrograman yang kuat, dan alat penelusuran literatur. Brown menyimpulkan bahwa kita berada di ambang zaman keemasan kolaborasi manusia-AI. Jika tren ini berlanjut, kita mungkin akan segera memiliki miliaran "AI Einstein" supercerdas yang beroperasi secara bersamaan, membuka babak baru yang paling menarik dalam sejarah fisika dan sains.

marsbit07/04 06:46

Pujian dari Hinton, Presentasi Kontributor Inti Gemini: Akan Ada Miliaran AI Superhuman Selevel Einstein di Masa Depan

marsbit07/04 06:46

Teknologi Baru DeepSeek Diterapkan ke Chip Apple, Model Besar Lokal Mac Dipercepat 60%

Teknologi DeepSeek 'DSpark' yang baru dibuka sumbernya kini telah diadaptasi untuk chip Apple, mempercepat model bahasa besar di Mac hingga 60%. Versi adaptasi bernama 'mlx-dspark' ini menjalankan model Gemma-4 12B dan Qwen3-4B, meningkatkan kecepatan generasi masing-masing 1,6 kali dan 1,4 kali lipat pada Mac M4 Pro. Keunggulan utama adaptasi ini adalah kemampuannya menghasilkan keluaran yang identik persis byte demi byte dengan model asli, tanpa mengorbankan kualitas. Insinyur Abdur Rahim yang mengerjakan proyek ini juga menerapkan metode sampling suhu dari makalah DSpark, memastikan distribusi keluaran yang akurat, bukan hanya versi perkiraan. Dalam pengujian, DSpark unggul dalam tugas percakapan terbuka. Sementara itu, teknologi spekulatif decoding lain, 'DFlash' dari z-lab, yang diintegrasikan kemudian, menunjukkan kecepatan lebih tinggi (hingga 2,1x) untuk tugas terkode dan matematika dengan mendekode blok token secara paralel. Rahim menggabungkan kedua pendekatan dalam mlx-dspark v0.0.3, memungkinkan pengguna menyesuaikan panjang blok DFlash untuk tugas yang berbeda dalam satu paket. Adaptasi ini membuka potensi percepatan serupa untuk model yang lebih besar seperti Qwen3-8B dan 14B di perangkat Mac.

marsbit07/03 12:25

Teknologi Baru DeepSeek Diterapkan ke Chip Apple, Model Besar Lokal Mac Dipercepat 60%

marsbit07/03 12:25

Karpathy Kembali Menjadi Legenda, Guncangkan RAG, Ubah Catatan Anda Menjadi Otak Kedua

Karpathy, mantan pendiri OpenAI dan direktur AI Tesla, memperkenalkan konsep revolusioner: mengelola pengetahuan pribadi dengan pendekatan "sumber kode yang dikompilasi" oleh LLM. Alih-alih menggunakan RAG yang hanya mengambil potongan catatan secara terpisah, metode barunya memperlakukan catatan mentah sebagai "sumber kode tidak berubah". LLM bertindak sebagai "kompiler" yang secara berkala menyusun semua bahan mentah tersebut menjadi wiki terstruktur yang saling terhubung dan koheren. Proses "kompilasi" ini memperbarui halaman terkait, merevisi ringkasan, dan menandai ketidakkonsistenan. Arsitektur ini memiliki tiga lapisan: **Raw** (bahan mentah), **Schema** (aturan struktur untuk AI), dan **Wiki** (hasil kompilasi AI). Alur kerjanya melibatkan **Ingest** (memasukkan materi baru), **Query** (bertanya pada wiki yang telah dikompilasi), dan **Lint** (pemeriksaan rutin untuk inkonsistensi). Konsep ini mewujudkan visi Vannevar Bush pada 1945 tentang "Memex", mesin asosiatif pribadi, yang sebelumnya terhambat oleh beban pemeliharaan manual yang melelahkan. LLM menghilangkan beban "pembukuan" pengetahuan ini, membebaskan manusia dari tugas pengorganisasian dan perawatan yang membosankan. Tujuannya adalah mengembalikan fokus manusia pada hal yang esensial: memutuskan apa yang perlu dipelajari dan merenungkan makna dari pengetahuan yang terkumpul. Ini adalah perubahan mendasar dalam hubungan produksi kognitif manusia-AI.

marsbit07/01 09:56

Karpathy Kembali Menjadi Legenda, Guncangkan RAG, Ubah Catatan Anda Menjadi Otak Kedua

marsbit07/01 09:56

BURUAN, Claude 5 Versi Pekerja Telah Tiba, Semua Orang Bisa Menggunakannya

Claude Sonnet 5, yang dijuluki "Fennec", telah resmi diluncurkan oleh Anthropic sebagai model default baru bagi semua pengguna Free dan Pro. Model ini dipromosikan sebagai versi Sonnet dengan kemampuan *Agent* terkuat yang mendekati performa model flagship Opus 4.8. Sonnet 5 menunjukkan peningkatan signifikan dalam berbagai tugas seperti penalaran, penggunaan alat (*tool use*), pemrograman, dan pekerjaan berbasis pengetahuan. Beberapa pencapaian utamanya mencakup skor 63.2% pada SWE-bench Pro (mengungguli GPT-5.5) dan 57.4% pada *Humanity's Last Exam* (hanya terpaut 0.5% dari Opus 4.8). Model ini juga dilengkapi kemampuan untuk merencanakan tugas dan menggunakan alat seperti browser serta terminal secara mandiri. Dari segi keamanan, Sonnet 5 unggul dengan tingkat keberhasilan serangan injeksi browser hanya 0.93%, lebih rendah dibandingkan model flagship lainnya. Harganya pun kompetitif: saat ini tersedia promo dengan harga $2 (input) dan $10 (output) per juta token hingga 31 Agustus, sebelum kembali ke harga standar $3/$15. Harga ini jauh lebih murah dibandingkan Opus 4.8. Peluncuran Sonnet 5 ini dipandang sebagai pilihan yang sangat menarik bagi para pengembang. Model ini menawarkan performa yang mendekati model top-tier dengan biaya yang jauh lebih terjangkau, sehingga diharapkan dapat menurunkan ambang batas biaya untuk mengadopsi arsitektur *multi-Agent*.

marsbit07/01 07:51

BURUAN, Claude 5 Versi Pekerja Telah Tiba, Semua Orang Bisa Menggunakannya

marsbit07/01 07:51

Tepat Saat Ini, Anthropic Meluncurkan Sonnet 5, Kinerja Mendekati Opus 4.8, Tetapi Belum Tentu Lebih Murah

Anthropic baru saja merilis model terbaru mereka, **Claude Sonnet 5**, yang dijuluki sebagai "model Sonnet paling kuat dalam hal kemampuan agen (agentic) hingga saat ini." Model ini mampu merencanakan, menggunakan alat seperti browser dan terminal, serta beroperasi secara otonom pada level yang sebelumnya hanya bisa dicapai oleh model yang lebih besar dan mahal seperti Opus. Dari segi performa, Sonnet 5 menunjukkan peningkatan signifikan dibandingkan pendahulunya, Sonnet 4.6, terutama dalam penalaran, penggunaan alat, pemrograman, dan pekerjaan berbasis pengetahuan, mendekati kemampuan Claude Opus 4.8. Namun, analisis dari Artificial Analysis menunjukkan bahwa biaya operasional per tugas untuk Sonnet 5 sekitar 2 kali lipat lebih tinggi daripada Sonnet 4.6 dan bahkan 15% lebih mahal daripada Opus 4.8, terutama karena peningkatan penggunaan token. Hal ini menjadikannya salah satu model dengan biaya operasional tertinggi. Untuk harganya, Anthropic menawarkan harga perkenalan hingga 31 Agustus 2026 sebesar $2 per juta token untuk input dan $10 per juta token untuk output. Setelah itu, harga standar akan berlaku yaitu $3 (input) dan $15 (output) per juta token. Perlu diperhatikan bahwa Sonnet 5 menggunakan tokenizer baru, yang menyebabkan jumlah token untuk konten yang sama meningkat sekitar 1.0-1.35 kali lipat. Dalam evaluasi keamanan, Sonnet 5 lebih baik daripada Sonnet 4.6 dalam menolak permintaan berbahaya dan serangan injeksi prompt, dengan tingkat halusinasi dan perilaku yang lebih rendah. Namun, tingkat perilaku menyimpangnya masih sedikit lebih tinggi dibandingkan Opus 4.8. Secara keseluruhan, Sonnet 5 menawarkan kemampuan agen yang jauh lebih kuat dan peningkatan performa yang jelas, tetapi dengan pertimbangan biaya operasional yang lebih tinggi karena konsumsi token yang meningkat.

marsbit07/01 00:39

Tepat Saat Ini, Anthropic Meluncurkan Sonnet 5, Kinerja Mendekati Opus 4.8, Tetapi Belum Tentu Lebih Murah

marsbit07/01 00:39

1"Teori Uang Tidak Berguna"? Prediksi Elon Musk 2036 yang Berpotensi Mengubah Nasib Bitcoin Secara Radikal

# Artikel Terkait LLM

Gemini 3.5 Pro Bocoran Rahasia, Depan Mengungguli Fable 5

Baru Saja, Karya Klasik DeepMind Kembali Mengukuhkan Dirinya sebagai Legenda, Penghargaan Utama ICML 2026 Diumumkan

Karpathy Baru-Baru Ini Mengkritik: Satu Kalimat Membuat Seluruh Pengembang Agent Diam Seribu Bahasa

Pemenang Penghargaan Khusus Tsinghua, Gu Yuxian, Bergabung dengan DeepSeek

Penghasilan Tahunan $100 Juta, Dua Teman Sekamar UC Berkeley Generasi 90an, Menciptakan Bisnis AI Paling Menguntungkan

Pujian dari Hinton, Presentasi Kontributor Inti Gemini: Akan Ada Miliaran AI Superhuman Selevel Einstein di Masa Depan

Teknologi Baru DeepSeek Diterapkan ke Chip Apple, Model Besar Lokal Mac Dipercepat 60%

Karpathy Kembali Menjadi Legenda, Guncangkan RAG, Ubah Catatan Anda Menjadi Otak Kedua

BURUAN, Claude 5 Versi Pekerja Telah Tiba, Semua Orang Bisa Menggunakannya

Tepat Saat Ini, Anthropic Meluncurkan Sonnet 5, Kinerja Mendekati Opus 4.8, Tetapi Belum Tentu Lebih Murah

Kategori Populer

Tag Populer

Kebijakan Regulasi