# Artikel Terkait Sumber Terbuka

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Sumber Terbuka", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

**Ringkasan: "MopMonk" - "Biksu Penyapu" Misterius dari China Masuk 7 Besar Dunia di CyberGym** Sebuah entitas AI misterius asal China bernama **MopMonk** (dalam bahasa Indonesia: "Biksu Penyapu") tiba-tiba muncul dan menempati peringkat **ketujuh dunia** di papan peringkat benchmark keamanan siber **CyberGym**, yang dibuat oleh UC Berkeley. Dengan tingkat keberhasilan **73.1%**, skor MopMonk hanya sedikit di belakang raksasa AI seperti OpenAI dan mencetak rekor tertinggi baru untuk tim China di papan peringkat tersebut. Yang membuat heboh adalah tidak adanya informasi tentang tim di baliknya: tidak ada situs web, konferensi pers, atau pengungkapan identitas. CyberGym dianggap sebagai "Olimpiade" untuk kemampuan keamanan AI, mengevaluasi model dengan 1507 contoh kerentanan nyata dari proyek sumber terbuka besar. Benchmark ini menguji bukan hanya pemahaman, tetapi kemampuan **Agent AI untuk benar-benar mengeksekusi**—yaitu menghasilkan bukti konsep (PoC) yang dapat memicu kerentanan dalam lingkungan tertutup. MopMonk diketahui menggunakan model dasar **MiniMax M3**, model open-source dari Shanghai yang terkenal dengan kemampuan pemrograman, konteks panjang (1M token), dan multimodalitas. Kunci kesuksesannya diduga terletak pada **kerangka kerja Agent (Harness)** yang dirancang khusus untuk penemuan kerentanan. Kerangka kerja ini memiliki tiga inti: 1. **Memori Terstruktur untuk Kerentanan:** Menyimpan fakta tugas seperti target, jalur kode, dan kendala untuk percobaan berikutnya. 2. **Eksplorasi Berbasis Memori:** Setiap percobaan baru belajar dari memori sebelumnya, menghindari pengulangan dan meningkatkan efisiensi. 3. **Eksplorasi Paralel Multi-Agent:** Beberapa upaya eksplorasi berbagi memori yang sama, memperluas cakupan investigasi. Prestasi MopMonk menunjukkan pergeseran penting: dalam tugas keamanan dunia nyata, **kualitas rekayasa Agent (Harness)** yang mengoordinasikan eksekusi sering kali lebih krusial daripada sekadar "menumpuk parameter" pada model dasar. Meskipun identitasnya masih menjadi misteri, kombinasi nama bernuansa武侠 (cerita silat China), model dasar MiniMax, dan keahlian keamanan yang mendalam mengarah pada spekulasi kuat bahwa ini adalah tim keamanan AI dari China, kemungkinan berbasis di Shanghai.

marsbit1j yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

marsbit1j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Penelitian terbaru dari Mila, Universitas Cornell, dan Universitas Montreal mengajukan pertanyaan mendasar: "Bagaimana jika, tanpa menambahkan satu parameter pun, kita hanya menggeser posisi parameter yang sudah ada dalam model?" Ini menyoroti asumsi implisit pada hampir semua model bahasa berbasis Transformer sejak 2017: semua lapisan mendapatkan alokasi parameter yang sama rata. Eksperimen dengan model 440M parameter membuktikan bahwa mengalokasikan lebih banyak kapasitas (lebar jaringan feed-forward) ke lapisan awal dan mengurangi di lapisan akhir—tanpa mengubah total parameter atau FLOPs—secara signifikan meningkatkan kinerja. Pendekatan ini, yang disebut **Tapered Language Models (TLMs)**, mengubah distribusi parameter dari persegi panjang menjadi berbentuk baji dengan pola menurun. Dari tiga pola penurunan yang diuji (linier, cosinus, sigmoid), pola **penurunan cosinus** terbukti paling optimal. Pada model 440M parameter, metode ini menurunkan nilai perplexity dari 16.28 menjadi 14.44—peningkatan 1.84 poin yang "gratis". Keunggulan ini konsisten diuji pada empat arsitektur model berbeda (termasuk yang menggunakan mekanisme gating dan memori) pada skala 760M dan 1.3B parameter. Analisis mendalam menunjukkan alasan di balik efektivitasnya: lapisan awal lebih banyak melakukan pemrosesan dan penciptaan informasi baru, sementara lapisan dalam cenderung hanya mengulang atau memperkuat sinyal yang sudah ada. Dengan demikian, menggeser kapasitas ke depan adalah alokasi sumber daya yang lebih cerdas. Implikasi penelitian ini luas dan efisien. Daripada hanya bersaing menambah parameter atau membuat arsitektur lebih jarang, industri AI memiliki "tuas gratis" tersembunyi dengan hanya mengoptimalkan **bentuk** distribusi parameter internal model, tanpa biaya komputasi tambahan. Konsep ini berpotensi diterapkan tidak hanya pada LLM, tetapi juga pada model vision Transformer, difusi, dan multimodal.

marsbit20j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

marsbit20j yang lalu

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Penulis: Xiao Jing, Editor: Xu Qingyang Pada akhir Juni 2026, pemerintah AS melakukan intervensi langsung terhadap model AI terdepan. Anthropic harus menarik model Fable 5 dan Mythos 5, sementara OpenAI meluncurkan GPT-5.6 dengan akses API terbatas hanya untuk mitra yang disetujui pemerintah. Proses ini menciptakan siklus "hentikan – negosiasi – izin bersyarat" dalam waktu kurang dari sebulan. Inti masalahnya adalah apakah model-model ini benar-benar terlalu kuat dan berbahaya. OpenAI dan Anthropic menyatakan, berdasarkan kerangka keamanan mereka sendiri, model-model ini tidak melewati ambang batas risiko yang tidak dapat diterima. Namun, pemerintah AS, yang dianggap kurang memiliki keahlian teknis di bidang AI terdepan, tetap memberlakukan pembatasan. Keputusan ini didorong oleh beberapa faktor: kemampuan model yang dapat didemonstrasikan, laporan keamanan dari pesaing (seperti Amazon), dan perintah eksekutif AI baru dari Presiden Trump yang membutuhkan contoh penegakan hukum. Situasi ini mengingatkan pada "Perang Kripto" tahun 1990-an, di mana pemerintah AS berusaha membatasi ekspor algoritma enkripsi kuat dengan alasan keamanan nasional. Upaya itu akhirnya gagal karena teknologi menyebar secara global, dan pembatasan justru merugikan perusahaan AS. Para ahli memperingatkan bahwa pembatasan serupa pada model AI dapat menghambat inovasi, mengganggu logika investasi industri, dan memperlambat difusi teknologi yang penting untuk keunggulan kompetitif jangka panjang. Dean W. Ball, mantan penasihat AI Gedung Putih, mengkritik proses persetujuan yang tidak transparan, tanpa standar jelas, dan tidak memiliki batas waktu. Dia memperingatkan bahwa jika hanya segelintir orang dan lembaga yang memiliki akses ke AI terdepan, hal itu justru dapat meningkatkan risiko konsentrasi kekuasaan. Sementara itu, model AI China terus berkembang dengan pendekatan sumber terbuka. Insiden Juni 2026 ini mungkin menandai dimulainya era di mana pemerintah AS menjadi gerbang wajib untuk peluncuran model AI terdepan, mengubah dinamika industri yang sebelumnya lebih terbuka.

链捕手2 hari yang lalu 15:27

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

链捕手2 hari yang lalu 15:27

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Baru-baru ini, DeepSeek V4 diperbarui dengan framework *Speculative Decoding* baru bernama **DSpark**, yang diklaim meningkatkan kecepatan inferensi hingga 80%. Pembaruan ini, yang juga disertai open-sourcing framework **DeepSpec**, berfokus pada optimasi teknikal dan peningkatan performa, bukan perubahan arsitektur model inti. DSpark mengimplementasikan **Semi-Autoregressive Generation** untuk menjaga throughput tinggi dan meningkatkan akurasi token yang dihasilkan oleh model draf (*draft model*). Inovasi utamanya adalah **Confidence-Scheduled Verification**, yaitu sistem penjadwalan yang cerdas dan adaptif. Sistem ini menggunakan *Confidence Head* untuk memperkirakan probabilitas penerimaan setiap token kandidat dan secara dinamis menyesuaikan panjang verifikasi berdasarkan beban kerja sistem (*hardware-aware*), sehingga mengalokasikan daya komputasi hanya ke token yang paling potensial. Dalam pengujian di berbagai domain (penalaran matematika, generasi kode, percakapan), DSpark menunjukkan peningkatan signifikan dibandingkan model *state-of-the-art* seperti Eagle3 dan DFlash. Pada kondisi *throughput* yang setara, DSpark meningkatkan kecepatan respons pengguna sebesar 57%-85% untuk model DeepSeek-V4 Flash dan Pro. DeepSpec, yang dirilis bersamaan, adalah *codebase* lengkap untuk melatih dan mengevaluasi model draf *speculative decoding*. Framework ini menyediakan pipeline standar (persiapan data, pelatihan, evaluasi) dan mendukung beberapa algoritma (DSpark, DFlash, Eagle3) serta model target (Qwen3, Gemma), memudahkan peneliti dan insinyur untuk mengembangkan dan menerapkan teknik percepatan inferensi pada model bahasa besar mereka sendiri.

marsbit06/27 08:55

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

marsbit06/27 08:55

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

Profesor Dawn Song (Song Xiaodong) dari UC Berkeley, yang dijuluki sebagai "tokoh keamanan komputer nomor satu", bergabung dengan laboratorium Superintelligence Meta sebagai Wakil Presiden Penelitian AI. Dia akan melapor langsung kepada kepala lab, Nat Friedman. Song adalah peneliti berpengaruh di bidang keamanan komputer dan keamanan AI, penerima MacArthur Fellowship, serta anggota ACM, IEEE, dan AAAS. Karyanya yang terkenal termasuk "Dynamic Taint Analysis" (2005). Laboratoriumnya di UC Berkeley dianggap sebagai pusat pelatihan terkemuka di bidang keamanan komputer. Penelitian Song mencakup keamanan perangkat lunak, pembelajaran mesin adversarial, dan keamanan agen AI. Dia juga pendiri Oasis Labs dan Virtue AI, perusahaan yang fokus pada infrastruktur keamanan AI untuk perusahaan, terutama pengujian penetrasi (red-teaming) otomatis dan pengaman runtime untuk agen AI. Bersama Song, pendiri Virtue AI lainnya, Bo Li dan Sanmi Koyejo, serta beberapa anggota tim, juga bergabung dengan Meta. Langkah ini dilihat sebagai upaya Meta untuk memperkuat langkah-langkah keamanan dalam pengembangan agen AI, terutama setelah masalah keamanan model AI seperti Anthropic's mythos menarik perhatian industri. Meta ingin menerapkan AI ke dalam produk-produk sosialnya yang digunakan miliaran orang dan terus mengedepankan strategi sumber terbuka, sehingga membutuhkan kemampuan keamanan yang tangguh. Artikel ini juga menyebutkan bahwa Denny Zhou, pendiri Gemini Reasoning Team di Google, dilaporkan telah bergabung dengan Meta TBDLab beberapa bulan sebelumnya. Zhou adalah tokoh kunci di bidang penalaran AI, berkontribusi pada metode seperti Chain-of-Thought dan Self-Consistency, yang membantu mengembangkan kemampuan penalaran model bahasa besar.

marsbit06/26 08:14

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

marsbit06/26 08:14

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Pada hari Selasa, pasar perdagangan kecerdasan buatan (AI) menghadapi tekanan penjualan paling tajam tahun ini. KOREAN KOSPI sempat anjlok hampir 10%, memicu penghentian perdagangan (circuit breaker). Saham inti rantai pasokan AI global seperti Samsung Electronics dan SK Hynix terpukul berat, dan tekanan menjalar ke sesi AS dengan saham memori, penyimpanan, dan semikonduktor menjadi wilayah yang paling menderita. Beberapa analis menyebut penurunan ini sebagai "momen DeepSeek-nya Zhipu AI", mereplikasi dampak pasar dari rilis model DeepSeek awal 2025. Model open-source GLM-5.2 dari Zhipu dinilai telah masuk peringkat tiga besar model bahasa global, memicu keraguan pasar tentang dominasi AI AS dan menimbulkan pertanyaan apakah pengeluaran modal besar-besaran perusahaan teknologi AS untuk pusat data masih dapat mendukung valuasi saat ini jika model open-source yang lebih murah sudah cukup baik. Tekanan lain berasal dari meningkatnya ketidakpastian atas imbal hasil investasi AI dan ekspektasi suku bunga yang lebih tinggi. Penurunan terfokus pada perusahaan yang paling diuntungkan dari narasi infrastruktur AI, seperti hyperscaler (Alphabet, Amazon, Meta) yang masih berencana mengeluarkan ratusan miliar dolar. Kekhawatiran juga muncul seiring meningkatnya ketergantungan pendanaan infrastruktur AI pada utang, seperti yang diilustrasikan oleh rencana penerbitan obligasi SpaceX. Meski demikian, banyak analis melihat ini sebagai koreksi yang diperlukan setelah kenaikan berlebihan dan "pemeriksaan realitas" dalam perdagangan teknologi, bukan akhir dari cerita AI. Pertanyaan inti beralih dari "apakah AI akan tumbuh" menjadi "apakah harga yang dibayar untuk pertumbuhan itu terlalu tinggi", menekankan pada kemampuan perusahaan mengubah pengeluaran modal menjadi arus kas dan keberlanjutan valuasi. Laporan keuangan Micron yang akan datang dipandang sebagai tolok ukur kunci untuk kesehatan rantai pasokan perangkat keras.

marsbit06/24 02:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

marsbit06/24 02:23

活动图片