# Artikel Terkait Sumber Terbuka

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Sumber Terbuka", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

**Ringkasan: "MopMonk" - "Biksu Penyapu" Misterius dari China Masuk 7 Besar Dunia di CyberGym** Sebuah entitas AI misterius asal China bernama **MopMonk** (dalam bahasa Indonesia: "Biksu Penyapu") tiba-tiba muncul dan menempati peringkat **ketujuh dunia** di papan peringkat benchmark keamanan siber **CyberGym**, yang dibuat oleh UC Berkeley. Dengan tingkat keberhasilan **73.1%**, skor MopMonk hanya sedikit di belakang raksasa AI seperti OpenAI dan mencetak rekor tertinggi baru untuk tim China di papan peringkat tersebut. Yang membuat heboh adalah tidak adanya informasi tentang tim di baliknya: tidak ada situs web, konferensi pers, atau pengungkapan identitas. CyberGym dianggap sebagai "Olimpiade" untuk kemampuan keamanan AI, mengevaluasi model dengan 1507 contoh kerentanan nyata dari proyek sumber terbuka besar. Benchmark ini menguji bukan hanya pemahaman, tetapi kemampuan **Agent AI untuk benar-benar mengeksekusi**—yaitu menghasilkan bukti konsep (PoC) yang dapat memicu kerentanan dalam lingkungan tertutup. MopMonk diketahui menggunakan model dasar **MiniMax M3**, model open-source dari Shanghai yang terkenal dengan kemampuan pemrograman, konteks panjang (1M token), dan multimodalitas. Kunci kesuksesannya diduga terletak pada **kerangka kerja Agent (Harness)** yang dirancang khusus untuk penemuan kerentanan. Kerangka kerja ini memiliki tiga inti: 1. **Memori Terstruktur untuk Kerentanan:** Menyimpan fakta tugas seperti target, jalur kode, dan kendala untuk percobaan berikutnya. 2. **Eksplorasi Berbasis Memori:** Setiap percobaan baru belajar dari memori sebelumnya, menghindari pengulangan dan meningkatkan efisiensi. 3. **Eksplorasi Paralel Multi-Agent:** Beberapa upaya eksplorasi berbagi memori yang sama, memperluas cakupan investigasi. Prestasi MopMonk menunjukkan pergeseran penting: dalam tugas keamanan dunia nyata, **kualitas rekayasa Agent (Harness)** yang mengoordinasikan eksekusi sering kali lebih krusial daripada sekadar "menumpuk parameter" pada model dasar. Meskipun identitasnya masih menjadi misteri, kombinasi nama bernuansa武侠 (cerita silat China), model dasar MiniMax, dan keahlian keamanan yang mendalam mengarah pada spekulasi kuat bahwa ini adalah tim keamanan AI dari China, kemungkinan berbasis di Shanghai.

marsbit2j yang lalu

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

marsbit2j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Penelitian terbaru dari Mila, Universitas Cornell, dan Universitas Montreal mengajukan pertanyaan mendasar: "Bagaimana jika, tanpa menambahkan satu parameter pun, kita hanya menggeser posisi parameter yang sudah ada dalam model?" Ini menyoroti asumsi implisit pada hampir semua model bahasa berbasis Transformer sejak 2017: semua lapisan mendapatkan alokasi parameter yang sama rata. Eksperimen dengan model 440M parameter membuktikan bahwa mengalokasikan lebih banyak kapasitas (lebar jaringan feed-forward) ke lapisan awal dan mengurangi di lapisan akhir—tanpa mengubah total parameter atau FLOPs—secara signifikan meningkatkan kinerja. Pendekatan ini, yang disebut **Tapered Language Models (TLMs)**, mengubah distribusi parameter dari persegi panjang menjadi berbentuk baji dengan pola menurun. Dari tiga pola penurunan yang diuji (linier, cosinus, sigmoid), pola **penurunan cosinus** terbukti paling optimal. Pada model 440M parameter, metode ini menurunkan nilai perplexity dari 16.28 menjadi 14.44—peningkatan 1.84 poin yang "gratis". Keunggulan ini konsisten diuji pada empat arsitektur model berbeda (termasuk yang menggunakan mekanisme gating dan memori) pada skala 760M dan 1.3B parameter. Analisis mendalam menunjukkan alasan di balik efektivitasnya: lapisan awal lebih banyak melakukan pemrosesan dan penciptaan informasi baru, sementara lapisan dalam cenderung hanya mengulang atau memperkuat sinyal yang sudah ada. Dengan demikian, menggeser kapasitas ke depan adalah alokasi sumber daya yang lebih cerdas. Implikasi penelitian ini luas dan efisien. Daripada hanya bersaing menambah parameter atau membuat arsitektur lebih jarang, industri AI memiliki "tuas gratis" tersembunyi dengan hanya mengoptimalkan **bentuk** distribusi parameter internal model, tanpa biaya komputasi tambahan. Konsep ini berpotensi diterapkan tidak hanya pada LLM, tetapi juga pada model vision Transformer, difusi, dan multimodal.

marsbit21j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

marsbit21j yang lalu

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

Seseorang pengembang individu berhasil masuk ke peringkat teratas Hugging Face Models Trending di tengah perusahaan-perusahaan besar. Dua modelnya, yang dikembangkan dari Gemma4-12B dengan format GGUF, mengungguli model dari perusahaan seperti Zhipu (GLM-5.2) dan Baidu (Unlimited-OCR), dengan total unduhan melebihi 700 ribu. Model tersebut adalah luyuxin-gemma-4-12b-it-reasoning-v1 (Coder) dan v2 (agentic). Mereka dirancang untuk berjalan secara lokal dengan sumber daya rendah (mulai 4.5GB memori), menawarkan kemampuan pemrograman dan penalaran yang didistilasi dari data Fable 5 dan Composer 2.5. Penekanannya adalah pada privasi dan akses gratis. Penulisnya, Lu Yuxin, adalah seorang mahasiswa pascasarjana AI yang membiayai proyek ini secara mandiri. Ia menghabiskan 40 jam lebih untuk pemrosesan data dan pelatihan menggunakan satu RTX 5090. Menurutnya, kunci keberhasilannya adalah fokus pada kualitas data dan menyelesaikan masalah spesifik pengguna secara tulus, berbeda dengan tujuan perusahaan besar yang lebih luas. Ia juga menekankan pentingnya kejujuran tentang kemampuan model dan ketekunan menghadapi tantangan dalam proyek sumber terbuka.

marsbit2 hari yang lalu 01:55

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

marsbit2 hari yang lalu 01:55

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Penulis: Xiao Jing, Editor: Xu Qingyang Pada akhir Juni 2026, pemerintah AS melakukan intervensi langsung terhadap model AI terdepan. Anthropic harus menarik model Fable 5 dan Mythos 5, sementara OpenAI meluncurkan GPT-5.6 dengan akses API terbatas hanya untuk mitra yang disetujui pemerintah. Proses ini menciptakan siklus "hentikan – negosiasi – izin bersyarat" dalam waktu kurang dari sebulan. Inti masalahnya adalah apakah model-model ini benar-benar terlalu kuat dan berbahaya. OpenAI dan Anthropic menyatakan, berdasarkan kerangka keamanan mereka sendiri, model-model ini tidak melewati ambang batas risiko yang tidak dapat diterima. Namun, pemerintah AS, yang dianggap kurang memiliki keahlian teknis di bidang AI terdepan, tetap memberlakukan pembatasan. Keputusan ini didorong oleh beberapa faktor: kemampuan model yang dapat didemonstrasikan, laporan keamanan dari pesaing (seperti Amazon), dan perintah eksekutif AI baru dari Presiden Trump yang membutuhkan contoh penegakan hukum. Situasi ini mengingatkan pada "Perang Kripto" tahun 1990-an, di mana pemerintah AS berusaha membatasi ekspor algoritma enkripsi kuat dengan alasan keamanan nasional. Upaya itu akhirnya gagal karena teknologi menyebar secara global, dan pembatasan justru merugikan perusahaan AS. Para ahli memperingatkan bahwa pembatasan serupa pada model AI dapat menghambat inovasi, mengganggu logika investasi industri, dan memperlambat difusi teknologi yang penting untuk keunggulan kompetitif jangka panjang. Dean W. Ball, mantan penasihat AI Gedung Putih, mengkritik proses persetujuan yang tidak transparan, tanpa standar jelas, dan tidak memiliki batas waktu. Dia memperingatkan bahwa jika hanya segelintir orang dan lembaga yang memiliki akses ke AI terdepan, hal itu justru dapat meningkatkan risiko konsentrasi kekuasaan. Sementara itu, model AI China terus berkembang dengan pendekatan sumber terbuka. Insiden Juni 2026 ini mungkin menandai dimulainya era di mana pemerintah AS menjadi gerbang wajib untuk peluncuran model AI terdepan, mengubah dinamika industri yang sebelumnya lebih terbuka.

链捕手2 hari yang lalu 15:27

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

链捕手2 hari yang lalu 15:27

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Baru-baru ini, DeepSeek V4 diperbarui dengan framework *Speculative Decoding* baru bernama **DSpark**, yang diklaim meningkatkan kecepatan inferensi hingga 80%. Pembaruan ini, yang juga disertai open-sourcing framework **DeepSpec**, berfokus pada optimasi teknikal dan peningkatan performa, bukan perubahan arsitektur model inti. DSpark mengimplementasikan **Semi-Autoregressive Generation** untuk menjaga throughput tinggi dan meningkatkan akurasi token yang dihasilkan oleh model draf (*draft model*). Inovasi utamanya adalah **Confidence-Scheduled Verification**, yaitu sistem penjadwalan yang cerdas dan adaptif. Sistem ini menggunakan *Confidence Head* untuk memperkirakan probabilitas penerimaan setiap token kandidat dan secara dinamis menyesuaikan panjang verifikasi berdasarkan beban kerja sistem (*hardware-aware*), sehingga mengalokasikan daya komputasi hanya ke token yang paling potensial. Dalam pengujian di berbagai domain (penalaran matematika, generasi kode, percakapan), DSpark menunjukkan peningkatan signifikan dibandingkan model *state-of-the-art* seperti Eagle3 dan DFlash. Pada kondisi *throughput* yang setara, DSpark meningkatkan kecepatan respons pengguna sebesar 57%-85% untuk model DeepSeek-V4 Flash dan Pro. DeepSpec, yang dirilis bersamaan, adalah *codebase* lengkap untuk melatih dan mengevaluasi model draf *speculative decoding*. Framework ini menyediakan pipeline standar (persiapan data, pelatihan, evaluasi) dan mendukung beberapa algoritma (DSpark, DFlash, Eagle3) serta model target (Qwen3, Gemma), memudahkan peneliti dan insinyur untuk mengembangkan dan menerapkan teknik percepatan inferensi pada model bahasa besar mereka sendiri.

marsbit06/27 08:55

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

marsbit06/27 08:55

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

Profesor Dawn Song (Song Xiaodong) dari UC Berkeley, yang dijuluki sebagai "tokoh keamanan komputer nomor satu", bergabung dengan laboratorium Superintelligence Meta sebagai Wakil Presiden Penelitian AI. Dia akan melapor langsung kepada kepala lab, Nat Friedman. Song adalah peneliti berpengaruh di bidang keamanan komputer dan keamanan AI, penerima MacArthur Fellowship, serta anggota ACM, IEEE, dan AAAS. Karyanya yang terkenal termasuk "Dynamic Taint Analysis" (2005). Laboratoriumnya di UC Berkeley dianggap sebagai pusat pelatihan terkemuka di bidang keamanan komputer. Penelitian Song mencakup keamanan perangkat lunak, pembelajaran mesin adversarial, dan keamanan agen AI. Dia juga pendiri Oasis Labs dan Virtue AI, perusahaan yang fokus pada infrastruktur keamanan AI untuk perusahaan, terutama pengujian penetrasi (red-teaming) otomatis dan pengaman runtime untuk agen AI. Bersama Song, pendiri Virtue AI lainnya, Bo Li dan Sanmi Koyejo, serta beberapa anggota tim, juga bergabung dengan Meta. Langkah ini dilihat sebagai upaya Meta untuk memperkuat langkah-langkah keamanan dalam pengembangan agen AI, terutama setelah masalah keamanan model AI seperti Anthropic's mythos menarik perhatian industri. Meta ingin menerapkan AI ke dalam produk-produk sosialnya yang digunakan miliaran orang dan terus mengedepankan strategi sumber terbuka, sehingga membutuhkan kemampuan keamanan yang tangguh. Artikel ini juga menyebutkan bahwa Denny Zhou, pendiri Gemini Reasoning Team di Google, dilaporkan telah bergabung dengan Meta TBDLab beberapa bulan sebelumnya. Zhou adalah tokoh kunci di bidang penalaran AI, berkontribusi pada metode seperti Chain-of-Thought dan Self-Consistency, yang membantu mengembangkan kemampuan penalaran model bahasa besar.

marsbit06/26 08:14

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

marsbit06/26 08:14

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Dengan hanya menambahkan satu baris import, NeMo AutoModel NVIDIA mempercepat fine-tuning model MoE hingga 3,7 kali lipat dan mengurangi penggunaan memori GPU sebesar 29%-32%. Solusi ini kompatibel dengan API Hugging Face Transformers v5, sehingga tidak perlu mengubah kode secara signifikan. Teknologi utamanya mencakup Expert Parallelism (EP) untuk mendistribusikan bobot ahli ke beberapa GPU, DeepEP untuk menggabungkan komputasi dan komunikasi, serta TransformerEngine untuk mempercepat operasi inti. Dalam pengujian pada model Qwen3-30B-A3B dan Nemotron 3 Nano 30B-A3B, throughput pelatihan meningkat 3,4-3,7 kali. Untuk model skala besar seperti Nemotron 3 Ultra 550B, solusi ini tetap dapat dijalankan tanpa kehabisan memori. Kode dan panduan telah tersedia open-source di GitHub NVIDIA.

marsbit06/26 07:30

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

marsbit06/26 07:30

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

Cerita tentang Justin Poehnelt, mantan karyawan Google yang dipecat setelah menciptakan alat command-line **gws** (Google Workspace CLI) yang sangat sukses, dengan 28.000 bintang di GitHub. Alat berbasis Rust ini memungkinkan pengguna mengakses seluruh layanan Workspace (Gmail, Drive, Calendar, dll.) melalui terminal. Dirancang khusus untuk AI Agent, alat ini langsung viral. Namun, dua hari sebelum pemecatannya, Google mengumumkan "CLI Workspace resmi" di konferensi Cloud Next 2026. Banyak yang menilai Google "mengambil ide" Poehnelt. Alasan resmi pemecatan adalah masalah penggunaan logo dan merek Google di repositori GitHub alat tersebut. Namun, Poehnelt yakin alasan sebenarnya adalah **ketakutan internal** bahwa alatnya—yang mengubah Workspace menjadi infrastruktur untuk AI Agent—dapat mengganggu bisnis inti Workspace. Setelah dipecat, Poehnelt langsung mendapat tawaran kerja dari sejumlah CEO perusahaan teknologi seperti Peter Steinberger (OpenClaw) dan OpenRouter. Kisah ini menyoroti paradoks inovasi di perusahaan besar.

marsbit06/26 00:23

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

marsbit06/26 00:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Pada hari Selasa, pasar perdagangan kecerdasan buatan (AI) menghadapi tekanan penjualan paling tajam tahun ini. KOREAN KOSPI sempat anjlok hampir 10%, memicu penghentian perdagangan (circuit breaker). Saham inti rantai pasokan AI global seperti Samsung Electronics dan SK Hynix terpukul berat, dan tekanan menjalar ke sesi AS dengan saham memori, penyimpanan, dan semikonduktor menjadi wilayah yang paling menderita. Beberapa analis menyebut penurunan ini sebagai "momen DeepSeek-nya Zhipu AI", mereplikasi dampak pasar dari rilis model DeepSeek awal 2025. Model open-source GLM-5.2 dari Zhipu dinilai telah masuk peringkat tiga besar model bahasa global, memicu keraguan pasar tentang dominasi AI AS dan menimbulkan pertanyaan apakah pengeluaran modal besar-besaran perusahaan teknologi AS untuk pusat data masih dapat mendukung valuasi saat ini jika model open-source yang lebih murah sudah cukup baik. Tekanan lain berasal dari meningkatnya ketidakpastian atas imbal hasil investasi AI dan ekspektasi suku bunga yang lebih tinggi. Penurunan terfokus pada perusahaan yang paling diuntungkan dari narasi infrastruktur AI, seperti hyperscaler (Alphabet, Amazon, Meta) yang masih berencana mengeluarkan ratusan miliar dolar. Kekhawatiran juga muncul seiring meningkatnya ketergantungan pendanaan infrastruktur AI pada utang, seperti yang diilustrasikan oleh rencana penerbitan obligasi SpaceX. Meski demikian, banyak analis melihat ini sebagai koreksi yang diperlukan setelah kenaikan berlebihan dan "pemeriksaan realitas" dalam perdagangan teknologi, bukan akhir dari cerita AI. Pertanyaan inti beralih dari "apakah AI akan tumbuh" menjadi "apakah harga yang dibayar untuk pertumbuhan itu terlalu tinggi", menekankan pada kemampuan perusahaan mengubah pengeluaran modal menjadi arus kas dan keberlanjutan valuasi. Laporan keuangan Micron yang akan datang dipandang sebagai tolok ukur kunci untuk kesehatan rantai pasokan perangkat keras.

marsbit06/24 02:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

marsbit06/24 02:23

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

"Bapak AGI" Ben Goertzel percaya masa depan kecerdasan buatan bergantung pada blockchain. Ia berpendapat bahwa Kecerdasan Umum Buatan (AGI) terlalu penting untuk dikendalikan oleh perusahaan terpusat atau modal ventura. Solusinya adalah membuat kode inti AGI menjadi sumber terbuka dan dijalankan pada jaringan komputasi terdesentralisasi, bukan di server milik korporasi. Goertzel mengkritik perusahaan seperti OpenAI dan Anthropic yang beralih dari prinsip keterbukaan menjadi tertutup. Melalui proyek SingularityNET dan Artificial Superintelligence Alliance, ia membangun ekonomi agen AI di atas blockchain, di mana agen-agen dapat beroperasi dan bertransaksi secara mandiri. Ini dianggapnya sebagai cara untuk mencegah monopoli AGI dan ketimpangan yang lebih besar. Rencananya adalah menyediakan AGI yang lebih cerdas melalui layanan berbayar untuk bisnis, dengan backend terdesentralisasi. Goertzel memperkirakan AGI setara manusia akan terwaktu sekitar tahun 2029. Uji pertamanya adalah peluncuran "Agent Omega Claw" dalam beberapa minggu ke depan, yang bertujuan membantu pengguna mengelola hidup dan menghasilkan uang melalui agen AI pribadi mereka.

Foresight News06/22 12:12

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

Foresight News06/22 12:12

# Artikel Terkait Sumber Terbuka

Tiongkok No.1, Hampir Menyamai OpenAI, “Biara Penyapu” Misterius Melesat ke Peringkat 7 Global

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

Kategori Populer

Tag Populer