# Artikel Terkait Sumber Terbuka

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Sumber Terbuka", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Penelitian terbaru dari Mila, Universitas Cornell, dan Universitas Montreal mengajukan pertanyaan mendasar: "Bagaimana jika, tanpa menambahkan satu parameter pun, kita hanya menggeser posisi parameter yang sudah ada dalam model?" Ini menyoroti asumsi implisit pada hampir semua model bahasa berbasis Transformer sejak 2017: semua lapisan mendapatkan alokasi parameter yang sama rata. Eksperimen dengan model 440M parameter membuktikan bahwa mengalokasikan lebih banyak kapasitas (lebar jaringan feed-forward) ke lapisan awal dan mengurangi di lapisan akhir—tanpa mengubah total parameter atau FLOPs—secara signifikan meningkatkan kinerja. Pendekatan ini, yang disebut **Tapered Language Models (TLMs)**, mengubah distribusi parameter dari persegi panjang menjadi berbentuk baji dengan pola menurun. Dari tiga pola penurunan yang diuji (linier, cosinus, sigmoid), pola **penurunan cosinus** terbukti paling optimal. Pada model 440M parameter, metode ini menurunkan nilai perplexity dari 16.28 menjadi 14.44—peningkatan 1.84 poin yang "gratis". Keunggulan ini konsisten diuji pada empat arsitektur model berbeda (termasuk yang menggunakan mekanisme gating dan memori) pada skala 760M dan 1.3B parameter. Analisis mendalam menunjukkan alasan di balik efektivitasnya: lapisan awal lebih banyak melakukan pemrosesan dan penciptaan informasi baru, sementara lapisan dalam cenderung hanya mengulang atau memperkuat sinyal yang sudah ada. Dengan demikian, menggeser kapasitas ke depan adalah alokasi sumber daya yang lebih cerdas. Implikasi penelitian ini luas dan efisien. Daripada hanya bersaing menambah parameter atau membuat arsitektur lebih jarang, industri AI memiliki "tuas gratis" tersembunyi dengan hanya mengoptimalkan **bentuk** distribusi parameter internal model, tanpa biaya komputasi tambahan. Konsep ini berpotensi diterapkan tidak hanya pada LLM, tetapi juga pada model vision Transformer, difusi, dan multimodal.

marsbit19j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

marsbit19j yang lalu

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

Seseorang pengembang individu berhasil masuk ke peringkat teratas Hugging Face Models Trending di tengah perusahaan-perusahaan besar. Dua modelnya, yang dikembangkan dari Gemma4-12B dengan format GGUF, mengungguli model dari perusahaan seperti Zhipu (GLM-5.2) dan Baidu (Unlimited-OCR), dengan total unduhan melebihi 700 ribu. Model tersebut adalah luyuxin-gemma-4-12b-it-reasoning-v1 (Coder) dan v2 (agentic). Mereka dirancang untuk berjalan secara lokal dengan sumber daya rendah (mulai 4.5GB memori), menawarkan kemampuan pemrograman dan penalaran yang didistilasi dari data Fable 5 dan Composer 2.5. Penekanannya adalah pada privasi dan akses gratis. Penulisnya, Lu Yuxin, adalah seorang mahasiswa pascasarjana AI yang membiayai proyek ini secara mandiri. Ia menghabiskan 40 jam lebih untuk pemrosesan data dan pelatihan menggunakan satu RTX 5090. Menurutnya, kunci keberhasilannya adalah fokus pada kualitas data dan menyelesaikan masalah spesifik pengguna secara tulus, berbeda dengan tujuan perusahaan besar yang lebih luas. Ia juga menekankan pentingnya kejujuran tentang kemampuan model dan ketekunan menghadapi tantangan dalam proyek sumber terbuka.

marsbit2 hari yang lalu 01:55

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

marsbit2 hari yang lalu 01:55

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Penulis: Xiao Jing, Editor: Xu Qingyang Pada akhir Juni 2026, pemerintah AS melakukan intervensi langsung terhadap model AI terdepan. Anthropic harus menarik model Fable 5 dan Mythos 5, sementara OpenAI meluncurkan GPT-5.6 dengan akses API terbatas hanya untuk mitra yang disetujui pemerintah. Proses ini menciptakan siklus "hentikan – negosiasi – izin bersyarat" dalam waktu kurang dari sebulan. Inti masalahnya adalah apakah model-model ini benar-benar terlalu kuat dan berbahaya. OpenAI dan Anthropic menyatakan, berdasarkan kerangka keamanan mereka sendiri, model-model ini tidak melewati ambang batas risiko yang tidak dapat diterima. Namun, pemerintah AS, yang dianggap kurang memiliki keahlian teknis di bidang AI terdepan, tetap memberlakukan pembatasan. Keputusan ini didorong oleh beberapa faktor: kemampuan model yang dapat didemonstrasikan, laporan keamanan dari pesaing (seperti Amazon), dan perintah eksekutif AI baru dari Presiden Trump yang membutuhkan contoh penegakan hukum. Situasi ini mengingatkan pada "Perang Kripto" tahun 1990-an, di mana pemerintah AS berusaha membatasi ekspor algoritma enkripsi kuat dengan alasan keamanan nasional. Upaya itu akhirnya gagal karena teknologi menyebar secara global, dan pembatasan justru merugikan perusahaan AS. Para ahli memperingatkan bahwa pembatasan serupa pada model AI dapat menghambat inovasi, mengganggu logika investasi industri, dan memperlambat difusi teknologi yang penting untuk keunggulan kompetitif jangka panjang. Dean W. Ball, mantan penasihat AI Gedung Putih, mengkritik proses persetujuan yang tidak transparan, tanpa standar jelas, dan tidak memiliki batas waktu. Dia memperingatkan bahwa jika hanya segelintir orang dan lembaga yang memiliki akses ke AI terdepan, hal itu justru dapat meningkatkan risiko konsentrasi kekuasaan. Sementara itu, model AI China terus berkembang dengan pendekatan sumber terbuka. Insiden Juni 2026 ini mungkin menandai dimulainya era di mana pemerintah AS menjadi gerbang wajib untuk peluncuran model AI terdepan, mengubah dinamika industri yang sebelumnya lebih terbuka.

链捕手2 hari yang lalu 15:27

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

链捕手2 hari yang lalu 15:27

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Baru-baru ini, DeepSeek V4 diperbarui dengan framework *Speculative Decoding* baru bernama **DSpark**, yang diklaim meningkatkan kecepatan inferensi hingga 80%. Pembaruan ini, yang juga disertai open-sourcing framework **DeepSpec**, berfokus pada optimasi teknikal dan peningkatan performa, bukan perubahan arsitektur model inti. DSpark mengimplementasikan **Semi-Autoregressive Generation** untuk menjaga throughput tinggi dan meningkatkan akurasi token yang dihasilkan oleh model draf (*draft model*). Inovasi utamanya adalah **Confidence-Scheduled Verification**, yaitu sistem penjadwalan yang cerdas dan adaptif. Sistem ini menggunakan *Confidence Head* untuk memperkirakan probabilitas penerimaan setiap token kandidat dan secara dinamis menyesuaikan panjang verifikasi berdasarkan beban kerja sistem (*hardware-aware*), sehingga mengalokasikan daya komputasi hanya ke token yang paling potensial. Dalam pengujian di berbagai domain (penalaran matematika, generasi kode, percakapan), DSpark menunjukkan peningkatan signifikan dibandingkan model *state-of-the-art* seperti Eagle3 dan DFlash. Pada kondisi *throughput* yang setara, DSpark meningkatkan kecepatan respons pengguna sebesar 57%-85% untuk model DeepSeek-V4 Flash dan Pro. DeepSpec, yang dirilis bersamaan, adalah *codebase* lengkap untuk melatih dan mengevaluasi model draf *speculative decoding*. Framework ini menyediakan pipeline standar (persiapan data, pelatihan, evaluasi) dan mendukung beberapa algoritma (DSpark, DFlash, Eagle3) serta model target (Qwen3, Gemma), memudahkan peneliti dan insinyur untuk mengembangkan dan menerapkan teknik percepatan inferensi pada model bahasa besar mereka sendiri.

marsbit2 hari yang lalu 08:55

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

marsbit2 hari yang lalu 08:55

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

Profesor Dawn Song (Song Xiaodong) dari UC Berkeley, yang dijuluki sebagai "tokoh keamanan komputer nomor satu", bergabung dengan laboratorium Superintelligence Meta sebagai Wakil Presiden Penelitian AI. Dia akan melapor langsung kepada kepala lab, Nat Friedman. Song adalah peneliti berpengaruh di bidang keamanan komputer dan keamanan AI, penerima MacArthur Fellowship, serta anggota ACM, IEEE, dan AAAS. Karyanya yang terkenal termasuk "Dynamic Taint Analysis" (2005). Laboratoriumnya di UC Berkeley dianggap sebagai pusat pelatihan terkemuka di bidang keamanan komputer. Penelitian Song mencakup keamanan perangkat lunak, pembelajaran mesin adversarial, dan keamanan agen AI. Dia juga pendiri Oasis Labs dan Virtue AI, perusahaan yang fokus pada infrastruktur keamanan AI untuk perusahaan, terutama pengujian penetrasi (red-teaming) otomatis dan pengaman runtime untuk agen AI. Bersama Song, pendiri Virtue AI lainnya, Bo Li dan Sanmi Koyejo, serta beberapa anggota tim, juga bergabung dengan Meta. Langkah ini dilihat sebagai upaya Meta untuk memperkuat langkah-langkah keamanan dalam pengembangan agen AI, terutama setelah masalah keamanan model AI seperti Anthropic's mythos menarik perhatian industri. Meta ingin menerapkan AI ke dalam produk-produk sosialnya yang digunakan miliaran orang dan terus mengedepankan strategi sumber terbuka, sehingga membutuhkan kemampuan keamanan yang tangguh. Artikel ini juga menyebutkan bahwa Denny Zhou, pendiri Gemini Reasoning Team di Google, dilaporkan telah bergabung dengan Meta TBDLab beberapa bulan sebelumnya. Zhou adalah tokoh kunci di bidang penalaran AI, berkontribusi pada metode seperti Chain-of-Thought dan Self-Consistency, yang membantu mengembangkan kemampuan penalaran model bahasa besar.

marsbit06/26 08:14

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

marsbit06/26 08:14

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Dengan hanya menambahkan satu baris import, NeMo AutoModel NVIDIA mempercepat fine-tuning model MoE hingga 3,7 kali lipat dan mengurangi penggunaan memori GPU sebesar 29%-32%. Solusi ini kompatibel dengan API Hugging Face Transformers v5, sehingga tidak perlu mengubah kode secara signifikan. Teknologi utamanya mencakup Expert Parallelism (EP) untuk mendistribusikan bobot ahli ke beberapa GPU, DeepEP untuk menggabungkan komputasi dan komunikasi, serta TransformerEngine untuk mempercepat operasi inti. Dalam pengujian pada model Qwen3-30B-A3B dan Nemotron 3 Nano 30B-A3B, throughput pelatihan meningkat 3,4-3,7 kali. Untuk model skala besar seperti Nemotron 3 Ultra 550B, solusi ini tetap dapat dijalankan tanpa kehabisan memori. Kode dan panduan telah tersedia open-source di GitHub NVIDIA.

marsbit06/26 07:30

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

marsbit06/26 07:30

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

Cerita tentang Justin Poehnelt, mantan karyawan Google yang dipecat setelah menciptakan alat command-line **gws** (Google Workspace CLI) yang sangat sukses, dengan 28.000 bintang di GitHub. Alat berbasis Rust ini memungkinkan pengguna mengakses seluruh layanan Workspace (Gmail, Drive, Calendar, dll.) melalui terminal. Dirancang khusus untuk AI Agent, alat ini langsung viral. Namun, dua hari sebelum pemecatannya, Google mengumumkan "CLI Workspace resmi" di konferensi Cloud Next 2026. Banyak yang menilai Google "mengambil ide" Poehnelt. Alasan resmi pemecatan adalah masalah penggunaan logo dan merek Google di repositori GitHub alat tersebut. Namun, Poehnelt yakin alasan sebenarnya adalah **ketakutan internal** bahwa alatnya—yang mengubah Workspace menjadi infrastruktur untuk AI Agent—dapat mengganggu bisnis inti Workspace. Setelah dipecat, Poehnelt langsung mendapat tawaran kerja dari sejumlah CEO perusahaan teknologi seperti Peter Steinberger (OpenClaw) dan OpenRouter. Kisah ini menyoroti paradoks inovasi di perusahaan besar.

marsbit06/26 00:23

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

marsbit06/26 00:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Pada hari Selasa, pasar perdagangan kecerdasan buatan (AI) menghadapi tekanan penjualan paling tajam tahun ini. KOREAN KOSPI sempat anjlok hampir 10%, memicu penghentian perdagangan (circuit breaker). Saham inti rantai pasokan AI global seperti Samsung Electronics dan SK Hynix terpukul berat, dan tekanan menjalar ke sesi AS dengan saham memori, penyimpanan, dan semikonduktor menjadi wilayah yang paling menderita. Beberapa analis menyebut penurunan ini sebagai "momen DeepSeek-nya Zhipu AI", mereplikasi dampak pasar dari rilis model DeepSeek awal 2025. Model open-source GLM-5.2 dari Zhipu dinilai telah masuk peringkat tiga besar model bahasa global, memicu keraguan pasar tentang dominasi AI AS dan menimbulkan pertanyaan apakah pengeluaran modal besar-besaran perusahaan teknologi AS untuk pusat data masih dapat mendukung valuasi saat ini jika model open-source yang lebih murah sudah cukup baik. Tekanan lain berasal dari meningkatnya ketidakpastian atas imbal hasil investasi AI dan ekspektasi suku bunga yang lebih tinggi. Penurunan terfokus pada perusahaan yang paling diuntungkan dari narasi infrastruktur AI, seperti hyperscaler (Alphabet, Amazon, Meta) yang masih berencana mengeluarkan ratusan miliar dolar. Kekhawatiran juga muncul seiring meningkatnya ketergantungan pendanaan infrastruktur AI pada utang, seperti yang diilustrasikan oleh rencana penerbitan obligasi SpaceX. Meski demikian, banyak analis melihat ini sebagai koreksi yang diperlukan setelah kenaikan berlebihan dan "pemeriksaan realitas" dalam perdagangan teknologi, bukan akhir dari cerita AI. Pertanyaan inti beralih dari "apakah AI akan tumbuh" menjadi "apakah harga yang dibayar untuk pertumbuhan itu terlalu tinggi", menekankan pada kemampuan perusahaan mengubah pengeluaran modal menjadi arus kas dan keberlanjutan valuasi. Laporan keuangan Micron yang akan datang dipandang sebagai tolok ukur kunci untuk kesehatan rantai pasokan perangkat keras.

marsbit06/24 02:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

marsbit06/24 02:23

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

"Bapak AGI" Ben Goertzel percaya masa depan kecerdasan buatan bergantung pada blockchain. Ia berpendapat bahwa Kecerdasan Umum Buatan (AGI) terlalu penting untuk dikendalikan oleh perusahaan terpusat atau modal ventura. Solusinya adalah membuat kode inti AGI menjadi sumber terbuka dan dijalankan pada jaringan komputasi terdesentralisasi, bukan di server milik korporasi. Goertzel mengkritik perusahaan seperti OpenAI dan Anthropic yang beralih dari prinsip keterbukaan menjadi tertutup. Melalui proyek SingularityNET dan Artificial Superintelligence Alliance, ia membangun ekonomi agen AI di atas blockchain, di mana agen-agen dapat beroperasi dan bertransaksi secara mandiri. Ini dianggapnya sebagai cara untuk mencegah monopoli AGI dan ketimpangan yang lebih besar. Rencananya adalah menyediakan AGI yang lebih cerdas melalui layanan berbayar untuk bisnis, dengan backend terdesentralisasi. Goertzel memperkirakan AGI setara manusia akan terwaktu sekitar tahun 2029. Uji pertamanya adalah peluncuran "Agent Omega Claw" dalam beberapa minggu ke depan, yang bertujuan membantu pengguna mengelola hidup dan menghasilkan uang melalui agen AI pribadi mereka.

Foresight News06/22 12:12

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

Foresight News06/22 12:12

Sistem Terbuka Akan Menang: Mengapa Ethereum Adalah Linux Berikutnya?

Etherealize menulis tentang bagaimana sistem terbuka tanpa izin akhirnya menang atas sistem tertutup, dan mengapa Ethereum dipandang sebagai Linux berikutnya. Artikel ini menarik paralel antara sejarah internet dan Linux dengan perkembangan blockchain. Pada 1990-an, banyak yang meragukan internet terbuka akan mengalahkan jaringan pribadi perusahaan seperti yang dibayangkan Microsoft. Namun, kenyataannya, internet dan Linux, yang dikembangkan secara terbuka oleh komunitas global ("model pasar"), terbukti lebih inovatif dan tangguh daripada sistem tertutup ("model katedral"). Prinsip yang sama berlaku untuk infrastruktur keuangan. Blockchain pribadi atau konsorsium (seperti yang pernah dicoba bank) menawarkan kecepatan dan kontrol jangka pendek, tetapi memiliki kelemahan: risiko platform di mana operator dapat bertentangan dengan pengguna, dan ketidakmampuan untuk mengikuti inovasi sistem tanpa izin. Ethereum, seperti Linux, dibangun berdasarkan **netralitas tepercaya**: aturannya transparan, berlaku sama untuk semua, sulit diubah, dan siapa pun dapat berpartisipasi. Ini menarik pengembang (lebih dari 1 juta hingga saat ini) dan institusi besar. Keunggulan Ethereum berasal dari desentralisasi yang mendalam dan sejarah uniknya (mis., transisi dari Proof-of-Work), yang tidak dapat dengan mudah disalin. Robinhood, BlackRock, JPMorgan, dan perusahaan terkemuka lainnya membangun di atas Ethereum atau lapisan-2-nya karena keamanan, ekosistem yang matang, dan sifatnya yang netral. Sementara solusi tertutup seperti SWIFT atau Visa dapat memblokir peserta, Ethereum menawarkan fondasi penyelesaian global yang independen dan dapat diandalkan. Tantangan regulasi tentang akuntabilitas dijawab di lapisan aplikasi (mis., melalui token dengan KYC bawaan), bukan di lapisan penyelesaian. Kesimpulannya, masa depan infrastruktur keuangan terletak pada membangun di atas sistem terbuka seperti Ethereum, bukan mencoba bersaing atau menciptakan yang tertutup.

Foresight News06/22 10:31

Sistem Terbuka Akan Menang: Mengapa Ethereum Adalah Linux Berikutnya?

Foresight News06/22 10:31

# Artikel Terkait Sumber Terbuka

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Peringkat TOP Model di Hugging Face, Sekarang Saya Hanya Tunduk kepada yuxinlu1

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

NVIDIA Merilis MoE Baru: Tambah Satu Baris 'import', Kecepatan Fine-tuning Meningkat 3.7x

Penulis Fenomenal dengan 28 Ribu Bintang Justru Dipecat Google, Bos-Bos Silicon Valley Langsung Buru Orang

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Mengapa "AGI教父" Ben Goertzel Percaya Masa Depan Kecerdasan Buatan Bergantung pada Blockchain?

Sistem Terbuka Akan Menang: Mengapa Ethereum Adalah Linux Berikutnya?

Kategori Populer

Tag Populer