# Artikel Terkait Sumber Terbuka

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Sumber Terbuka", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

Penelitian terbaru dari Mila, Universitas Cornell, dan Universitas Montreal mengajukan pertanyaan mendasar: "Bagaimana jika, tanpa menambahkan satu parameter pun, kita hanya menggeser posisi parameter yang sudah ada dalam model?" Ini menyoroti asumsi implisit pada hampir semua model bahasa berbasis Transformer sejak 2017: semua lapisan mendapatkan alokasi parameter yang sama rata. Eksperimen dengan model 440M parameter membuktikan bahwa mengalokasikan lebih banyak kapasitas (lebar jaringan feed-forward) ke lapisan awal dan mengurangi di lapisan akhir—tanpa mengubah total parameter atau FLOPs—secara signifikan meningkatkan kinerja. Pendekatan ini, yang disebut **Tapered Language Models (TLMs)**, mengubah distribusi parameter dari persegi panjang menjadi berbentuk baji dengan pola menurun. Dari tiga pola penurunan yang diuji (linier, cosinus, sigmoid), pola **penurunan cosinus** terbukti paling optimal. Pada model 440M parameter, metode ini menurunkan nilai perplexity dari 16.28 menjadi 14.44—peningkatan 1.84 poin yang "gratis". Keunggulan ini konsisten diuji pada empat arsitektur model berbeda (termasuk yang menggunakan mekanisme gating dan memori) pada skala 760M dan 1.3B parameter. Analisis mendalam menunjukkan alasan di balik efektivitasnya: lapisan awal lebih banyak melakukan pemrosesan dan penciptaan informasi baru, sementara lapisan dalam cenderung hanya mengulang atau memperkuat sinyal yang sudah ada. Dengan demikian, menggeser kapasitas ke depan adalah alokasi sumber daya yang lebih cerdas. Implikasi penelitian ini luas dan efisien. Daripada hanya bersaing menambah parameter atau membuat arsitektur lebih jarang, industri AI memiliki "tuas gratis" tersembunyi dengan hanya mengoptimalkan **bentuk** distribusi parameter internal model, tanpa biaya komputasi tambahan. Konsep ini berpotensi diterapkan tidak hanya pada LLM, tetapi juga pada model vision Transformer, difusi, dan multimodal.

marsbit19j yang lalu

Mengubah Bentuk Transformer, LLM Bisa Jadi Lebih Pintar

marsbit19j yang lalu

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

Penulis: Xiao Jing, Editor: Xu Qingyang Pada akhir Juni 2026, pemerintah AS melakukan intervensi langsung terhadap model AI terdepan. Anthropic harus menarik model Fable 5 dan Mythos 5, sementara OpenAI meluncurkan GPT-5.6 dengan akses API terbatas hanya untuk mitra yang disetujui pemerintah. Proses ini menciptakan siklus "hentikan – negosiasi – izin bersyarat" dalam waktu kurang dari sebulan. Inti masalahnya adalah apakah model-model ini benar-benar terlalu kuat dan berbahaya. OpenAI dan Anthropic menyatakan, berdasarkan kerangka keamanan mereka sendiri, model-model ini tidak melewati ambang batas risiko yang tidak dapat diterima. Namun, pemerintah AS, yang dianggap kurang memiliki keahlian teknis di bidang AI terdepan, tetap memberlakukan pembatasan. Keputusan ini didorong oleh beberapa faktor: kemampuan model yang dapat didemonstrasikan, laporan keamanan dari pesaing (seperti Amazon), dan perintah eksekutif AI baru dari Presiden Trump yang membutuhkan contoh penegakan hukum. Situasi ini mengingatkan pada "Perang Kripto" tahun 1990-an, di mana pemerintah AS berusaha membatasi ekspor algoritma enkripsi kuat dengan alasan keamanan nasional. Upaya itu akhirnya gagal karena teknologi menyebar secara global, dan pembatasan justru merugikan perusahaan AS. Para ahli memperingatkan bahwa pembatasan serupa pada model AI dapat menghambat inovasi, mengganggu logika investasi industri, dan memperlambat difusi teknologi yang penting untuk keunggulan kompetitif jangka panjang. Dean W. Ball, mantan penasihat AI Gedung Putih, mengkritik proses persetujuan yang tidak transparan, tanpa standar jelas, dan tidak memiliki batas waktu. Dia memperingatkan bahwa jika hanya segelintir orang dan lembaga yang memiliki akses ke AI terdepan, hal itu justru dapat meningkatkan risiko konsentrasi kekuasaan. Sementara itu, model AI China terus berkembang dengan pendekatan sumber terbuka. Insiden Juni 2026 ini mungkin menandai dimulainya era di mana pemerintah AS menjadi gerbang wajib untuk peluncuran model AI terdepan, mengubah dinamika industri yang sebelumnya lebih terbuka.

链捕手2 hari yang lalu 15:27

Model Besar AS Menuju Keterbatasan, Atas Nama Keamanan

链捕手2 hari yang lalu 15:27

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

Baru-baru ini, DeepSeek V4 diperbarui dengan framework *Speculative Decoding* baru bernama **DSpark**, yang diklaim meningkatkan kecepatan inferensi hingga 80%. Pembaruan ini, yang juga disertai open-sourcing framework **DeepSpec**, berfokus pada optimasi teknikal dan peningkatan performa, bukan perubahan arsitektur model inti. DSpark mengimplementasikan **Semi-Autoregressive Generation** untuk menjaga throughput tinggi dan meningkatkan akurasi token yang dihasilkan oleh model draf (*draft model*). Inovasi utamanya adalah **Confidence-Scheduled Verification**, yaitu sistem penjadwalan yang cerdas dan adaptif. Sistem ini menggunakan *Confidence Head* untuk memperkirakan probabilitas penerimaan setiap token kandidat dan secara dinamis menyesuaikan panjang verifikasi berdasarkan beban kerja sistem (*hardware-aware*), sehingga mengalokasikan daya komputasi hanya ke token yang paling potensial. Dalam pengujian di berbagai domain (penalaran matematika, generasi kode, percakapan), DSpark menunjukkan peningkatan signifikan dibandingkan model *state-of-the-art* seperti Eagle3 dan DFlash. Pada kondisi *throughput* yang setara, DSpark meningkatkan kecepatan respons pengguna sebesar 57%-85% untuk model DeepSeek-V4 Flash dan Pro. DeepSpec, yang dirilis bersamaan, adalah *codebase* lengkap untuk melatih dan mengevaluasi model draf *speculative decoding*. Framework ini menyediakan pipeline standar (persiapan data, pelatihan, evaluasi) dan mendukung beberapa algoritma (DSpark, DFlash, Eagle3) serta model target (Qwen3, Gemma), memudahkan peneliti dan insinyur untuk mengembangkan dan menerapkan teknik percepatan inferensi pada model bahasa besar mereka sendiri.

marsbit2 hari yang lalu 08:55

Baru Saja, DeepSeek V4 Perbarui DSpark, Kecepatan Inference Meningkat 80%

marsbit2 hari yang lalu 08:55

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

Profesor Dawn Song (Song Xiaodong) dari UC Berkeley, yang dijuluki sebagai "tokoh keamanan komputer nomor satu", bergabung dengan laboratorium Superintelligence Meta sebagai Wakil Presiden Penelitian AI. Dia akan melapor langsung kepada kepala lab, Nat Friedman. Song adalah peneliti berpengaruh di bidang keamanan komputer dan keamanan AI, penerima MacArthur Fellowship, serta anggota ACM, IEEE, dan AAAS. Karyanya yang terkenal termasuk "Dynamic Taint Analysis" (2005). Laboratoriumnya di UC Berkeley dianggap sebagai pusat pelatihan terkemuka di bidang keamanan komputer. Penelitian Song mencakup keamanan perangkat lunak, pembelajaran mesin adversarial, dan keamanan agen AI. Dia juga pendiri Oasis Labs dan Virtue AI, perusahaan yang fokus pada infrastruktur keamanan AI untuk perusahaan, terutama pengujian penetrasi (red-teaming) otomatis dan pengaman runtime untuk agen AI. Bersama Song, pendiri Virtue AI lainnya, Bo Li dan Sanmi Koyejo, serta beberapa anggota tim, juga bergabung dengan Meta. Langkah ini dilihat sebagai upaya Meta untuk memperkuat langkah-langkah keamanan dalam pengembangan agen AI, terutama setelah masalah keamanan model AI seperti Anthropic's mythos menarik perhatian industri. Meta ingin menerapkan AI ke dalam produk-produk sosialnya yang digunakan miliaran orang dan terus mengedepankan strategi sumber terbuka, sehingga membutuhkan kemampuan keamanan yang tangguh. Artikel ini juga menyebutkan bahwa Denny Zhou, pendiri Gemini Reasoning Team di Google, dilaporkan telah bergabung dengan Meta TBDLab beberapa bulan sebelumnya. Zhou adalah tokoh kunci di bidang penalaran AI, berkontribusi pada metode seperti Chain-of-Thought dan Self-Consistency, yang membantu mengembangkan kemampuan penalaran model bahasa besar.

marsbit06/26 08:14

Ratu Keamanan Komputer Dawn Song (宋晓冬) Bergabung dengan Meta

marsbit06/26 08:14

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

Pada hari Selasa, pasar perdagangan kecerdasan buatan (AI) menghadapi tekanan penjualan paling tajam tahun ini. KOREAN KOSPI sempat anjlok hampir 10%, memicu penghentian perdagangan (circuit breaker). Saham inti rantai pasokan AI global seperti Samsung Electronics dan SK Hynix terpukul berat, dan tekanan menjalar ke sesi AS dengan saham memori, penyimpanan, dan semikonduktor menjadi wilayah yang paling menderita. Beberapa analis menyebut penurunan ini sebagai "momen DeepSeek-nya Zhipu AI", mereplikasi dampak pasar dari rilis model DeepSeek awal 2025. Model open-source GLM-5.2 dari Zhipu dinilai telah masuk peringkat tiga besar model bahasa global, memicu keraguan pasar tentang dominasi AI AS dan menimbulkan pertanyaan apakah pengeluaran modal besar-besaran perusahaan teknologi AS untuk pusat data masih dapat mendukung valuasi saat ini jika model open-source yang lebih murah sudah cukup baik. Tekanan lain berasal dari meningkatnya ketidakpastian atas imbal hasil investasi AI dan ekspektasi suku bunga yang lebih tinggi. Penurunan terfokus pada perusahaan yang paling diuntungkan dari narasi infrastruktur AI, seperti hyperscaler (Alphabet, Amazon, Meta) yang masih berencana mengeluarkan ratusan miliar dolar. Kekhawatiran juga muncul seiring meningkatnya ketergantungan pendanaan infrastruktur AI pada utang, seperti yang diilustrasikan oleh rencana penerbitan obligasi SpaceX. Meski demikian, banyak analis melihat ini sebagai koreksi yang diperlukan setelah kenaikan berlebihan dan "pemeriksaan realitas" dalam perdagangan teknologi, bukan akhir dari cerita AI. Pertanyaan inti beralih dari "apakah AI akan tumbuh" menjadi "apakah harga yang dibayar untuk pertumbuhan itu terlalu tinggi", menekankan pada kemampuan perusahaan mengubah pengeluaran modal menjadi arus kas dan keberlanjutan valuasi. Laporan keuangan Micron yang akan datang dipandang sebagai tolok ukur kunci untuk kesehatan rantai pasokan perangkat keras.

marsbit06/24 02:23

Harga AI Mengalami Koreksi Keras, Momen Deepseek-nya GLM?

marsbit06/24 02:23

Sistem Terbuka Akan Menang: Mengapa Ethereum Adalah Linux Berikutnya?

Etherealize menulis tentang bagaimana sistem terbuka tanpa izin akhirnya menang atas sistem tertutup, dan mengapa Ethereum dipandang sebagai Linux berikutnya. Artikel ini menarik paralel antara sejarah internet dan Linux dengan perkembangan blockchain. Pada 1990-an, banyak yang meragukan internet terbuka akan mengalahkan jaringan pribadi perusahaan seperti yang dibayangkan Microsoft. Namun, kenyataannya, internet dan Linux, yang dikembangkan secara terbuka oleh komunitas global ("model pasar"), terbukti lebih inovatif dan tangguh daripada sistem tertutup ("model katedral"). Prinsip yang sama berlaku untuk infrastruktur keuangan. Blockchain pribadi atau konsorsium (seperti yang pernah dicoba bank) menawarkan kecepatan dan kontrol jangka pendek, tetapi memiliki kelemahan: risiko platform di mana operator dapat bertentangan dengan pengguna, dan ketidakmampuan untuk mengikuti inovasi sistem tanpa izin. Ethereum, seperti Linux, dibangun berdasarkan **netralitas tepercaya**: aturannya transparan, berlaku sama untuk semua, sulit diubah, dan siapa pun dapat berpartisipasi. Ini menarik pengembang (lebih dari 1 juta hingga saat ini) dan institusi besar. Keunggulan Ethereum berasal dari desentralisasi yang mendalam dan sejarah uniknya (mis., transisi dari Proof-of-Work), yang tidak dapat dengan mudah disalin. Robinhood, BlackRock, JPMorgan, dan perusahaan terkemuka lainnya membangun di atas Ethereum atau lapisan-2-nya karena keamanan, ekosistem yang matang, dan sifatnya yang netral. Sementara solusi tertutup seperti SWIFT atau Visa dapat memblokir peserta, Ethereum menawarkan fondasi penyelesaian global yang independen dan dapat diandalkan. Tantangan regulasi tentang akuntabilitas dijawab di lapisan aplikasi (mis., melalui token dengan KYC bawaan), bukan di lapisan penyelesaian. Kesimpulannya, masa depan infrastruktur keuangan terletak pada membangun di atas sistem terbuka seperti Ethereum, bukan mencoba bersaing atau menciptakan yang tertutup.

Foresight News06/22 10:31

Sistem Terbuka Akan Menang: Mengapa Ethereum Adalah Linux Berikutnya?

Foresight News06/22 10:31

活动图片