# Artikel Terkait Pembelajaran Mendalam

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "Pembelajaran Mendalam", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Penerima Turing Award Sutton Karya Baru: Selesaikan Kelemahan Besar Pembelajaran Penguatan Streaming dengan Formula 1967

Sebuah makalah baru oleh Arsalan Sharifnassab dkk. (termasuk pemenang Turing Award Richard Sutton) mengatasi "rintangan aliran" (*stream barrier*) dalam pembelajaran penguatan (*reinforcement learning*) secara mendalam. Masalahnya adalah ketidakmampuan belajar "langkah demi langkah" (*online/streaming*) dengan ukuran *batch*=1 dan tanpa *buffer replay*. Alasannya adalah langkah pembelajaran (*step-size*) tradisional hanya mengontrol seberapa besar parameter bergerak, bukan perubahan pada keluaran fungsi, sehingga menyebabkan pembaruan yang tidak stabil. Solusinya disebut **"Intentional Updates" (Pembaruan Berdasarkan Niat)**, sebuah ide yang meluas dari algoritma NLMS tahun 1967. Alih-alih menetapkan ukuran langkah untuk parameter, metode ini menetapkan **"niat"** untuk mengubah *output* fungsi—seperti memperkecil kesalahan prediksi nilai sebesar 5%—lalu menghitung mundur ukuran langkah yang diperlukan. Ini menghasilkan algoritma seperti Intentional TD, Intentional Q, dan Intentional Policy Gradient. Dalam eksperimen, metode ini mencocokkan kinerja algoritma canggih seperti SAC (dalam kontrol berkelanjutan) dan DQN (pada permainan Atari) dalam pengaturan *streaming*, dengan komputasi yang jauh lebih ringan (1/140 FLOP SAC) dan tanpa banyak penyesuaian hiperparameter. Kerangka kerja ini lebih tangguh dan mengurangi ketergantungan pada trik stabilisasi, meskipun ada masalah bias yang perlu ditangani dalam pembelajaran kebijakan. Pendekatan ini membuka jalan untuk sistem AI yang dapat belajar terus-menerus dan beradaptasi secara *online* seperti manusia, cocok untuk robotika dan perangkat *edge* dengan sumber daya terbatas.

marsbit05/10 06:38

Penerima Turing Award Sutton Karya Baru: Selesaikan Kelemahan Besar Pembelajaran Penguatan Streaming dengan Formula 1967

marsbit05/10 06:38

Berpamitan dengan Kekuatan Brute Komputasi: Melihat Logika Penilaian Ulang AI for Science dari 'GrainBot' HKUST

Tim ilmuwan dari Hong Kong University of Science and Technology (HKUST) yang dipimpin oleh Prof. Guo Yike meluncurkan GrainBot, alat AI revolusioner untuk menganalisis struktur mikro material seperti yang digunakan dalam semikonduktor dan baterai. Alat ini menggunakan computer vision dan deep learning untuk secara otomatis mengidentifikasi butiran material dalam gambar mikroskop, menghitung parameter kompleks, dan menghubungkannya dengan performa material. GrainBot menandai pergeseran fokus AI dari model umum ke sains terapan (AI for Science/AI4S). Nilainya tidak diukur dari jumlah pengguna, tetapi dari kemampuannya mempersingkat siklus riset dan menemukan material baru. Misalnya, alat ini dapat mempercepat pengembangan baterai surya perovskite dari 3 tahun menjadi 6 bulan. Hong Kong, dengan keahlian ilmiahnya yang kuat, berpotensi menjadi pusat "laboratorium otonom" yang mengombinasikan AI dan robotik untuk riset material 24/7. Model bisnisnya adalah menciptakan "IP industri" yang dapat dilisensikan ke manufaktur di Greater Bay Area. Tantangan utama adalah kelangkaan data ilmiah berkualitas tinggi dan isolasi data antar laboratorium. Solusi seperti komputasi privasi mungkin diperlukan untuk berbagi data secara aman. GrainBot merepresentasikan masa depan di mana AI mengatasi tantangan dunia fisik, membuka pasar material berbasis AI yang bernilai triliunan.

marsbit03/05 09:45

Berpamitan dengan Kekuatan Brute Komputasi: Melihat Logika Penilaian Ulang AI for Science dari 'GrainBot' HKUST

marsbit03/05 09:45

活动图片