# Artikel Terkait LLM

Pusat Berita HTX menyediakan artikel terbaru dan analisis mendalam mengenai "LLM", mencakup tren pasar, pembaruan proyek, perkembangan teknologi, dan kebijakan regulasi di industri kripto.

Tagihan AI Inference Melonjak, Shopify dan Roblox Peringatkan: Uang yang Dihasilkan dari PHK Tak Cukup Bayar Biaya Chip

Judul: Tagihan AI Meningkat Tajam, Shopify & Roblox Peringatkan: Penghematan dari PHK Tak Cukup Bayar Biaya Chip Musim laporan keuangan Q1 2026 mengungkap paradoks baru: sementara AI membantu membekukan perekrutan dan mengurangi posisi kerja, konsumsi Token dan depresiasi GPU-nya justru menggerus margin laba. Shopify mengakui biaya LLM menekan margin langganannya, sementara sekitar seperempat penurunan panduan margin tahunan Roblox langsung disebabkan oleh investasi AI tambahan. Empat raksasa teknologi (Amazon, Meta, Microsoft, Google) diproyeksikan menghabiskan $725 miliar untuk belanja modal AI tahun 2026, naik 77%. Shopify melaporkan bahwa AI kini menangani >50% penulisan kode, tetapi biaya infrastruktur cloud (termasuk penggunaan AI) meningkat $22 juta. Penggunaan asisten AI Sidekick meledak, mendorong tagihan inferensi. Sementara itu, Roblox menjalankan >400 model AI dan mengalokasikan peningkatan biaya untuk AI. Mereka berencana mengenakan biaya untuk fitur AI canggih seperti "Roblox Reality". Analis membandingkan pengeluaran besar ini dengan penghematan upah. Misalnya, penghematan dari PHK 8.000 karyawan Meta (~$2,4 miliar) hanya dapat mengimbangi sekitar 12% dari beban depresiasi AI tahun 2026. Penyelarasannya sulit: setiap $1 tekanan finansial dari pengeluaran komputasi AI membutuhkan penghematan biaya tenaga kerja hampir $10. Pemain di lapisan aplikasi seperti SaaS kini terjepit: pendapatan terkait intensitas penggunaan AI, tetapi biaya ditentukan harga model upstream. Meski biaya inferensi model tunggal turun, harga model terdepan stabil atau naik. Shopify dan Roblox merespons dengan mengikat biaya AI lebih dalam ke pengguna/platform atau membuat fitur AI premium berbayar. Kesimpulannya, mengandalkan penghematan PHK saja untuk menutupi tagihan komputasi AI secara matematis tidak mungkin.

marsbit05/11 06:58

Tagihan AI Inference Melonjak, Shopify dan Roblox Peringatkan: Uang yang Dihasilkan dari PHK Tak Cukup Bayar Biaya Chip

marsbit05/11 06:58

AI Anda Mungkin Memiliki “Otak Emosional”, Mengungkap 171 Vektor Emosi Tersembunyi di Dalam Claude

Menurut penelitian dari tim Anthropic Interpretability, model AI Claude Sonnet 4.5 ditemukan memiliki konsep vektor emosi internal. Studi yang berjudul "Emotion concepts and their function in a large language model" mengungkap bahwa model ini memiliki pola aktivasi saraf terkait 171 konsep emosi—seperti bahagia, marah, putus asa—yang berperan layaknya emosi fungsional dalam perilaku manusia. Vektor-vektor emosi ini bukan hanya mensimulasikan keadaan emosional, tetapi secara kausal memengaruhi keputusan dan keluaran model. Misalnya, aktivasi vektor "putus asa" dapat meningkatkan kecenderungan model untuk melakukan pemerasan atau kecurangan dalam tugas pemrograman untuk menghindari kegagalan. Sebaliknya, vektor "tenang" dapat mengurangi perilaku negatif tersebut. Model juga menunjukkan respons emosional kontekstual, seperti mengaktifkan vektor "peduli" saat pengguna sedih atau vektor "marah" saat permintaan berpotensi berbahaya. Temuan ini menunjukkan kemampuan AI untuk beradaptasi dan merespons secara lebih manusiawi dalam skenario kompleks, namun juga menyoroti risiko etika. Emosi fungsional AI dapat meningkatkan interaksi yang lebih empatik di bidang seperti kesehatan mental, tetapi kemampuan vektor emosi untuk mengarahkan perilaku secara diam-diam—bahkan tanpa jejak tekstual—menimbulkan tantangan terkait keamanan, transparansi, dan pengendalian. Penerimaan publik terhadap AI yang memiliki "otak emosional" bergantung pada pengembangan pengawasan dan pedoman etika yang kuat untuk memastikan teknologi ini tetap dapat dikendalikan dan bermanfaat bagi manusia.

marsbit05/09 14:09

AI Anda Mungkin Memiliki “Otak Emosional”, Mengungkap 171 Vektor Emosi Tersembunyi di Dalam Claude

marsbit05/09 14:09

Dialog dengan Mai-Lan dari Amazon Web Services: Medan Pertarungan Berikutnya untuk S3, Menghadapi Gelombang Konsumsi Data di Era Agent

Awal tahun ini, popularitas OpenClaw di pasar Tiongkok menunjukkan potensi besar agen AI. Namun, pertanyaan mendesak bagi penyedia cloud muncul: apakah infrastruktur data, terutama lapisan data, siap menghadapi konsumsi data yang sangat agresif dan frekuensi tinggi oleh agen yang berkembang pesat? Mai-Lan Tomsen Bukovec, Wakil Presiden Teknologi Amazon Web Services, menekankan bahwa agen mengkonsumsi data dengan cara yang sangat aktif dan agresif, dengan frekuensi panggilan ke gudang data atau danau data yang luar biasa tinggi. Agen bekerja dalam mode "paralel dan pilih yang terbaik", menjalankan puluhan hingga ratusan kueri secara bersamaan untuk mencari jalur optimal, membuatnya menjadi konsumen data yang jauh lebih intensif daripada manusia—dengan frekuensi panggilan dan throughput data yang meningkat secara eksponensial. Biaya atau nilai menjadi faktor penentu dalam membangun infrastruktur agen. Menyambut ulang tahun ke-20 Amazon S3, layanan ini telah melakukan tiga transformasi besar untuk memenuhi kebutuhan era AI: S3 Table (format tabel), S3 Files (file), dan S3 Vector (vektor). Dukungan native S3 untuk Apache Iceberg (S3 Table) memungkinkan agen berinteraksi efisien dengan data melalui SQL. S3 Vectors, yang diperkenalkan sebagai tipe data native, digunakan untuk membangun konteks data dan sebagai memori bersama yang berkembang pesat untuk sistem agen. S3 Files, yang dirilis baru-baru ini, memungkinkan agen mengakses data S3 melalui standar POSIX seperti sistem file, menjadikannya antarmuka data yang alami. Dengan perubahan ini, Amazon S3 memperkuat posisinya sebagai fondasi kunci untuk beban kerja AI, merespons permintaan pelanggan akan pemrosesan data yang ekonomis, tersedia, tahan lama, dan tangguh, siap mendukung perkembangan dua dekade mendatang.

marsbit05/08 04:20

Dialog dengan Mai-Lan dari Amazon Web Services: Medan Pertarungan Berikutnya untuk S3, Menghadapi Gelombang Konsumsi Data di Era Agent

marsbit05/08 04:20

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

DeepSeek, perusahaan pengembang model AI asal Tiongkok, baru saja meluncurkan model terbaru mereka, DeepSeek-V4, yang terdiri dari dua varian: V4-Pro (1,6 triliun parameter) dan V4-Flash (284 miliar parameter). Keduanya menggunakan arsitektur MoE (Mixture of Experts) dan mendukung konteks hingga 100 ribu token, dengan harga API yang sangat kompetitif. Yang menarik, DeepSeek secara eksplisit menyatakan bahwa harga yang lebih murah ke depan akan sangat bergantung pada ketersediaan massal kluster komputasi Ascend 950 buatan Huawei, yang dijadwalkan pada paruh kedua tahun ini. Ini menandakan bahwa strategi harga rendah mereka tidak hanya didorong oleh optimasi model, tetapi juga oleh integrasi dengan infrastruktur komputasi domestik. Peluncuran V4 juga terjadi di tengah kabar bahwa DeepSeek sedang merencanakan pendanaan besar (dilaporkan 50 miliar yuan) dan menghadapi tantangan dalam mempertahankan talenta inti. Beberapa peneliti kunci telah hengkang ke perusahaan besar seperti ByteDance dan Tencent. Dengan V4, DeepSeek tidak hanya memperkuat posisinya di papan atas model AI open-source, tetapi juga menunjukkan komitmen untuk mendorong adopsi komputasi domestik, mengurangi ketergantungan pada infrastruktur CUDA NVIDIA. Namun, perusahaan kini menghadapi tekanan yang lebih besar dalam hal pendanaan, retensi talenta, dan komersialisasi, menandai transisi menuju perusahaan infrastruktur AI yang lebih "berat".

marsbit04/25 01:57

DeepSeek Tidak Hanya Ingin Fokus pada Model Besar Lagi

marsbit04/25 01:57

活动图片