Cara Tepat Menggunakan Skill: 5 Refleksi Setelah Anthropic Membagikan Metodologi Internal Mereka

marsbitDipublikasikan tanggal 2026-06-08Terakhir diperbarui pada 2026-06-08

Abstrak

Menurut artikel "Skill 的正确打开方式" yang membahas metodologi internal Anthropic, berikut adalah 5 poin refleksi penting dalam menggunakan dan membangun Skill secara efektif: 1. **Jangan tulis informasi yang sudah jelas**: Skill bertujuan untuk mengkodifikasi pengetahuan implisit organisasi. Fokuslah pada "Gotchas" atau pengalaman spesifik seperti masalah database atau kasus tepi yang hanya diketahui oleh anggota tim berpengalaman. 2. **Skill adalah Rekayasa Konteks**: Skill bukan sekadar file, melainkan struktur folder yang mengelola konteks dengan cerdas. File utama `SKILL.md` berfungsi sebagai halaman navigasi yang merujuk ke detail di subfolder seperti `references/`, `scripts/`, dan `examples/`, sehingga menghindari kelebihan konteks. 3. **Utamakan penggunaan skrip**: Jangan buang kemampuan penalaran model untuk tugas berulang. Otomatisasikan dengan skrip untuk eksekusi yang lebih konsisten, akurat, dan efisien dalam penggunaan token. Instruksi memberikan panduan dan penilaian, sedangkan skrip memberikan kemampuan eksekusi. 4. **Deskripsi Skill sebagai aturan perutean**: Deskripsi harus menjelaskan *kapan* Skill harus digunakan berdasarkan niat pengguna, bukan hanya fungsinya. Ini membantu Claude menentukan Skill mana yang akan dimuat untuk masalah spesifik pengguna. 5. **Kelola dan sebarkan Skill secara bertahap**: Mulailah dengan Skill yang dibagikan dalam tim kecil. Saat jumlah Skill bertambah, adopsi model seperti Marketplace organik, di mana Skill yang terbukti berma...

Penulis: AI Product Aying

Saya membaca sebuah blog yang ditulis tim Anthropic berjudul "Lessons from building Claude Code: How we use skills". Ini mungkin adalah ringkasan praktis paling mendalam tentang Skill yang pernah saya lihat sejauh ini.

Skill sebenarnya tidak rumit, tetapi menurut saya, untuk benar-benar melakukannya dengan baik juga tidak mudah.

Saya ingat saat Skill baru populer, semua orang sangat suka membuat berbagai Skill gaya penulisan, Skill menulis. Sepertinya hanya dengan memasukkan gaya penulisan kita ke dalamnya, model akan dapat menghasilkan output dengan gaya itu secara stabil.

Tetapi kemudian saya mencobanya sendiri dan menemukan bahwa seringkali itu tidak berhasil.

Karena sebuah Skill gaya penulisan mungkin diisi dengan ribuan kata, bahkan puluhan ribu kata. Setelah Skill dimuat, konteksnya memakan sebagian besar ruang. Semakin berat konteksnya, kemampuan berpikir model justru mudah menurun.

Akhirnya sering muncul situasi seperti ini: gayanya memang berhasil dipelajari, tetapi kontennya menjadi dangkal, kemampuan analisisnya juga melemah.

Ada juga situasi umum lainnya.

Banyak orang saat menulis Skill, suka memasukkan berbagai instruksi operasional. Langkah pertama melakukan apa, langkah kedua apa, langkah ketiga apa. Hasilnya, saat dijalankan, akan ditemukan bahwa eksekusi model tidak stabil.

Kemudian saya baru perlahan memahami, banyak pekerjaan berulang seperti ini sebenarnya lebih cocok diendapkan menjadi Script, bukan ditulis sebagai Instructions yang panjang.

Setelah membaca artikel Anthropic ini, kesan terbesar saya adalah, banyak orang mungkin menggunakan Skill, tetapi belum tentu benar-benar memahami Skill.

Pada dasarnya, Skill adalah tentang Context Engineering. Kapan seharusnya pengetahuan dimasukkan ke dalam Skill, kapan harus dipecah menjadi References, kapan harus ditulis sebagai Script, kapan harus menggunakan Gotchas untuk membatasi model, sebenarnya ada banyak pengalaman di sini.

Setelah memahami prinsip kerja Skill, jika kita melihat kembali Skill-skill yang bagus, akan ditemukan bahwa mereka tidak pernah menyelesaikan masalah prompt, tetapi menyelesaikan masalah konteks, pengendapan pengalaman, dan penggunaan kembali kemampuan.

Jika Anda ingin mempelajari Skill secara mendalam, sangat disarankan untuk membaca dua artikel ini:

https://claude.com/blog/lessons-from-building-claude-code-how-we-use-skills

https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

#01 Jangan Menulis Omong Kosong

Pada dasarnya, Skill mengendapkan "pengetahuan implisit" dalam organisasi. Oleh karena itu, jangan ulangi pengetahuan umum yang sudah diketahui di dalam Skill. Yang benar-benar berharga adalah informasi yang bahkan tidak diketahui model.

Di internal Anthropic sering ditekankan, yang sebenarnya harus ditulis dalam Skill adalah Gotchas, yaitu kesalahan yang sering terjadi.

Misalnya:

1. Tabel ini tidak bisa diurutkan berdasarkan created_at

2. Staging mengembalikan 200 tidak berarti berhasil

3. request_id dan trace_id adalah hal yang sama

Karena informasi ini seringkali ada dalam pengalaman karyawan. Jadi, harus diingat apa esensi Skill sebenarnya.

Skill = Menuliskan pengalaman master (senior).

Melalui Skill, pengalaman yang tadinya tersebar di pikiran orang yang berbeda-beda dapat diendapkan.

#02 Skill Sebenarnya Adalah Context Engineering

Ini mungkin salah satu pandangan Anthropic yang paling mendalam.

Skill bukan sebuah file markdown, melainkan sebuah folder. Bagi yang pernah menggunakan Skill, pernyataan ini terdengar seperti omong kosong.

Tetapi beberapa hari ini saya merenungkannya berulang kali, perlahan menyadari: mereka ingin menggunakan bentuk folder ini untuk mengungkapkan konsep Context Engineering.

Mari kita lihat kembali struktur Skill yang khas:

skill/ ├── SKILL.md ├── references/ menyimpan penjelasan rinci, referensi API, kondisi batas ├── scripts/ menyimpan skrip yang dapat dieksekusi ├── examples/ menyimpan contoh ├── assets/ menyimpan template, gambar, materi tetap

Saat suatu Skill dipanggil, model pertama-tama membaca SKILL.md. Jika kita memasukkan semua informasi ke dalam file ini, konteks akan meledak dengan cepat.

Misalkan ini adalah Skill troubleshooting pembayaran, di dalamnya ada penjelasan kode error Stripe, kasus kegagalan historis, skrip pemeriksaan, dan template laporan akhir.

Jika semua konten ini ditumpuk ke dalam SKILL.md, setiap kali Skill dipanggil, Claude harus membacanya kembali dari awal.

Bahkan jika pengguna hanya ingin mengonfirmasi arti sebuah kode error, atau hanya ingin melihat mengapa status pembayaran tertentu tidak diperbarui. Banyak informasi yang tidak berguna akan ikut dimasukkan ke dalam konteks.

Sedangkan pendekatan Anthropic sangat berbeda.

SKILL.md lebih mirip halaman navigasi. Tugasnya adalah memberi tahu model, saat menemui error Stripe, carilah penjelasan yang sesuai di references.

Saat perlu merujuk kasus historis, periksa masalah serupa di examples. Saat perlu benar-benar melakukan tindakan pemeriksaan, jalankan skrip di scripts. Terakhir, saat membuat laporan troubleshooting, gunakan template di assets.

Seluruh proses ini adalah paparan yang bertahap.

Gambar di bawah ini, sangat disarankan untuk disimpan.

#03 Gunakan Skrip Sebisa Mungkin

Jangan biarkan model menghabiskan konteks dan kemampuan penalaran terbatasnya untuk pekerjaan berulang. Serahkan hal-hal ini pada skrip.

Misalnya. Banyak orang saat menulis Skill, akan menulis seperti ini:

1. Kueri data registrasi; 2. Kueri data pembayaran; 3. Hitung tingkat konversi; 4. Analisis penyebab anomali.

Cara penulisan seperti ini tentu tidak masalah. Model juga bisa menyelesaikannya. Tetapi setiap kali dieksekusi, ia harus mengulang seluruh alur analisis dari awal.

Mengkueri data, mengatur data, menangani berbagai kondisi batas, semua pekerjaan ini sebenarnya berulang.

Karena kemampuan ini sudah diuji berulang kali. Mengapa harus membuat model menemukannya kembali? Lebih baik langsung berikan skrip yang spesifik.

Dan dengan cara skrip, eksekusi Skill juga akan lebih akurat, dan lebih hemat Token.

Dari sudut pandang ini, Scripts di dalam Skill sebenarnya mengendapkan kemampuan organisasi. Di balik setiap skrip, sering kali adalah praktik terbaik yang disimpulkan tim setelah mengalami banyak masalah.

Setelah kemampuan ini dikokohkan. Claude setiap kali dapat bekerja berdasarkan pengalaman ini, bukan dari nol berulang kali.

Jadi saya semakin merasa, dalam Skill, Instructions dan Scripts menyelesaikan masalah di tingkat yang berbeda.

Instructions memberikan pengalaman dan penilaian, Scripts memberikan kemampuan dan eksekusi.

Misalnya, dalam Skill troubleshooting pembayaran mungkin ada pernyataan seperti ini:

Jika Stripe mengembalikan 200, jangan langsung menganggap pembayaran berhasil, perlu memeriksa tabel payment_events lebih lanjut.

Ini termasuk Instructions. Karena ini adalah pengalaman, sedangkan check_payment_events() termasuk Script, karena ini adalah kemampuan eksekusi.

Jika hanya ada Script, model tahu cara memeriksa, tetapi belum tentu tahu mengapa harus memeriksa.

Jika hanya ada Instructions, model tahu harus memeriksa. Tetapi setiap kali harus mengimplementasikannya kembali. Keduanya tidak dapat dipisahkan.

#04 Description Lebih Mirip Aturan Routing

Cara banyak orang menulis Description Skill secara alami sudah salah.

Karena orang terbiasa menulisnya sebagai pengenalan fungsi. Misalnya: PR Management Skill membantu pengguna memantau status PR, menangani masalah CI, secara otomatis menyelesaikan Merge.

Tetapi masalahnya adalah, model tidak mencari Skill berdasarkan fungsi. Saat Claude Code dijalankan, ia akan memindai semua nama dan Description Skill terlebih dahulu.

Kemudian berdasarkan masalah pengguna saat ini, menilai Skill mana yang harus dimuat.

Jadi informasi terpenting dalam Description bukanlah apa yang bisa dilakukan Skill ini, melainkan dalam situasi apa Skill ini harus dimuat.

Description sebenarnya menanggung tugas routing seluruh Skill.

Di dunia nyata, jarang ada orang yang mengatakan bantu saya memanggil alat manajemen PR. Orang lebih mungkin mengatakan: bantu awasi PR ini, CI rusak lagi, dan sebagainya.

Jadi Description yang baik seharusnya sebisa mungkin menggambarkan niat pengguna, bukan hanya mencantumkan fungsi.

Saya bahkan merasa bisa menggunakan metode yang sangat sederhana untuk memeriksa.

Setelah menulis Description, hapus seluruh Skill, hanya simpan Description satu baris ini. Kemudian tanya diri sendiri: setelah model melihat masalah pengguna, apakah ia tahu kapan harus memuat Skill ini.

Jika tidak bisa, kemungkinan besar masih harus diperbaiki.

#05 Manajemen dan Distribusi Skill

Ada satu lagi tentang manajemen Skill.

Saat satu orang menggunakan Skill, masalah ini sebenarnya sederhana. Tulis beberapa Skill sendiri, kelola sendiri, tingkatkan sendiri. Tetapi saya yakin kebanyakan tim nantinya akan menghadapi masalah yang sama.

Saat Skill berkembang dari beberapa menjadi puluhan, bahkan ratusan, bagaimana Skill-skill ini harus dikelola? Bagaimana cara meningkatkannya? Bagaimana mendistribusikannya kepada anggota tim?

Pengalaman Anthropic dalam hal ini, menurut saya cukup layak dijadikan referensi.

Saat skala tim masih kecil, Skill langsung mengikuti repositori kode. Cukup letakkan di direktori .claude/skills dalam proyek. Semua orang berbagi set Skill yang sama, juga berbagi metode kerja yang sama.

Tetapi seiring bertambahnya jumlah Skill, muncul masalah baru.

Saat Claude Code dijalankan, ia akan memindai semua nama dan Description Skill, kemudian menilai Skill mana yang harus dipanggil untuk tugas saat ini. Semakin banyak Skill, biaya routing semakin tinggi.

Ini juga mengapa Anthropic kemudian mulai membuat Marketplace. Tetapi yang lebih menarik adalah cara mereka mengelola Marketplace.

Banyak perusahaan saat menghadapi masalah seperti ini, reaksi pertama sering kali adalah membangun alur persetujuan. Siapa pun yang menulis Skill, ajukan aplikasi terlebih dahulu; setelah disetujui, baru masuk ke perpustakaan Skill resmi. Kami di internal juga pernah melakukan ini sebelumnya, tetapi sangat berat. Hanya untuk mengelola.

Saya menemukan organisasi Anthropic sangat ringan.

Biarkan Skill baru menyebar dalam lingkup kecil terlebih dahulu, biarkan rekan kerja sendiri yang menginstal dan mencoba.

Jika semakin banyak orang mulai menggunakannya, itu berarti Skill ini benar-benar menyelesaikan suatu masalah nyata. Pada tahap ini, penulis baru mengirimkannya ke Marketplace resmi.

Jadi mereka tidak membahas apakah Skill berharga terlebih dahulu, melainkan membiarkannya diuji dalam penggunaan nyata. Semakin banyak yang menggunakannya, secara alami akan masuk ke sistem resmi. Skill yang tertinggal seperti ini, pada dasarnya adalah Skill yang benar-benar dibutuhkan tim.

Pertanyaan Terkait

QApa saja lima refleksi utama dari artikel tentang cara menggunakan Skill dengan benar setelah Anthropic membuka metodologi internalnya?

ALima refleksi utama adalah: 1. Jangan menulis kalimat yang tidak perlu dalam Skill. 2. Skill sebenarnya adalah Rekayasa Konteks (Context Engineering). 3. Usahakan menggunakan skrip untuk tugas berulang. 4. Deskripsi Skill harus berfungsi seperti aturan perutean. 5. Pentingnya manajemen dan distribusi Skill secara efektif.

QMenurut artikel, apa tujuan sebenarnya dari membuat Skill, dan informasi seperti apa yang seharusnya dimasukkan ke dalamnya?

ATujuan sebenarnya dari membuat Skill adalah untuk mendokumentasikan 'pengetahuan implisit' dalam organisasi, yaitu pengalaman atau tips dari para ahli yang tidak diketahui secara umum. Skill harus berisi informasi berharga yang tidak diketahui model, seperti 'Gotchas' (masalah atau jebakan yang sering terjadi), contohnya: tabel tertentu tidak boleh diurutkan berdasarkan created_at, respons 200 di staging tidak selalu berarti sukses, atau request_id dan trace_id merujuk pada hal yang sama.

QMengapa struktur folder Skill (dengan subdirektori seperti references, scripts, examples) lebih efektif daripada memasukkan semua informasi ke dalam satu file SKILL.md?

AStruktur folder lebih efektif karena menerapkan prinsip 'Rekayasa Konteks'. File SKILL.md bertindak sebagai halaman navigasi ringkas. Dengan memisahkan informasi ke dalam subdirektori (references, scripts, examples, assets), model hanya akan mengakses informasi yang relevan sesuai kebutuhan tugas, bukan memuat semua konten sekaligus. Ini mencegah 'ledakan konteks', menghemat token, dan mempertahankan kemampuan penalaran model.

QBagaimana seharusnya kita menulis Deskripsi (Description) untuk sebuah Skill agar berfungsi dengan baik?

ADeskripsi Skill harus ditulis sebagai 'aturan perutean' yang menjelaskan kapan Skill tersebut harus dimuat, bukan sekadar daftar fungsinya. Deskripsi harus menggambarkan maksud atau situasi pengguna yang umum, misalnya: 'untuk memeriksa status PR' atau 'jika CI gagal'. Cara mengeceknya adalah dengan menghapus semua isi Skill kecuali deskripsinya, lalu bertanya: apakah model dapat memahami kapan harus memuat Skill ini hanya berdasarkan deskripsi dan pertanyaan pengguna?

QApa saran dari artikel mengenai cara mengelola dan mendistribusikan Skill dalam tim, terutama saat jumlahnya semakin banyak?

ASaran manajemen Skill adalah: untuk tim kecil, Skill dapat disimpan bersama kode proyek di direktori `.claude/skills`. Saat jumlah Skill bertambah, pendekatan yang ringan lebih disarankan. Biarkan Skill baru digunakan dan diuji dalam lingkup kecil terlebih dahulu oleh rekan kerja. Jika suatu Skill banyak digunakan dan terbukti menyelesaikan masalah nyata, barulah diajukan ke Marketplace resmi. Cara ini memastikan hanya Skill yang benar-benar berguna yang diadopsi secara luas, menghindari birokrasi yang tidak perlu.

Bacaan Terkait

Huang Renxiong 'Menyelamatkan' Pasar Saham Korea: Mengunci Memori SK Hynix, Kekurangan Chip Akan Berlanjut

Pasar saham Korea Selatan mengalami penurunan tajam awal Juni, dengan indeks KOSPI anjlok lebih dari 5%. Dalam situasi ini, kunjungan Jensen Huang, CEO NVIDIA, ke Korea Selatan memainkan peran penting. Dalam pertemuan dengan CEO SK Hynix, Kwak Noh-jung, dan Chairman SK Group, Chey Tae-won, Huang mengumumkan bahwa CPU Vera buatan NVIDIA akan menggunakan memori DRAM dari SK Hynix. Kedua perusahaan juga menandatangani kerja sama teknologi jangka panjang untuk mengembangkan memori generasi mendatang untuk infrastruktur AI NVIDIA, mencakup superkomputer AI, PC, dan platform robotika. Kerja sama ini melampaui pasokan memori. SK Hynix akan memanfaatkan teknologi AI NVIDIA (seperti CUDA-X dan Omniverse) dalam desain dan manufaktur semikonduktor mereka, termasuk untuk komputasi lithografi dan menciptakan *digital twin* pabrik wafer untuk mengoptimalkan operasi. Meski berpartner dengan SK Hynix, NVIDIA mendiversifikasi pasokan HBM4 untuk sistem Vera Rubin dengan melibatkan tiga pemasok: SK Hynix, Samsung Electronics, dan Micron Technology. Namun, Huang memprediksi bahwa kekurangan chip memori akan berlanjut selama beberapa tahun ke depan karena tingginya permintaan dari industri AI. Kunjungan Huang juga menguatkan hubungan strategis NVIDIA dengan industri teknologi Korea, termasuk raksasa seperti Hyundai Motor, LG, dan Naver, menunjukkan komitmen mendalam NVIDIA di kawasan ini.

marsbit50m yang lalu

Huang Renxiong 'Menyelamatkan' Pasar Saham Korea: Mengunci Memori SK Hynix, Kekurangan Chip Akan Berlanjut

marsbit50m yang lalu

Indeks Nasdaq Turun 4.2% dalam Satu Hari, Apakah 'Jumat Kelam' Menusuk Gelembung Saham AS?

Indeks Nasdaq turun 4,18% pada 5 Juni 2026, mencatat penurunan terbesar dalam satu hari sejak April 2025. Indeks S&P 500 dan Dow Jones juga turun tajam, dengan sektor semikonduktor, terutama saham-saham AI seperti NVIDIA dan AMD, mengalami penurunan terparah. Data non-farm payrolls AS bulan Mei yang lebih kuat dari perkiraan menjadi pemicu langsung, memicu kekhawatiran akan inflasi dan penundaan pemotongan suku bunga oleh Federal Reserve. Analisis mengungkapkan bahwa penurunan ini terjadi di tengah valuasi pasar saham AS yang tinggi. Beberapa indikator, seperti CAPE ratio dan "Buffett Indicator", menunjukkan level yang mengkhawatirkan, mirip dengan periode sebelum gelembung dot-com tahun 2000. Sentimen investor sebelumnya juga sangat optimis. Sektor AI, yang menjadi motor penggerak pasar selama 18 bulan terakhir, menunjukkan kerapuhan. Kekhawatiran muncul terkait kelanjutan belanja modal AI dan kemampuan monetisasi aplikasi. Penurunan ini memicu perdebatan di kalangan analis: apakah ini awal penyesuaian gelembung atau hanya koreksi sehat dalam pasar bull. Masa depan pasar akan sangat ditentukan oleh data inflasi (CPI) AS bulan Mei yang akan datang dan pertemuan kebijakan Federal Reserve. Keputusan Fed mengenai jalur suku bunga akan menjadi kunci untuk menentukan apakah penurunan ini adalah awal tren bearish atau hanya fase volatilitas sementara. Investor disarankan untuk lebih berhati-hati dan memantau perkembangan data ekonomi serta sinyal kebijakan moneter dengan ketat.

marsbit52m yang lalu

Indeks Nasdaq Turun 4.2% dalam Satu Hari, Apakah 'Jumat Kelam' Menusuk Gelembung Saham AS?

marsbit52m yang lalu

Indeks Nasdaq Turun 4,2% dalam Satu Hari, Apakah "Jumat Hitam" Meledakkan Gelembung Saham AS?

Indeks Nasdaq anjlok 4,18% pada 5 Juni 2026, mencatat penurunan satu hari terbesar sejak April 2025. Indeks S&P 500 juga turun 2,64%, mengakhiri rekor sembilan minggu kenaikan beruntun. Data tenaga kerja AS (non-farm payrolls) yang jauh lebih kuat dari perkiraan menjadi pemicu langsung, memicu kekhawatiran ekonomi overheating dan ekspektasi bahwa The Fed mungkin menunda pemotongan suku bunga atau bahkan menaikkannya. Lonjakan imbal hasil obligasi AS kemudian menghantam saham-saham teknologi bernilai tinggi dan sensitif suku bunga, terutama di sektor semikonduktor dan AI, dengan Philadelphia Semiconductor Index runtuh lebih dari 10%. Saham seperti Nvidia, Broadcom, dan Micron menjadi penyumbang penurunan terbesar. Penurunan ini menyoroti kerentanan gelembung valuasi yang terakumulasi di pasar, terutama di sekitar narasi AI. Beberapa indikator, seperti CAPE (Shiller P/E) dan rasio kapitalisasi pasar terhadap GDP AS ("Indikator Buffett"), telah mencapai level tertinggi bersejarah, menandakan pasar yang sangat mahal. Sentimen investor juga sangat optimis sebelum koreksi. Sementara itu, "uang pintar" seperti Berkshire Hathaway telah meningkatkan posisi kas mereka. Para ahli terbelah dalam menilai penurunan ini. Kelompok bearish memandangnya sebagai awal koreksi gelembung yang lebih dalam, memperingatkan risiko stagflasi dan tekanan pada laba perusahaan. Kelompok bullish melihatnya sebagai koreksi sehat yang tertunda dalam pasar bullish yang masih didukung oleh pertumbuhan laba yang solid dan ekonomi yang tangguh. Masa depan pasar dalam waktu dekat sangat bergantung pada dua peristiwa kunci: laporan inflasi CPI bulan Mei dan pertemuan kebijakan The Fed (FOMC) pertengahan Juni. Data inflasi yang lebih panas atau sinyal hawkish dari The Fed yang mengisyaratkan suku bunga tinggi akan bertahan lebih lama dapat memperpanjang tekanan penyesuaian. Singkatnya, pasar sedang memasuki fase rapuh di mana janji jangka panjang revolusi AI mulai diuji oleh realitas makroekonomi dan data fundamental. Era taruhan satu arah pada kenaikan abadi mungkin sudah berakhir, dan kehati-hatian menjadi sangat penting.

Odaily星球日报59m yang lalu

Indeks Nasdaq Turun 4,2% dalam Satu Hari, Apakah "Jumat Hitam" Meledakkan Gelembung Saham AS?

Odaily星球日报59m yang lalu

Kasus Pertama Kecerdasan Buatan: Apa yang Diputuskan?

Pada 30 April, Pengadilan Internet Guangzhou mengeluarkan surat penetapan pertama di China terkait kasus *AI agent*. Pihak tergugat adalah perangkat lunak *AI agent* sumber terbuka yang dituduh menggunakan izin tingkat sistem operasi tanpa otorisasi untuk menghindari langkah-langkah manajemen teknis platform penggugat dan melakukan operasi otomatis. Pengadilan memerintahkan penghentian segera penyediaan unduhan, penghentian perilaku penghindaran langkah-langkah teknis, serta penghapusan tutorial dan data terkait. Kasus ini memiliki kemiripan dengan gugatan Amazon terhadap Perplexity di AS, yang juga berfokus pada aktivitas yang menghindari API resmi platform. Kedua kasus menetapkan "batas hukum" yang sama: *AI agent* tidak boleh bertindak sesuka hati dan memerlukan otorisasi ganda, yaitu persetujuan pengguna **dan** persetujuan platform. Masalah intinya adalah kewajiban dan tanggung jawab. Jika *agent* dapat menghindari aturan platform, mekanisme keamanan data dan privasi yang dibangun platform akan gagal, menimbulkan risiko terkait siapa yang bertanggung jawab. Contohnya adalah evolusi strategi Ponsel Doubao. Versi 1.0 awalnya menggunakan pendekatan agresif dengan mengakses izin sistem untuk mengoperasikan aplikasi lain, namun kemudian menghadapi kendala. Versi 2.0 beralih ke jalur kerja sama, merundingkan otorisasi dan integrasi API dengan platform ekosistem seperti Alibaba. Dari kasus-kasus ini, terbentuk tren global: era pertumbuhan liar *AI agent* telah berakhir, digantikan oleh era kompetisi yang sesuai aturan. Biaya kepatuhan menjadi "biaya masuk" baru, "otorisasi ganda" menjadi standar industri, dan status sumber terbuka tidak lagi menjadi alasan untuk dibebaskan dari tanggung jawab. Dengan menangani kasus yang paling radikal dan representatif terlebih dahulu, regulasi secara efektif mendefinisikan ulang aturan permainan, mendorong lebih banyak negosiasi otorisasi dan spesifikasi akses *agent* antara perusahaan *AI agent* dan platform.

marsbit1j yang lalu

Kasus Pertama Kecerdasan Buatan: Apa yang Diputuskan?

marsbit1j yang lalu

Dipecat oleh Google Karena Makalah 14 Halaman, Lebih dari 4000 Orang Mendukungnya, 6 Tahun Kemudian: Saat Itu Ia Hampir Meramalkan Seluruh Era AI

Pada Desember 2020, peneliti AI etika terkemuka Timnit Gebru diberhentikan dari Google setelah konflik terkait makalah akademisnya yang berjudul "On the Dangers of Stochastic Parrots". Lebih dari 4.000 orang menandatangani petisi dukungan untuknya. Makalah setebal 14 halaman itu, yang ditulis pada 2020, memperingatkan berbagai risiko besar model bahasa berskala besar (LLM) jauh sebelum ledakan AI generatif seperti ChatGPT. Makalah tersebut meramalkan lima masalah utama yang kini menjadi kenyataan: (1) **Halusinasi AI** – model menghasilkan informasi yang salah namun terdengar meyakinkan; (2) **Amplifikasi bias** – prasangka sosial dalam data pelatihan diperkuat oleh model; (3) **Konsumsi energi masif** – pelatihan LLM meninggalkan jejak karbon besar; (4) **Data pelatihan tidak teraudit** – pengembang sendiri sering tidak tahu konten sebenarnya dalam dataset raksasa; (5) **Kolaps model & sentralisasi kekuasaan** – konten buatan AI akan mendominasi internet dan meminggirkan bahasa serta budaya minor, sementara pengembangan AI terkonsentrasi di segelintir perusahaan teknologi. Setelah keluar dari Google, Gebru mendirikan Distributed AI Research Institute (DAIR) untuk meneliti isu-isu etika AI di luar kepentingan komersial perusahaan besar. Enam tahun kemudian, peringatan dalam makalah "Parrot Stochastic" yang sempat dianggap berlebihan, kini diakui sebagai tantangan nyata yang dihadapi industri AI. Kisah Gebru menyoroti ketegangan abadi antara inovasi teknologi yang cepat dengan pertimbangan keadilan, transparansi, dan keberlanjutan.

marsbit1j yang lalu

Dipecat oleh Google Karena Makalah 14 Halaman, Lebih dari 4000 Orang Mendukungnya, 6 Tahun Kemudian: Saat Itu Ia Hampir Meramalkan Seluruh Era AI

marsbit1j yang lalu

Trading

Spot
Futures
活动图片