Ditulis oleh: Huang Shiliang
"Data adalah minyak baru," kalimat ini hampir terlalu sering diucapkan di kalangan AI. Tapi dalam narasi utama, hal ini sepertinya tidak ada hubungannya sama sekali dengan kita orang biasa—itu adalah permainan modal raksasa teknologi, yang bersaing dengan kartu grafis dan triliunan parameter.
Tapi kemudian saya merenungkannya, perumpamaan ini adalah kompas yang sangat baik yang kami jalankan dalam AI.
一、Sebuah Perumpamaan yang Sangat Disalahpahami
"Data adalah minyak baru," kalimat ini sekarang hampir menjadi kitab suci di era AI.
Tapi jujur saja, reaksi pertama kebanyakan orang saat mendengar kalimat ini pasti: Ini urusan perusahaan besar, apa hubungannya dengan orang biasa seperti saya?
Karena dalam narasi utama, "data" yang mereka bicarakan adalah hal-hal tingkat PB seperti seluruh internet, Wikipedia; "teknologi penyulingan" adalah puluhan ribu kartu grafis H100 + sekelompok ilmuwan dengan gaji jutaan; "produk akhir" adalah model Tuhan yang mahatahu dan mahakuasa seperti GPT-5.
Logika ini tentu saja tidak salah secara bisnis, tapi masalahnya—ini pada dasarnya sama dengan mengatakan: Jangan ikut serta, kamu tidak bisa duduk di meja.
Kita orang biasa langsung tersingkir.
Yang lebih gelap adalah, ada versi lain dari pernyataan ini yang semakin membuat saya marah:
Data adalah minyak baru, data konsumen kita adalah ladang minyak Venezuela; dan Meituan, Alibaba, Douyin dan kawan-kawan adalah Trump-nya Amerika.
Mereka tanpa sengaja (sebenarnya sengaja) datang ke sini untuk memasang pipa dan menambang minyak, mengambil data kita secara gratis, menyulingnya menjadi "bensin 98" (algoritma presisi, big data killing熟), lalu menjualnya paksa kembali kepada kita.
Hasilnya adalah: Kita menjadi orang yang tertipu—tidak hanya berkontribusi bahan baku gratis, dijual tetapi juga membantu mereka menghitung uang.
Dalam versi cerita ini, pemainnya hanya raksasa. Kita tidak memiliki data dalam jumlah besar, tidak memiliki modal, dan tidak mungkin melatih model besar. Akhirnya, "data adalah minyak baru" menjadi slogan yang terdengar keren, tetapi sama sekali berguna bagi individu, bahkan agak menjijikkan.
二、Ubah Cara Memahaminya, Maka Ini Bisa Diselamatkan
Saya pikir konsensus ini bermasalah. Kita harus melihatnya dengan cara yang berbeda.
Jika kita memaksakan konsep "data adalah minyak baru" ini pada orang biasa, maka masalahnya bukan lagi "apakah perumpamaan ini benar", tetapi: Bagaimana hal ini membimbing saya untuk bekerja?
Alasan industri minyak begitu hebat adalah karena ia memiliki rantai logika yang sangat jelas dan tidak bisa dihindari oleh siapa pun:
Mencari ladang minyak (eksplorasi) → Membangun kilang minyak (pengolahan) → Standarisasi produk (bensin) → Membangun saluran (pom bensin) → Menjual kepada pengguna.
Bagi kita orang biasa, "minyak data" di era AI juga harus dibongkar sesuai dengan langkah-langkah ini. Kurang satu lingkaran, kecemasan AI Anda tidak akan pernah berubah menjadi produktivitas, hanya akan menjadi kelelahan mental "membaca berita + mengoleksi tautan + melihat orang lain menjadi kaya".
Di bawah ini, saya akan membongkarnya untuk kalian sesuai dengan logika ini, bagaimana orang biasa harus melakukannya.
三、Langkah Pertama: Di Mana Ladang Minyak?—Cari "Tambang Kaya Mini" di Sekitar Anda
Di industri tradisional, Anda harus pergi ke tempat-tempat seperti Arab Saudi, Rusia untuk mencari minyak. Tapi di jalur kita ini, ladang minyak sebenarnya ada di samping Anda. Saya pikir setidaknya ada dua kategori besar.
1. Data Pribadi: Halaman Belakang Anda Sendiri
Ini adalah jenis data yang paling mudah diabaikan, tetapi paling stabil. Ia tidak perlu besar skalanya, tetapi kemurniannya sangat tinggi.
Seperti alur kerja Anda, logika pengambilan keputusan Anda, lubang yang pernah Anda jatuhi (analisis kegagalan), dan aturan tidak tertulis yang Anda ketahui setelah bertahun-tahun di industri.
Jejak digital Anda: catatan, basis kode, draf, email yang ditulis dalam sepuluh tahun terakhir... semua ini termasuk.
Nilai dari hal ini adalah: Ini sepenuhnya milik Anda. "Digital twin pribadi" atau "Agen ahli domain" yang dilatih dengan data ini, tidak dapat digantikan oleh model besar umum mana pun.
Jika dalam 5 tahun terakhir kehidupan kerja Anda hampir tidak menggunakan komputer, hanya mengandalkan ponsel untuk menjelajahi dunia, maka kemungkinan besar Anda sulit berevolusi menjadi produsen AI, ditakdirkan hanya menjadi konsumen AI.
Jika benar-benar ingin menghasilkan uang dengan AI, saya pikir harus membeli komputer. Mengapa?
Karena tanpa komputer, kemungkinan besar Anda tidak memiliki endapan data yang terstruktur, Anda adalah "negara miskin minyak" sepenuhnya. Jangan berharap gambar-gambar di album ponsel Anda, atau puluhan GB rekaman suara dan obrolan tidak jelas di WeChat bisa melakukan hal besar—terlalu banyak kotoran, strukturnya terlalu buruk, benar-benar tidak bisa menyuling bensin 92 yang合格, paling-paling menyuling bensin 29 saja sudah bagus.
2. Tambang Data Publik yang Kaya: Bentuk "Tim Eksplorasi" Anda
Kategori kedua, adalah data yang bisa dilihat semua orang, tetapi 99% orang hanya "mengkonsumsi" bukan "mengeksplorasi": X.com, akun publik, arXiv, YouTube... ini adalah "laut lepas" era data.
Internet sekarang, terutama media sosial, lingkungannya memburuk terlalu cepat. Saya berani mengatakan, pasti lebih dari 50%, mungkin lebih dari 90% konten adalah AGRC (Konten Sampah yang Dihasilkan AI).
Mereka menggunakan AI untuk memproduksi omong kosong secara massal, langsung mencemari lapisan bumi. Jika Anda tidak sadar saat melakukan eksplorasi geologi, yang Anda gali kembali hanyalah sampah.
Lebih buruk lagi: Anda memberi sampah ke otak atau ke AI, akhirnya yang disuling juga hanya sampah, bahkan bisa menyumbat kilang minyak Anda.
Jadi untuk memastikan yang Anda gali bukan AGRC, saya sarankan Anda membuat **"kombinasi sumber inspirasi" yang disaring dengan ketat. Tapi perhatikan: Hanya melihat tidak ada gunanya, ini disebut menimbun minyak mentah. Anda harus belajar pengolahan awal minyak mentah **—setiap sumber harus dilewatkan ke AI, mengubahnya menjadi bahan bakar yang bisa dibaca mesin:
Batuan sedimen dalam (buku): Ini adalah pemberat. Buat daftar bacaan tahunan, klasik profesional, sastra harus ada.
Metode kombinasi AI: Jangan hanya membaca dengan bodoh. Pastikan menggunakan Gemini atau ChatGPT untuk membantu membaca, setelah membaca satu bab berikan kepada mereka untuk didiskusikan, minta mereka mengeluarkan pertanyaan pemikiran. Setelah membaca harus dibuat catatan bacaan versi elektronik, beri makan AI, ini adalah basis pengetahuan Anda.
Area eksplorasi前沿 (makalah dan laporan): Sering-seringlah melihat arXiv atau Google Scholar. Lakukan "makan siang makalah" setiap minggu, paksa diri sendiri untuk menghabiskan satu makalah.
Metode kombinasi AI: Tidak tahan membaca mentah? Langsung berikan PDF ke NotebookLM atau ChatGPT, minta mereka meringkas argumen inti dan data, mengubah "tulang yang sulit dikunyah" menjadi "kaldu kental" dan simpan.
Aliran permukaan (berita资讯): Gunakan RSS atau aliran informasi yang disesuaikan. Saya melihat berita hanya menyapu judul, jika benar-benar keren baru dikoleksi secara mendalam.
Metode kombinasi AI: Jangan hanya mengoleksi tautan. Salin kontennya, minta AI membantu memberi label, menyaring kata kunci, klasifikasikan ke perangkat lunak catatan Anda, jika tidak dikoleksi juga hanya menumpuk debu.
Ladang gas伴随 (podcast dan kuliah): Dengarkan TED Radio Hour dan sejenisnya di perjalanan. Paksa diri sendiri untuk pergi ke satu atau dua沙龙线下 setiap bulan.
Metode kombinasi AI: Mendengar pandangan yang bagus, jangan hanya mengangguk. Gunakan Whisper untuk mengubah rekaman suara menjadi teks, lalu minta AI mengatur menjadi catatan terstruktur. Suara tidak dapat dicari, tetapi teks bisa.
Sumur minyak produktif (media sosial): Ikuti一批 ahli sejati di Twitter/X. Secara teratur bersihkan daftar yang diikuti, unfollow那些 yang mengirim sampah emosional.
Metode kombinasi AI: Melihat Thread yang keren, langsung salin ke AI, minta analisis di mana kelemahan logika orang ini, atau integrasikan pandangannya ke dalam sistem pengetahuan Anda.
Ekspedisi lapangan (observasi kehidupan, investigasi lapangan): Latihan刻意 "melihat kehidupan dengan membawa masalah". Ini adalah data persepsi yang tidak bisa diraih oleh crawler AI.
Metode kombinasi AI: Jika inspirasi datang jangan mengetik, langsung berbicara dengan suara, lalu berikan ke AI untuk diatur menjadi diary. Minta AI membantu mengubah omongan tidak jelas menjadi wawasan yang logis.
Kita harus membiasakan diri随时 mengangkat ponsel dan berbicara一大话 kepada Douban.
Enam sumber ini adalah "ladang minyak campuran" Anda. Hanya jika input Anda cukup liar, cukup beragam, dan semuanya melalui pengolahan awal AI, hal yang Anda suling才不会 menjadi klise.
四、Langkah Kedua: Di Mana Peralatan Penyulingan?—Jangan Hanya Memandang Model Besar
Setelah menemukan minyak, langkah selanjutnya adalah menyuling. Media utama setiap hari membujuk Anda untuk membeli kartu grafis, tetapi bagi individu, kilang minyak sejati pasti adalah tumpukan perangkat lunak Anda sendiri + proses pemikiran.
1. Model Besar Hanyalah "Ketel"
Mengisi keanggotaan ChatGPT Plus tidak akan membuat kita sendiri menjadi hebat, ini seperti membeli ketel, lalu berdiri di samping melihat ketel yang cerah—tetapi Anda tidak bekerja!
ChatGPT, DeepSeek dan model besar lainnya, pada dasarnya adalah unit daya dasar, adalah dasar. Bisa menyala, tetapi tidak berarti Anda bisa menghasilkan minyak.
2. Kilang Minyak Sejati adalah "Sistem Peralatan Pribadi"
Sebuah kilang minyak pribadi yang efisien, harus memiliki komponen-komponen ini:
Pipa (rantai alat): VS Code, Python, Skills dan hal-hal ini.
Proses teknologi (metodologi): Inilah inti hambatan. Bagaimana Anda menulis Prompt, bagaimana membangun basis pengetahuan RAG, bagaimana membuat beberapa Agent(skills) saling bekerja sama.
Fokusnya bukanlah "seberapa kuat modelnya", tetapi: Bagaimana Anda berinteraksi dengan AI, bagaimana menerjemahkan pengalaman implisit di otak Anda menjadi instruksi yang dapat dimengerti AI.
Sistem "sistem teknik pribadi" inilah kilang minyak Anda, bukan model itu sendiri.
五、Langkah Ketiga: Produk Bukan Titik Akhir, Menjualnya Adalah Pertempuran Sulit
Ini adalah lingkaran paling kejam dalam seluruh rantai. Pertamina hanya perlu mengangkut minyak ke pom bensin, pemilik mobil自然 antri. Tapi di era AI, produk化 dan penjualan真的 sulit.
1. "Bensin" yang Disuling AI Sangat非标
Hal yang Anda suling menggunakan "data pribadi" + "model besar", kemungkinan besar bukan bensin umum, tetapi:
- Sebuah skrip Python yang hanya bisa Anda gunakan
- Sebuah artikel dengan gaya unik
- Laporan olahan AI setelah periksa ke dokter
- Sekumpulan saran konsultasi hukum yang dipersonalisasi
Hal-hal ini tidak umum, tidak standar, dan sangat memilih场景.
2. Masalah Besar Sebenarnya: Dijual kepada Siapa?
Jadi sebelum mulai, Anda harus bertanya secara terbalikan: Hal yang saya buat到底 dijual kepada siapa? Ini sebenarnya membalikkan untuk membuktikan minyak apa yang harus kita suling?
Jual kepada diri sendiri (digunakan sendiri): Menghemat waktu就是 menghasilkan uang, ini adalah闭环 yang paling mudah direalisasikan.
Jual kepada perusahaan (B2B): Kemas Prompt atau alur kerja Anda menjadi solusi. Ini membutuhkan kemampuan pra-penjualan yang sangat kuat (kemampuan忽悠).
Jual kepada masyarakat (B2C): Buat menjadi App atau kolom konten. Ini tergantung pada apakah Anda memiliki kemampuan distribusi流量.
Sebenarnya: Di era AI, menyuling minyak (menghasilkan konten) semakin mudah, tetapi membangun pom bensin (distribusi dan penjualan) sangat sulit.
六、Jangan Lupa Melakukan Perlindungan Lingkungan: Jangan Biarkan Limbah Mengubur Anda
Penyulingan minyak tradisional akan menghasilkan limbah padat, air limbah, gas buang. Jika tidak ditangani, kilang minyak belum menghasilkan uang, orang sudah mati keracunan.
Penyulingan data也一样, **"polusi赛博"** sangat parah, harus ada "departemen perlindungan lingkungan" yang membersihkan secara teratur.
1. Bersihkan "Limbah Alat" yang Kedaluwarsa
Kecepatan evolusi AI terlalu cepat, cepat到离谱.
"Sepuluh situs navigasi AI yang harus digunakan tahun 2025" yang Anda koleksi bulan lalu, minggu ini mungkin sudah bangkrut lima; parameter gambar AI tertentu yang Anda perjuangkan hari ini, besok mungkin sudah dihancurkan oleh "generate satu klik".
Jangan menjadi "pemulung赛博", menimbun banyak alat usang tidak rela dibuang. Uninstall yang perlu diuninstall, unfollow yang perlu diunfollow. Alat adalah untuk digunakan, bukan untuk disembah.
Menimbun alat usang, seperti rumah dipenuhi besi tua berkarat, hanya akan memperlambat kecepatan operasi Anda.
2. Buang "Cangkang Data Kosong" yang Sudah Diperas
Banyak orang memiliki "penyakit tupai": melihat PDF langsung unduh, melihat video langsung koleksi, hard disk penuh dengan beberapa T data, merasa sudah memiliki seluruh dunia.
Itu bukan pengetahuan, itu sampah tempat pembuangan.
Cara环保 yang benar adalah: Gunakan AI untuk memeras "minyak" dari PDF, video, artikel panjang—hasilkan ringkasan, ekstrak kutipan emas, ubah menjadi catatan Anda.
Setelah diperas kering, buang file aslinya (atau arsipkan ke penyimpanan dingin). Perhatian Anda adalah sumber daya terbatas yang sangat mahal, jangan biarkan file-file mentah ini占用 bandwidth Anda.
Hanya simpan "bahan bakar yang telah disuling", buang "cangkang minyak mentah", inilah kilang minyak yang efisien.
3. Putuskan "Tagihan Zombie Penghisap Darah" Itu
Kecemasan AI membuat kita melakukan banyak hal bodoh, yang paling bodoh adalah: terburu-buru menghabiskan uang untuk membeli rasa aman.
Mendaftar kelas, membeli kursus, mengejar konferensi, membeli keanggotaan Plus... biayanya都不低. Yang lebih fatal adalah, banyak hal一旦 berlangganan (jenis potongan bulanan), Anda sering lupa membatalkan.
Saya pernah membeli server untuk testing, sudah lebih dari tiga tahun, setiap bulan diam-diam memotong sejumlah uang, tersembunyi di tumpukan tagihan, saya tidak tahu—sebenarnya hanya digunakan pada hari testing.
Juga, saya pernah membeli ChatGPT, Gemini, Claude, Perplexity...一大堆 perpanjangan otomatis, dan membeli beberapa API. Hasilnya? Sebagian besar waktu hanya menumpuk debu.
Sial, benar-benar boros.
Ini adalah hal-hal yang harus dibersihkan oleh "perlindungan lingkungan". Jika tidak, Anda belum menyuling minyang yang bisa dijual, aset keluarga sudah dicuri habis oleh polusi ini.
七、Akhirnya Dua Kalimat: Sebuah Peta Tindakan
Ketika kita menanggalkan lapisan luar megah "data adalah minyak baru", itu不再 menjadi cerita modal yang tidak terjangkau, tetapi sebuah peta rute dingin yang dimiliki orang biasa.
Di era ini, jika Anda ingin menang, segera periksa "neraca keuangan" Anda:
- Cadangan: Apakah Anda masih men-scroll Douyin? Atau sudah melalui "sumber inspirasi" + bantuan AI, secara sadar menimbun data berkualitas tinggi? (Ingat hindari sampah AGRC)
- Kapasitas produksi: Apakah Anda memiliki一套 alat dan metodologi sendiri (kilang minyak), dan menyuling minyak apa?
- Saluran: Sudah jelas belum, produk非标 yang Anda suling ini,到底准备 dijual kepada siapa? Ini bisa membalikkan untuk membuktikan kapasitas produksi,到底 menyuling bensin 92 atau 98.
- Perlindungan lingkungan: Apakah Anda menimbun一堆 sampah digital? Sudah periksa tagihan kartu kredit, memotong langganan zombie itu?
Akhirnya sebuah saran: Lupakan berita parameter miliaran itu. Mulai hari ini—beli komputer, bangun "sumber data inspirasi" Anda, gali sumur minyak mini pertama Anda, jual dulu kepada diri sendiri, suling alat otomatisasi yang memadatkan pekerjaan Anda sendiri dengan AI sebagai utama dan diri sendiri sebagai pendukung.
Sebenarnya saya juga bingung, mengutak-atik AI sudah lebih dari tiga tahun, saya tidak menyuling apa pun. Hanya menyuling sebuah AI yang mengelola to do list saya, dan menyuling AI yang mengelola catatan bacaan saya, saya masih terus berpikir, bisa menyuling apa?