Автор: Хуан Шилян
Фраза «данные — это новая нефть» в кругах ИИ уже набила оскомину. Но в mainstream-нарративе это, кажется, не имеет к нам, простым людям, никакого отношения — это игра капиталов технологических гигантов, где ставки делаются на видеокарты и триллионы параметров.
Но я потом поразмышлял и понял, что эта метафора — отличный компас для нашего пути в мире ИИ.
一、Сильно misunderstood метафора
«Данные — это новая нефть» — сейчас это почти что священное писание эпохи ИИ.
Но, честно говоря, первая реакция большинства людей, услышавших эту фразу, наверняка такая: это, блин, проблемы больших компаний, какое отношение это имеет ко мне, простому человеку?
Потому что в mainstream-нарративе под «данными» они подразумевают весь интернет, Википедию — вещи петабайтного масштаба; под «технологией переработки» — тысячи видеокарт H100 + ученых с зарплатой в миллион; под «конечным продуктом» — всезнающие и всемогущие божественные модели типа GPT-5.
Конечно, с коммерческой точки зрения в этой логике нет ничего плохого, но проблема в том, что она по сути говорит: тебе не стоит участвовать, тебе не место за этим столом.
Нас, простых людей, просто вышвыривают из игры.
Что еще хуже, есть версия этого высказывания, которая меня все больше бесит:
Данные — это новая нефть, данные потребителей — это нефтяные месторождения Венесуэлы; а такие ребята, как Meituan, Alibaba, Douyin — это американский Трамп.
Они «нечаянно» (на самом деле намеренно) приходят к нам, вставляют трубы и качают нашу нефть, бесплатно забирают наши данные, перерабатывают в «98-й бензин» (точные алгоритмы, ценовая дискриминация на основе big data) и снова навязывают нам его.
В результате мы становимся лохами — не только бесплатно поставляем сырье, нас еще и обманывают, а мы потом помогаем платформам считать деньги.
В этой версии истории игроками являются только гиганты. У нас нет ни огромных данных, ни капитала, и уж точно мы не можем обучать большие модели. Таким образом, «данные — это новая нефть» превращается в круто звучащий, но абсолютно бесполезный для отдельного человека, и даже немного тошнотворный, слоган.
二、Если понять это под другим углом, все наладится
Я думаю, что такое consensus ошибочен. Нам нужно посмотреть под другим углом.
Если мы все же попытаемся применить концепцию «данные — это новая нефть» к простым людям, то вопрос уже не в «правильности ли этой метафоры», а в том: как именно это должно направлять мою работу?
Нефтяная индустрия крута потому, что у нее есть очень ясная, неоспоримая логическая цепочка:
Найти месторождение (разведка) → Построить НПЗ (переработка) → Стандартизировать продукт (бензин) → Построить каналы сбыта (АЗС) → Продать пользователям.
Для нас, простых людей, «нефть данных» эпохи ИИ также должна быть строго разбита на эти шаги. Пропусти один элемент, и твоя тревога по поводу ИИ никогда не превратится в продуктивность, а останется лишь ментальным истощением в виде «чтения новостей + сохранения ссылок + наблюдения за тем, как другие богатеют».
Ниже я разберу, как же действовать, ребята, следуя этой логике.
三、Шаг первый: Где месторождение? — Ищите «маленькие богатые залежи» рядом с собой
В традиционной отрасли нужно ехать в Саудовскую Аравию, Россию за нефтью. Но на нашем пути месторождение фактически у вас под рукой. Я думаю, есть как минимум две большие категории.
1. Личные приватные данные: ваш собственный задний двор
Это самый упускаемый из виду, но самый надежный тип данных. Ему не нужен большой масштаб, но чистота крайне высока.
Например, ваш рабочий процесс, логика принятия решений, провалы (разбор ошибок), а также неписаные правила, которые вы узнали за годы работы в индустрии.
Или ваши цифровые следы: заметки, написанные за последние десять лет, базы кода, черновики, emails... все это считается.
Ценность этого в том, что это полностью ваше. «Цифровой двойник» или «агент-эксперт в предметной области», обученный на этих данных, не заменит ни одна универсальная большая модель.
Если за последние 5 лет в вашей работе и жизни вы почти не пользовались компьютером, а полагались только на телефон, то вы, скорее всего, вряд ли станете производителем ИИ, а обречены быть лишь потребителем ИИ.
Если действительно хотите зарабатывать на ИИ, я думаю, нужно купить компьютер. Почему?
Потому что без компьютера у вас, скорее всего, нет систематизированных накопленных данных, вы —彻头彻尾的 «бедная нефтью страна». Не надейтесь, что несколько картинок в альбоме телефона или десятки ГБ голосовых сообщений и болтовни в WeChat смогут сделать что-то великое — слишком много примесей, слишком плохая структура, из этого не получится合格 92-го бензина, максимум на 29-й бензин.
2. Богатые залежи публичных данных: сформируйте свою «разведывательную партию»
Второй тип — это данные, которые все могут видеть, но 99% людей лишь «потребляют», а не «ведут разведку»: X.com, WeChat Official Accounts, arXiv, YouTube... это «открытое море» эпохи данных.
Нынешний интернет, особенно социальные сети, слишком быстро деградирует. Осмелюсь сказать, что точно более 50%, а возможно, и более 90% контента — это AGRC (AI Generated Rubbish Content, мусорный контент, сгенерированный ИИ).
Эти люди используют ИИ для массового производства пустых слов, напрямую загрязняя пласт. Если вы не осознаете этого при геологической разведке, вы принесете обратно один мусор.
Что еще хуже: если вы скормите мусор своему мозгу или ИИ, то в итоге переработаете也只能 мусор, и даже можете засорить свой НПЗ.
Поэтому, чтобы гарантировать, что вы добываете не AGRC, я советую создать тщательно отфильтрованный **«портфель источников вдохновения». Но注意: просто смотреть бесполезно, это называется накопление сырой нефти. Вы должны научиться первичной переработке нефти ** — каждый источник нужно пропускать через ИИ, превращая их в топливо, понятное машине:
Глубокие осадочные породы (книги): Это балласт. Составьте годовой список для чтения, должны быть профессиональная классика, литература.
Метод с ИИ: Не просто тупо читайте. Обязательно используйте Gemini или ChatGPT для辅助 чтения, после главы обсуждайте с ним, пусть задает вопросы для размышления. После прочтения обязательно делайте электронные заметки, кормите ИИ — это ваша база знаний.
Передовой разведочный район (статьи и отчеты): Почаще заглядывайте на arXiv или Google Scholar. Устраивайте еженедельные «ланч-семинары по статьям», заставляйте себя разобрать одну.
Метод с ИИ: Не можете читать сырой текст? Бросьте PDF прямо в NotebookLM или ChatGPT, пусть он суммирует основные аргументы и данные, превратит «трудные для пережевывания кости» в «концентрированный бульон» для хранения.
Поверхностный сток (новости): Используйте RSS или настраиваемые ленты. Я просматриваю заголовки новостей, глубоко сохраняю только действительно крутые.
Метод с ИИ: Не просто сохраняйте ссылки. Копируйте содержание, пусть ИИ поможет поставить теги, извлечь ключевые слова, классифицировать и сохранить в ваше приложение для заметок, иначе они просто будут пылиться.
Попутные газовые месторождения (подкасты и лекции): По дороге на работу слушайте что-то вроде TED Radio Hour. Заставляйте себя раз в месяц посещать пару оффлайн-мероприятий.
Метод с ИИ: Услышав хорошую мысль, не просто кивайте. Используйте Whisper для преобразования аудио в текст, затем пусть ИИ организует его в структурированные заметки. Звук нельзя искать, а текст — можно.
Высокодебитные нефтяные скважины (социальные сети): В Twitter/X подпишитесь на ряд настоящих экспертов. Регулярно чистите список подписок, отписывайтесь от тех, кто постит мусор и эмоции.
Метод с ИИ: Увидели крутой тред, скопируйте его ИИ, пусть проанализирует, где логические漏洞 этого человека, или интегрирует его观点 в вашу систему знаний.
Полевые исследования (наблюдения за жизнью, полевая работа): Сознательно практикуйте «взгляд на жизнь с вопросом». Это чувственные данные, которые ИИ-пауки никак не соберят.
Метод с ИИ: Не печатайте, когда приходит вдохновение, говорите прямо в голосовом сообщении, затем бросьте ИИ для организации в дневник. Пусть ИИ поможет превратить поток сознания в логическое инсайт.
Мы должны выработать привычку随时 брать телефон и надиктовывать кучу всего в Douban (или аналоги).
Эти шесть источников — ваш «смешанный нефтеносный район». Только если ваши входные данные достаточно разнообразны и дики, и все они прошли первичную обработку ИИ, то то, что вы переработаете, не будет банальным.
四、Шаг второй: Где оборудование для переработки? — Не смотрите только на большие модели
Найдя нефть, следующий шаг — переработка. Мейнстримные СМИ ежедневно уговаривают вас купить видеокарту, но для отдельного человека настоящим НПЗ обязательно является ваш собственный программный стек + мыслительный процесс.
1. Большая модель — это всего лишь «котел»
Оформив подписку ChatGPT Plus, мы сами по себе не становимся круче, это как купить котел и стоять рядом, восхищаясь его блеском — но вы же не работаете!
ChatGPT, DeepSeek и другие большие модели, по сути, являются базовыми силовыми установками, фундаментом. Они могут гореть, но это не значит, что вы можете производить нефтепродукты.
2. Настоящий НПЗ — это «личная система инструментов»
Эффективный личный НПЗ должен иметь следующие компоненты:
Трубопроводы (инструментарий): VS Code, Python, Skills и тому подобное.
Технологический процесс (методология): Это и есть основное конкурентное преимущество. То, как вы пишете промпты, как создаете базу знаний RAG, как заставляете несколько агентов (skills) работать согласованно.
Главное — никогда не в «силе модели», а в том: как вы взаимодействуете с ИИ, как переводите неявный опыт из своей головы в инструкции, понятные ИИ.
Эта «личная инженерная система» и есть ваш НПЗ, а не сама модель.
五、Шаг третий: Продукт — не конечная цель, продать — вот настоящая битва
Это самое жестокое звено во всей цепочке. China National Petroleum Corporation достаточно доставить нефть на АЗС, и автомобилисты сами выстроятся в очередь. Но в эпоху ИИ продуктовизация и продажи чертовски сложны.
1. «Бензин», переработанный ИИ, крайне нестандартен
То, что вы переработаете с помощью «личных данных» + «большой модели», скорее всего, будет не универсальным бензином, а:
- Скрипт на Python, который можете использовать только вы
- Статья с уникальным стилем
- Обработанный ИИ отчет после визита к врачу на обследование
- Персонализированные рекомендации по юридической консультации
Эти штуки не универсальны, не стандартны и очень зависят от сценария.
2. Главный вопрос: Кому продавать?
Поэтому, прежде чем действовать, нужно спросить себя: кому, черт возьми, я буду продавать то, что сделаю? Это, по сути, обратное обоснование того, какой бензин нам перерабатывать?
Продавать себе (для личного использования): Экономия времени — это заработок, это самый простой闭环.
Продавать предприятиям (B2B): Упакуйте свои промпты или рабочие процессы в решение. Это требует от вас исключительных предпродажных способностей (умения «впарить»).
Продавать массовому потребителю (B2C): Сделайте приложение или контент-колонку. Тут все зависит от вашей способности к дистрибуции трафика.
На самом деле: в эпоху ИИ перерабатывать нефть (генерировать контент) становится все легче, но строить АЗС (дистрибуция и продажи) невероятно сложно.
六、Не забывайте об экологии: не позволяйте отходам похоронить вас
Традиционная переработка нефти produces отходы, сточные воды, выбросы. Если вы не будете с ними бороться, ваш НПЗ еще не заработает, а вы уже задохнетесь.
Переработка данных也一样,** «киберзагрязнение» ** чрезвычайно серьезно, необходимо иметь «отдел охраны окружающей среды» для регулярной очистки.
1. Очистка устаревшего «инструментального шлака»
ИИ развивается слишком чертовски быстро, просто невероятно.
«10 обязательных навигационных сайтов ИИ на 2025 год», которые вы сохранили в прошлом месяце, на этой неделе, возможно, пять из них обанкротились; параметры рисования ИИ, которые вы сегодня усердно изучаете, завтра, возможно, будут уничтожены функцией «сгенерировать одним кликом».
Ни в коем случае не будьте «киберсобирателем хлама», копите кучу устаревших инструментов и не можете выбросить. Удаляйте, отписывайтесь. Инструменты нужны для использования, а не для поклонения.
Накопление устаревших инструментов — все равно что завалить дом ржавым металлоломом, это только замедлит вашу работу.
2. Откажитесь от истощенных «пустых оболочек данных»
У многих есть «синдром белки»: видят PDF — скачивают, видят видео — сохраняют, жесткие диски забиты терабайтами материалов, и они feel, что владеют миром.
Это не знания, это мусор на свалке.
Правильный экологичный подход: использовать ИИ для выжимки «масла» из PDF, видео, длинных статей — генерировать резюме, извлекать ключевые фразы, преобразовывать в ваши заметки.
Как только выжали, выбрасывайте исходный файл (или архивируйте в холодное хранилище). Ваше внимание —极其 ценный ограниченный ресурс, не позволяйте этим исходным файлам占用 вашу пропускную способность.
Сохраняйте только «переработанное топливо», выбрасывайте «пустые оболочки сырой нефти» — вот что такое эффективный НПЗ.
3. Разорвите эти «высасывающие кровь зомби-подписки»
Тревога по поводу ИИ заставляет нас делать много глупостей, и одна из самых глупых — это спешка потратить деньги ради чувства безопасности.
Запись на курсы, покупка уроков, посещение конференций, покупка подписки Plus... все это недешево. Что еще хуже, многие вещи,一旦 подписаны (с ежемесячным списанием), вы часто забываете отменить.
Я once купил сервер для тестирования, прошло уже более трех лет, он каждый месяц тихо списывает с меня деньги, прячась среди一堆 счетов, а я даже не знал — использовал его только в день тестирования.
Еще я в порыве купил кучу автоматических продлений: ChatGPT, Gemini, Claude, Perplexity...... и еще купил немного API. И что в итоге? Большую часть времени они простаивают.
Черт, какая же это waste.
Все это must быть очищено в рамках «экологии». Иначе вы еще не переработаете продаваемое масло, а ваши сбережения уже будут украдены этим загрязнением.
七、В заключение два слова: карта действий
Когда мы снимаем грандиозную оболочку с «данные — это новая нефть», она перестает быть недостижимой капиталистической историей и становится суровой дорожной картой для простых людей.
В эту эпоху, если вы хотите победить, срочно проверьте свой «баланс»:
- Запасы: Вы все еще листаете Douyin? Или уже сознательно накапливаете качественные данные через «источники вдохновения» + помощь ИИ? (Не forget избегать мусора AGRC)
- Производственные мощности: Есть ли у вас свой собственный набор инструментов и методология (НПЗ), и что перерабатывать?
- Каналы сбыта: Вы определились, кому именно вы будете продавать эти нестандартные продукты? Это может обратно обосновать производственные мощности, какой именно бензин перерабатывать — 92-й или 98-й.
- Экология: Накопили ли вы кучу цифрового мусора? Проверили ли вы выписки по кредитным картам, чтобы отменить эти зомби-подписки?
Последний совет: забудьте эти новости о миллиардах параметров. Начните сегодня — купите компьютер, создайте свои «источники данных для вдохновения», пробурите свою первую маленькую скважину, сначала продайте себе, переработайте свою работу в автоматизированный инструмент, где ИИ главный, а вы —辅助.
Честно говоря, я тоже в замешательстве, я折腾 ИИ уже более трех лет и ничего не переработал. Переработал только ИИ для управления моим to do list и ИИ для управления моими заметками о чтении, я все еще думаю, что же можно переработать?






