GPT之父把AI扔回1930年:没见过一行代码,却「发明」了Python

marsbitОпубликовано 2026-04-29Обновлено 2026-04-29

你敢信?一个活在95年前的AI,竟写出了Python代码。GPT之父下场,用2600亿Token炼出了一个「老古董」AI。

一个从未见过电脑的AI,竟写出了现代编程语言!

这可不是什么科幻的设定。

就在今天,GPT之父Alec Radford带队发布了震撼全网的「talkie」——

总参数130亿,一个只读过1931年之前旧文献的大模型。

talkie的「世界观」(全部训练数据),被冻结在了1930年12月31日。

那个时代,没有互联网,没有维基百科,更没有任何现代代码。

它读过的最「新」的东西,是近百年前的专利书、科学期刊、礼仪手册和私人书信。

但就是这样一个「活在95年前」的AI,居然能写出Python代码。

没学过编程,

却写出了Python,理解了「逆函数」

talkie最炸裂的发现,藏在一组编程测试里。

Alec Radford团队突发奇想,用HumanEval去测试talkie的编程能力——

给它几个Python函数作为上下文示例,然后让它解决新的编程问题。

要知道,talkie的训练数据中,没有任何一行现代代码。连数字计算机的概念,都不存在于它的「知识体系」中。

但结果令人震惊,通过少样本学习,它竟然能写出正确的Python程序。

虽然目前只能完成简单的单行程序,比如两个数相加,或者对上下文示例做微小修改。

Alec Radford:GPT、CLIP、Whisper背后核心大佬

但其中一个案例让人印象深刻:给定一个旋转密码的编码函数encode_shift,它的逻辑是把每个字母在字母表中向后移动5位。

talkie自己写出了对应的解码函数,整个修改只有一个字符:把+5改成了-5,加号换成了减号。

它真正理解了「逆函数」:加密是加,解密就是减」这个逆运算的概念。

传送门:https://talkie-lm.com/chat

2600亿Token,专喂百年前的纸

Alec Radford团队为什么要费这么大劲,手动OCR近百年前的物理文献,来训练一个「老古董」?

因为他们要回答AI领域最核心的一个问题:LLM的能力,到底是推理,还是背诵?

talkie可以写出Python,证明了——

LLM可以用19世纪的知识做推理,并非只是检索。不得不说,这才是真正意义上的「泛化」!

再来看talkie的训练语料库,可以称得上是一个庞大的「考古工程」。

它的训练语料达到了2600亿token,全部来自1931年之前的英语文本,包括书籍、报纸、期刊、科学论文、美国专利、判例法。

要知道,这么多文本皆需要从实体文档扫描并OCR转录。

而选择1930年作为截止日期,原因很实际:这是美国公共版权法(public domain)的分界线。

不过,这带来了一个意想不到的瓶颈:数据质量。

团队做了一组对照实验:用传统OCR系统转录的旧文本训练模型,和用人工转录的同一批文本训练模型相比,前者的学习效率只有后者的30%。

简单的正则清洗能把这个数字提升到70%,但仍然有巨大的差距。

在评估talkie性能实验中,团队又打造了一个「现代孪生体」(talkie-web-13b-base)。

后者用FineWeb的现代网络数据训练,两款模型用了「相同的算力」。

显而易见,在核心语言理解、数学推理任务上,talkie的表现与现代孪生体相当。

但在通用知识评测上,即使剔除了对1930年视角来说「穿越」的题目,talkie仍然落后。

团队怀疑,这跟数据质量有很大关系。

为此,Radford团队计划从零开始训练「复古OCR系统」,专门用于重新转录1931年前的文本。

用最现代的Claude 4.6

训练最古老的AI

talkie的「后训练」方案也很有意思。

要把一个只读过旧书的「基础模型」变成能对话的聊天机器人,根本没有现成的指令微调的数据可用。

团队的做法是,从1930年之前的结构化参考书中提取指令-回答对:礼仪手册、书信写作指南、菜谱、百科全书、诗歌集。

然后,再用这些「复古教材」做第一轮SFT。

在接下来的RLAIF阶段,团队用在线DPO来提升talkie的指令遵循能力,Claude Sonnet 4.6作为裁判。

一个2026年最先进的AI,给一个「活在」1930年的AI打分。

最终的精调阶段,团队甚至用Claude Opus 4.6生成多轮对话数据,来打磨talkie的对话能力。

训练过程中,Claude对talkie指令遵循能力的评分从2.0提升到了3.4(满分5分)。

最后一步,用Claude Opus 4.6与talkie进行多轮合成对话,再做一轮拒绝采样+SFT,打磨对话能力。

团队也坦承了一个讽刺之处:用现代大模型训练一个本该冻结在1930年的模型,本身就是一种「时间污染」。

他们的长期目标是用复古基座模型自身作为裁判,实现完全「自举式」的后训练流水线。

值得一提的是,talkie的7B版本在RL训练后出现了一个搞笑的副作用——

它开始用列表体说话,纯属是被现代AI的「坏习惯」传染了。

AI界最干净的一次「开卷考试」

研究团队还做了另一个有趣的实验。

他们从《纽约时报》的「历史上的今天」栏目中提取了近5000条历史事件描述,计算talkie对每条事件的「惊讶度」。

结果非常清晰,1930年之前的事件,talkie不太惊讶。1930年之后的事件,惊讶度开始攀升。

到了1950年代和1960年代达到峰值,然后趋于平稳。

这条曲线本身就是一个关于预测能力的实验。随着模型规模增大,这条曲线会怎么变化?

谷歌DeepMind CEO Demis Hassabis曾提出一个思想实验——

一个只训练到1911年的模型,能不能像爱因斯坦在1915年那样独立发现广义相对论?

talkie目前当然做不到。但它提供了一条路径,往上Scale就行了。

今夏扩展到GPT-3级别

talkie目前是130亿参数,团队的路线图相当激进——

今年夏天,发布GPT-3级别的复古模型。

更远期的目标:将语料扩展到超过一万亿token,理论上足够训练一个GPT-3.5级别的模型,能力接近初代ChatGPT。

一个冻结在1930年的ChatGPT。

参考资料:

https://x.com/status_effects/status/2048878495539843211?s=20

https://talkie-lm.com/introducing-talkie

本文来自微信公众号“新智元”,作者:新智元

Трендовые криптовалюты

Похожее

Треугольник невозможного — это вообще псевдопроблема

Автор Билли Гао утверждает, что основное ограничение для массового внедрения блокчейн-технологий не в классической «трилемме» (масштабируемость, децентрализация, безопасность), а в двух фундаментальных недостатках: отсутствии легитимности и конфиденциальности. Несмотря на создание мощнейшей криптографической системы, все транзакции и балансы по умолчанию прозрачны для всех, что аналогично постоянному налогу из-за MEV (максимально извлекаемой стоимости) и препятствует входу институционального капитала. Блокчейн — это медленный, дорогой, но беспристрастный компьютер общего пользования, идеально подходящий для учета активов, которыми и является сам этот учет (например, деньги). Однако его реальное использование ограничивается узкой прослойкой пользователей, тогда как крупные фонды и обычные люди не могут его применять из-за юридических рисков и полной публичности финансовой деятельности. Первый недостаток — легитимность — начинает решаться через регулирование (например, закон GENIUS). Второй и главный — «прозрачность как налог» — требует внедрения конфиденциальности по умолчанию с помощью современных криптографических инструментов, таких как доказательства с нулевым разглашением. Это позволит доказывать соответствие правилам (например, платежеспособность или KYC), не раскрывая самих данных. Таким образом, добавление проверяемой конфиденциальности к децентрализованному консенсусу — это чистое улучшение, которое откроет блокчейн для триллионов долларов институциональных и частных капиталов, для которых он изначально и был предназначен.

marsbit6 ч. назад

Треугольник невозможного — это вообще псевдопроблема

marsbit6 ч. назад

Трилемма невозможности — это искусственная проблема

**Резюме: "Невозможный треугольник" — это псевдопроблема** Криптоиндустрия построила мощнейшую криптографическую систему, но она не обеспечивает приватности финансовых операций по умолчанию. Все транзакции и балансы публичны. Основная причина, по которой триллионы долларов не переходят на блокчейн — не в масштабируемости (старая "трилемма" решена), а в двух других, более фундаментальных недостатках: **легитимности и конфиденциальности**. **Легитимность**: Безграничный доступ (permissionless) создаёт правовую неопределённость для крупного капитала. Однако с появлением регуляторных рамок (например, закона GENIUS) этот барьер начинает снижаться. **Конфиденциальность (Приватность)**: Прозрачность блокчейна — это не преимущество, а **налог**. Публичность каждой позиции и транзакции приводит к потерям от MEV, фронтраннинга и слежки, что неприемлемо для институциональных инвесторов, фондов и обычных пользователей. Парадокс в том, что система, построенная на криптографии, не шифрует основную деятельность пользователей — их финансы. Однако современные криптографические примитивы (например, доказательства с нулевым разглашением — zk-SNARKs) позволяют решить эту проблему, не жертвуя проверяемостью (аудитом) или соблюдением норм (compliance). Можно доказать платёжеспособность, пройденный KYC или соответствие лимитам, не раскрывая самих данных. **Вывод**: Добавление **доказуемой приватности с возможностью контролируемого раскрытия информации** — это чистое улучшение текущей модели. Оно закрывает главные барьеры для институционального капитала, превращая блокчейн из "публичной таблицы" в конфиденциальный и легитимный расчётный слой, для которого он, по сути, и был предназначен. Только тогда наступит переход к массовому использованию.

链捕手6 ч. назад

Трилемма невозможности — это искусственная проблема

链捕手6 ч. назад

Оптические чипы: коллективное расширение производства

Рост спроса на оптические чипы для ИИ-инфраструктуры стимулирует глобальную волну расширения производственных мощностей. В США Coherent получает государственное финансирование для расширения завода по производству 6-дюймовых InP-пластин, а также заключает стратегические сделки с NVIDIA. Nokia наращивает мощности по тестированию и упаковке фотонных чипов. В Японии JX Advanced Metals инвестирует в увеличение производства InP-подложек в 7–10 раз. Европейские компании, такие как Tower Semiconductor и ST, активно расширяют производство кремниевой фотоники, заключая долгосрочные соглашения. Китай демонстрирует агрессивный рост: Soarse расширяет производство чипов и модулей, Sanan Photonics наращивает выпуск InP-чипов, а Yunnan Germanium увеличивает мощности по производству пластин. Основной движущей силой является растущая потребность ИИ-центров обработки данных в пропускной способности, что требует большего количества оптических компонентов независимо от того, будут ли использоваться традиционные съемные модули или перспективные технологии, такие как CPO, NPO или гибридные архитектуры. Гонка за лидерство в эпоху фотоники набирает обороты, поскольку США, Япония, Европа и Китай стремятся укрепить свои позиции в цепочке поставок.

marsbit8 ч. назад

Оптические чипы: коллективное расширение производства

marsbit8 ч. назад

1996 или 1999? Первым испытанием Уолша стало «Как смотреть на ИИ»

Назначенный председателем ФРС Вош столкнулся с ключевой дилеммой: как оценить текущий бум искусственного интеллекта? Экономисты разделились на два лагеря. Одни считают, что рост производительности благодаря ИИ скоро подавит инфляцию, позволяя ФРС бездействовать. Другие предупреждают, что спрос опережает предложение, и промедление с повышением ставок приведёт к необходимости более резких мер в будущем. Вош, судя по заявлениям, склоняется к подходу 1996 года, когда Алан Гринспен не стал повышать ставки во время бума производительности, что оказалось верным решением. Однако нынешняя ситуация отличается: растущие тарифы, большой дефицит бюджета и снижение выгод глобализации создают дополнительное инфляционное давление. Критики, такие как глава Чикагского ФРС Гулсби, утверждают, что ожидаемый всеми рост производительности от ИИ уже сейчас вызывает перегрев экономики, так как люди и компании увеличивают расходы в ожидании будущих выгод. Это требует более жёсткой денежно-кредитной политики. Оппоненты отмечают, что многие домохозяйства не могут брать кредиты под будущий рост доходов, что ослабляет этот эффект. Вош также сталкивается с парадоксом: он хочет отказаться от практики «прогнозирующего руководства» (forward guidance), установленной как раз в 1999 году для предупреждения рынков о ужесточении политики. Если экономика пойдёт по сценарию 1999 года, ему придётся либо использовать эту практику, либо рисковать вызвать рыночные потрясения молчанием. Таким образом, первый серьёзный вызов для Воша — определить, повторяет ли экономика оптимистичный сценарий 1996 года или ведёт к необходимости жёстких мер по образцу 1999 года. От этого выбора зависит не только ближайшая политика ФРС, но и его историческая репутация.

marsbit11 ч. назад

1996 или 1999? Первым испытанием Уолша стало «Как смотреть на ИИ»

marsbit11 ч. назад

Отчет по Ethereum за первый квартал 2026 года: снижение комиссий, рекордное количество пользователей и транзакций

В первом квартале 2026 года сеть Ethereum продемонстрировала парадоксальную динамику: количество активных пользователей, транзакций и пропускная способность достигли исторических максимумов, в то время как комиссии за транзакции, общая заблокированная стоимость (TVL), объем торгов и рыночная капитализация ETH снизились. Этот феномен объясняется стратегическим переходом к этапу «низких комиссий для роста масштаба» после обновления Fusaka, которое удешевило блок-пространство. Парадокс Джевонса проявляется в том, что снижение стоимости использования высвобождает новый спрос. Ключевой тренд — смещение нарратива от DeFi-платформы к глобальному расчетному слою для институциональных финансов. Ethereum сохраняет доминирующую позицию в сегментах стейблкоинов (61,8% среди топ-5 сетей), токенизированных фондов (73%) и товаров (84%), привлекающих таких гигантов, как BlackRock и JPMorgan. Инвестиции в масштабирование и снижение комиссий нацелены на укрепление сетевых эффектов и долгосрочную ценность ETH как базового актива для расчетов в цифровой экономике.

marsbit12 ч. назад

Отчет по Ethereum за первый квартал 2026 года: снижение комиссий, рекордное количество пользователей и транзакций

marsbit12 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.9k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片