梁文锋留住97%员工

marsbitОпубликовано 2026-05-04Обновлено 2026-05-04

“确实在接触DeepSeek融资”,一位FA机构朋友告诉我们。

过去半个月,DeepSeek终于开启融资的消息发酵。而外界归结这次“反常”时几乎都不可避免提到:梁文锋要给内部核心员工一个确定的估值了。

毕竟这一年,大模型竞争日趋焦灼,DeepSeek核心人才流动沸沸扬扬,诸如罗福莉、王炳宣、郭达雅等人陆续跳至小米、腾讯和字节。

喧嚣之外,一组数据映射出更为平和的情况——DeepSeek V4在4月下旬终于发布,技术报告里一份长长的作者致谢名单显示,研究工程团队约270人中10人在研发期间离去。对应下来,技术研发人员离职率不到4%。

其实梁文锋留住了绝大多数人。

掀开DeepSeek跳槽风波,10名员工离开

2023年起,一种强烈的推背感袭来。

ChatGPT席卷之后,月之暗面、阶跃星辰、MiniMax等明星公司纷纷在这年或前后成立,豆包、通义千问、文心一言等大厂大模型产品密集涌现。

不早不晚地,梁文锋也在这一年将DeepSeek落地北京和杭州。

此时他罕见的一次对外分享中,聊到了人才观:DeepSeek大部分开发人员都是应届毕业生或AI从业时间不长,如果追求短期目标,招聘有经验的人当然没错,但从长远来看,基本技能、创造力和热情更为重要。

确实如此。2025年初,DeepSeek R1实力爆发,人们才开始真正关注到这个约150人规模的团队,许多都是国内TOP高校刚毕业或还没毕业的年轻人,清北含量极高。

几乎不可避免,此后一年里,人才流动的话题开始袭向DeepSeek。

2025年开始,DeepSeek传出罗福莉、王炳宣、魏浩然、阮翀等核心骨干离职,其中不少人跳槽他处成为核心业务负责人。坊间为此做了个通俗易懂的打趣:“当DeepSeek内部成员发现段位差不多的人跳槽出去能拿到那么多,那我为什么不可以?”

直到2026年初,随着郭达雅跳槽去字节seed团队,关于DeepSeek人才流失的讨论被推至高点,而当时配上迟迟不发布的DeepSeek V4,难免令人生出几分青黄不接隐忧。

但现实并没有这么沮丧。如今DeepSeek V4终于亮相,在同步发布的技术报告中披露了一份作者致谢名单。细细看下来,其Research & Engineering也就是研究工程团队约270人,这部分也被认为是一家AI公司最核心的研发团队,另有Business& Compliance即商业合规成员48人。

在DeepSeek V4研发期间,只有10名研究工程团队的成员离开。

也就是说,270人的研发团队10人选择离开,核心部门离职率仅不到4%——这已经足够低。一组数据显示,OpenAI 前两年流失了超过25%的关键研究人才,他们大多跳槽去了Meta等竞争对手或自行创业。

首次打开融资大门,稳定军心

眼下创投圈尤其期待:谁能参与DeepSeek的首次融资?

4月开始,DeepSeek最先被爆正以超100亿美元的估值启动首轮外部融资。随后不过一周,消息称DeepSeek与腾讯阿里就投资展开洽谈。后来业内流传,DeepSeek投前估值3000亿人民币。

截至目前,DeepSeek未对融资消息做出任何回应。

一位FA告诉我们,近日在和投资机构接触关于DeepSeek融资的合作方式,本轮融资中财务投资机构极少。另一点也得到证实:腾讯与DeepSeek在日常业务上有沟通,但并无融资的实质性接洽。

一切仍扑朔迷离。

4月27日,DeepSeek注册资本由1000万元增加至1500万元,其中梁文锋认缴的注册资本由10万元增加到510万元,直接持股比例由1%升至34%,同步地,梁文锋控制的宁波程恩企业管理咨询合伙企业持股比例由99%下降至66%。此次变化后,梁文锋以间接、直接方式持有DeepSeek约84.29%股权。

值得注意的是,此前梁文锋通过宁波程恩持有DeepSeek绝大多数股权,直接持股极少,而这次变化后,梁文锋直接持股比例上升到34%。如此一来,梁文锋的控股权摆在了更容易被看见的位置——如果开展融资尽调,DeepSeek股权结构会显得更加清晰。

“不是绝大多数人能参与的”,投资人们由衷感叹。诚然,中国大模型江湖经历一番鏖战后,DeepSeek依旧很吸引人。

正如DeepSeek V4预览版终于亮相,Pro版和Flash版百万上下文标配,Pro版高至1.6万亿参数,价格感人:Pro每百万token输入1元(缓存命中)或 12元(缓存未命中),输出24元,Flash分别为0.2元、1元、2元。

与此同时,传闻的国产芯片适配证实,DeepSeek V4技术报告中,虽然能看出模型训练部分依然大概率用的英伟达芯片,但华为昇腾和英伟达并列写在验证平台,“预计下半年昇腾950超节点批量上市并部署之后,Pro版本的价格也会大幅度下调。”

这一举,意味着DeepSeek在英伟达坚固的CUDA生态敲开了一条裂缝。背后的想象力不言而喻。

梁文锋的笃定,国产AI时代真正开始

梁文锋和DeepSeek走在一条反共识的路上。

通常,一家明星科技公司的时钟是这样的:在崭露锋芒之际把握融资机会,伴随人才扩张和产品迭代加速,尽快占领市场并谋求上市。这个动作一旦串联起来,就很难停下来。

但DeepSeek的每个环节都出乎意料慢一些。

2025年初DeepSeek R1发布之际,梁文锋几乎没有对手,但锋芒毕露时他拒绝了所有前来叩门的投资人。偏偏是在竞争白热化、对手林立的今天,DeepSeek首次放出融资消息,外界讨论归因大多绕不开两点:研发需要资金,更深一层,DeepSeek需要给内部人才一个确定的估值。

产品迭代同样姗姗而来。DeepSeek V4发布距离上一版重大更新已经过去15个月,千呼万唤始出来,DeepSeek只先放出了V4预览版,一直视为缺憾的多模态也未同步更新。直到4月29日,DeepSeek才上线灰测识图模式,释放出多模态能力信号。

“不诱于誉,不恐于诽”,这是DeepSeek的姿态。而市场给出的反馈,似乎验证着某种事缓则圆。

DeepSeek V4发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯等国产AI芯片就完成了适配。一时间,激起二级市场国产芯片上涨的“一池春水”。

与此同时,消息显示华为昇腾950系列AI芯片的市场需求大幅飙升,字节、腾讯、阿里三大国内头部互联网企业,已就新增芯片订单与华为展开接洽。

于是,一个反共识者,用慢节奏触发了产业共振——当底层芯片商与头部大厂开始围绕DeepSeek的标尺去咬合进化时,DeepSeek或许已经跃出了原本的竞争牌桌。

一如那句:慢就是快。只是,真正敢信的人并不多。

本文来自微信公众号 “投资界”(ID:pedaily2012),作者:冯雨晨

Похожее

Только что привлек $2,7 миллиарда, и Ли Фэйфэй тоже вложила деньги

В венчурном рынке «мировые модели» стали горячей темой, но Пит Флоренс, сооснователь и бывший ведущий исследователь Google DeepMind, публично отверг этот ярлык для своей компании Generalist AI. Несмотря на то, что он был ключевым разработчиком архитектуры VLA, лежащей в основе многих современных «мировых моделей», Флоренс считает, что акцент должен делаться на конкретных целях, а не на модных терминах. Его цель — создать роботов, способных с высокой надежностью выполнять самые разные задачи без специального обучения для каждой. Недавно Generalist AI привлекла $4 млрд в ходе раунда финансирования при оценке в $20 млрд. Среди инвесторов — NVentures (Nvidia), Bezos Expeditions, фонд NFDG, сооснователь Xiaomi Линь Бинь, основатель Zoom Эрик Юань и известный ученый в области ИИ Ли Фэйфэй. Подход Флоренса сформировался под влиянием его научного руководителя в MIT, Рус Тедрейка, который делал акцент на понимании физики. В Generalist AI этот подход выражается в последовательной разработке моделей, нацеленных на практическую полезность. Их первая модель, GEN-0, продемонстрировала, что законы масштабирования, как у больших языковых моделей, применимы и к физическим действиям. В апреле 2026 года была представлена GEN-1, обученная на более чем 50 тысячах часов данных, собранных с помощью специальных перчаток. Она достигает 99% успеха в таких задачах, как складывание коробок, и работает в три раза быстрее предыдущей версии. Флоренс считает, что производительность GEN-1 приближается к переломному моменту, необходимому для коммерческого развертывания. Финансирование, полученное после ее демонстрации, подтверждает веру инвесторов в его целеориентированный подход к созданию универсальных роботов, которые могут изменить экономику физического труда.

marsbitТолько что

Только что привлек $2,7 миллиарда, и Ли Фэйфэй тоже вложила деньги

marsbitТолько что

За три дня потеряли двух легенд: дамба AI-талантов Google трещит по швам?

За последние три дня Google потеряла двух ведущих специалистов по ИИ: Ноама Шазера, одного из авторов архитектуры Transformer, присоединившегося к OpenAI, и Джона Джампера, руководителя проекта AlphaFold и нобелевского лауреата, перешедшего в Anthropic. Эти события не являются изолированными случаями — они отражают устойчивую тенденцию оттока ключевых талантов из Google в сторону OpenAI и Anthropic. Основная причина — фундаментальное несоответствие миссий. Коммерческие цели Google, ориентированные на рекламный бизнес, ограничивают фундаментальные исследования, в то время как OpenAI и Anthropic предлагают фокус на развитии ИИ и безопасности. Кроме того, перспектива скорого IPO OpenAI и Anthropic сулит сотрудникам значительный финансовый рост, чего не может предложить зрелый гигант вроде Google. Слияние Google Brain и DeepMind в 2023 году, предназначенное для консолидации усилий, на практике усилило внутренние трения между исследовательской и продуктовой культурами, увеличив давление коммерциализации на науку. Этот структурный отток талантов перекраивает ландшафт индустрии. Несмотря на сохраняющиеся преимущества в вычислительных ресурсах и данных, Google рискует проиграть в гонке, где ключевым активом являются люди, продвигающие технологические границы. Способность удерживать этих людей становится для компании самой сложной задачей.

marsbit2 ч. назад

За три дня потеряли двух легенд: дамба AI-талантов Google трещит по швам?

marsbit2 ч. назад

За оценками ИИ скрывается китайский «составитель тестов»

За кулисами результатов ведущих ИИ-моделей, таких как GPT и Gemini, часто стоит один и тот же «составитель заданий» — китайский исследователь Чэнь Вэньху. Будучи доцентом Университета Ватерлоо и основателем лаборатории TIGERLab, он разработал ключевые оценочные эталоны MMLU-Pro, MMMU и MMMU-Pro, которые стали общим языком для сравнения способностей моделей. Чэнь Вэньху сосредоточился на создании более сложных и устойчивых тестов, когда предыдущие эталоны, такие как MMLU, перестали эффективно различать передовые модели, достигшие почти идеальных результатов. MMLU-Pro, с его 12032 вопросами, расширенными вариантами ответов и акцентом на рассуждения, снизил точность моделей на 16–33% и уменьшил зависимость от угадывания. MMMU и MMMU-Pro, в свою очередь, оценивают мультимодальное понимание, требуя от моделей анализа изображений, таблиц, схем и текста в контексте профессиональных знаний, что выявило значительные ограничения даже у самых мощных моделей. Исследования Чэнь Вэньху в области сложных вопросно-ответных систем и его опыт работы в Google DeepMind над Gemini позволили ему глубоко понять слабые места в оценке ИИ. Его лаборатория также занимается разработкой моделей, таких как UniVideo и Vamba, что помогает создавать более точные и релевантные тесты. Сегодня, работая в лаборатории суперинтеллекта Meta, Чэнь Вэньху продолжает влиять на развитие ИИ через улучшение данных для предобучения и систем оценки, оставаясь ключевой, но менее заметной фигурой в этой быстроразвивающейся области.

marsbit2 ч. назад

За оценками ИИ скрывается китайский «составитель тестов»

marsbit2 ч. назад

Письмо основателям от сооснователей Alliance: К моменту продажи Cursor за 600 миллиардов долларов

Автор статьи, опираясь на пример успешной продажи компании Cursor за 600 миллиардов долларов, обращается к начинающим предпринимателям. Он развеивает иллюзию, что все великие возможности уже исчерпаны. На примере Cursor, Stripe, Figma, Shopify и других компаний показано, что их путь начинался не в «мейнстриме», а с неочевидного для других убеждения в будущем тренде — будь то переход бизнеса онлайн, облачный дизайн или самостоятельная коммерция для малого бизнеса. Ключ к успеху — не в поиске абсолютно новой идеи, а в глубоком понимании рынка, выявлении реальных «горящих» проблем пользователей, которые игнорируют крупные игроки, и создании решения, дающего десятикратное улучшение. Важно не просто создать продукт, но и продумать каналы его распространения, часто начиная с ручной, кропотливой работы по привлечению первых преданных пользователей. История успеха — это всегда годы упорной работы, адаптации и устойчивости в условиях неопределенности, когда другие уже сдались. Итоговый совет: найдите свой технологический цикл, погрузитесь в рынок, найдите острую проблему, создайте простой вход в продукт, завоюйте свои каналы распространения и никогда не сдавайтесь.

marsbit2 ч. назад

Письмо основателям от сооснователей Alliance: К моменту продажи Cursor за 600 миллиардов долларов

marsbit2 ч. назад

Еженедельная подборка редактора (13.06-19.06)

Еженедельный обзор редакции (13.06–19.06). В выпуске: макроситуация и рыночные ставки после возобновления судоходства в Ормузском проливе; мнение Рэя Далио о диверсификации портфеля в эпоху доминирования AI-гигантов; анализ цикла BTC и сигналов, указывающих на возможное дно; дебют SpaceX на бирже и обсуждение его завышенной оценки, а также связанные системные риски; как южнокорейские криптобиржи вынуждены листинговить мемкоины из-за регуляторных ограничений; предупреждение о потенциальном "кризисе субстандартного кредитования" в AI-индустрии из-за скрытых обязательств; прогнозы ИИ на чемпионате мира; разбор структуры затрат на подписку Claude; рост Robinhood на фоне ослабления зависимости от криптодоходов; появление первой публичной компании в индустрии prediction markets; проблемы децентрализованных perpetual-контрактов на Pre-IPO активы (на примере SpaceX); депег стейблкоина STRC и вопросы к бизнес-модели Strategy; новый Bitcoin-доходный ETF от BlackRock; и обзор силы экосистемы Ethereum от Sharplink.

marsbit2 ч. назад

Еженедельная подборка редактора (13.06-19.06)

marsbit2 ч. назад

Торговля

Спот
Фьючерсы
活动图片