Flower AI 和 Vana 正在构建无需数据中心的先进 AI 模型

深潮Опубликовано 2025-05-02Обновлено 2025-05-02

一种新的众包训练方式通过互联网开发大型语言模型(LLMs),可能会在今年晚些时候以一个巨大的1000亿参数模型震撼AI行业。

一种新的众包训练方式通过互联网开发大型语言模型(LLMs),可能会在今年晚些时候以一个巨大的1000亿参数模型震撼AI行业。

研究人员利用分布在全球的GPU,并结合私有和公共数据,训练了一种新型的大型语言模型(LLM),这一举动表明,构建人工智能的主流方式可能会被颠覆。Flower AI和Vana这两家初创公司,采用非常规的方法共同创建了这一新模型,名为Collective-1。

Flower公司开发了可以将训练分散到数百台通过互联网连接的计算机上的技术。该公司的技术已经被一些公司用于训练AI模型,而无需集中计算资源或数据。Vana则提供了包括来自X、Reddit和Telegram的私密消息在内的数据源。

在现代标准下,Collective-1的规模相对较小,拥有70亿个参数——这些参数的组合赋予了模型其能力——相比之下,今天最先进的模型如ChatGPT、Claude和Gemini的参数数目达到数百亿。剑桥大学计算机科学家、Flower AI的联合创始人Nic Lane表示,分布式的方法承诺将远远超出Collective-1的规模。Lane补充说,Flower AI正在使用常规数据训练一个拥有300亿参数的模型,并计划在今年晚些时候训练另一个拥有1000亿参数的模型——接近行业领导者的规模。“这可能会真正改变人们对AI的看法,所以我们对此非常努力,”Lane说。他表示,该初创公司还在训练中加入图像和音频,以创建多模态模型。

分布式模型构建也可能动摇塑造AI行业的权力动态。目前,AI公司通过将大量训练数据与集中在数据中心的强大计算能力结合来构建模型,这些数据中心配备了先进的GPU,并通过超高速光纤电缆连接在一起。它们还严重依赖通过抓取公开可访问的(尽管有时是受版权保护的)材料,包括网站和书籍,创建的数据集。

这种方法意味着,只有最富有的公司和拥有大量强大芯片的国家才能够开发出最强大和最有价值的模型。即使是开源模型,如Meta的Llama和DeepSeek的R1,也是由拥有大型数据中心的公司构建的。分布式方法可能使较小的公司和大学能够通过汇聚不同的资源来构建先进的AI。或者,它可能允许缺乏传统基础设施的国家将多个数据中心联网,以构建更强大的模型。

Lane相信,AI行业将越来越多地寻求新的方法,使训练突破单个数据中心的限制。他说:“分布式的方法让你能以比数据中心模型更优雅的方式扩展计算能力。”

安全与新兴技术中心的AI治理专家Helen Toner表示,Flower AI的方法“有趣且可能非常相关”于AI竞争和治理。“它可能会继续在前沿技术方面挣扎,但可能是一个有趣的快速跟随者的方法,”Toner说。

分而治之

分布式AI训练涉及重新思考用于构建强大AI系统的计算方式的划分。创建一个LLM涉及将大量文本输入模型,模型调整其参数以产生对提示的有用响应。在数据中心内部,训练过程被划分,以便可以在不同的GPU上运行部分,然后定期合并为一个主模型。

新的方法允许通常在大型数据中心内部完成的工作在可能相隔数英里并通过相对较慢或不稳定的互联网连接连接的硬件上进行。

一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种新的计算划分和整合方案,称为DIstributed PAth COmposition(DiPaCo),使分布式学习更加高效。

为了构建Collective-1和其他LLMs,Lane和来自英国和中国的学术合作者开发了一种名为Photon的新工具,使分布式训练更高效。Lane表示,Photon在数据表示和共享及整合训练方面比谷歌的方法更高效。该过程比常规训练慢,但更灵活,允许添加新硬件以加速训练。

Photon是与北京邮电大学和浙江大学的研究人员合作开发的。该团队上个月以开源许可证发布了该工具,允许任何人使用这一方法。

Flower AI在构建Collective-1的努力中与Vana合作,Vana正在开发新的方法,让用户与AI构建者共享个人数据。Vana的软件允许用户贡献来自X和Reddit等平台的私密数据用于训练大型语言模型,并可能指定允许的最终用途,甚至从他们的贡献中获利。

Vana 的联合创始人Anna Kazlauskas表示,这一想法是使未开发的数据可用于AI训练,同时也给予用户对其信息如何用于AI的更多控制。“这些数据通常无法被纳入AI模型,因为它们并不是公开可用的,”Kazlauskas说,“这是用户首次直接贡献的数据被用于训练基础模型,用户拥有他们的数据所创建的AI模型的所有权。”

伦敦大学学院的计算机科学家Mirco Musolesi表示,分布式AI训练的一个关键好处可能是解锁新类型的数据。“将其扩展到前沿模型将使AI行业能够利用大量去中心化和隐私敏感的数据,例如在医疗和金融领域进行训练,而不必面临数据集中化带来的风险,”他说。

你对分布式机器学习有什么看法?

Трендовые криптовалюты

Похожее

Использует ли Трамп Закон о ясности (CLARITY Act) в качестве рычага в более широких переговорах?

Срок принятия закона CLARITY Act истекает 4 июля, но его одобрение маловероятно. Законопроект, одобренный Палатой представителей еще в июле 2025 года, столкнулся с многочисленными препятствиями в Конгрессе. Текущая задержка связана с тем, что президент США Дональд Трамп использует его в качестве рычага в более масштабных переговорах. Трамп отменил церемонию подписания другого двухпартийного законопроекта — «21st Century ROAD to Housing Act», который включал запрет на CBDC. Ранее он заявлял, что не будет подписывать иные законы, пока конгрессмены-республиканцы не примут «SAVE America Act». Это создало напряженный график работы Сената и напрямую снизило шансы CLARITY Act на принятие до августского перерыва. Несмотря на это, сенатор Тим Скотт и другие выражают надежду на скорейшее продвижение законопроекта, опасаясь, что длительная регуляторная неопределенность вытеснит криптоэкосистему в другие юрисдикции. Однако для принятия необходимы 60 голосов в Сенате, и если этого не произойдет до августа, приоритеты могут сместиться на избирательные кампании, что отложит рассмотрение до 2027 года. Аналитики Galaxy Research снизили вероятность принятия закона к сроку с 60% до 50%.

ambcrypto23 мин. назад

Использует ли Трамп Закон о ясности (CLARITY Act) в качестве рычага в более широких переговорах?

ambcrypto23 мин. назад

Ethereum: Сможет ли ETH избежать своей первой в истории проигрышной серии из трех кварталов подряд?

Эфириум (ETH) переживает сложный период и может закрыть третий квартал подряд с отрицательной доходностью, что станет первым подобным случаем в его истории. Цена ETH в настоящее время колеблется около $1577, не в силах вернуться выше ключевого уровня в $1600, а индикатор RSI остается слабым. Ситуация осложняется противоречивыми действиями крупных институциональных игроков. С одной стороны, BlackRock продолжает продавать ETH, отгружая активы на Coinbase Prime и демонстрируя семидневную полосу продаж. С другой стороны, компания Bitmine Тома Ли активно накапливает монеты, недавно купив еще 27 084 ETH и доведя свои общие владения до 5,7 миллионов ETH (около 4,72% от общего предложения). Несмотря на медвежий ценовой тренд, индекс потока денег (CMF) немного положителен, что указывает на приток капитала. Для восстановления бычьей динамики ETH необходимо закрепиться выше $1600. До тех пор общий квартальный тренд остается основным сигналом для трейдеров.

ambcrypto52 мин. назад

Ethereum: Сможет ли ETH избежать своей первой в истории проигрышной серии из трех кварталов подряд?

ambcrypto52 мин. назад

Просмотры крипто-каналов на YouTube в 2026 году упали на 70%, кризис внимания розничных инвесторов меняет сценарий следующего цикла

Анализ показывает, что в 2026 году просмотры крупнейших криптовалютных YouTube-каналов, таких как Coin Bureau, Crypto Banter, Altcoin Daily и Benjamin Cowen, упали на 26,9–78,7% по сравнению с январём 2025 года. Несмотря на сохранение миллионов подписчиков, текущая активная аудитория значительно сократилась. Это указывает на отток внимания розничных инвесторов от длинных видеоформатов, хотя интерес не исчез полностью, а стал более избирательным. Рынок становится более сегментированным: биткоин может поддерживаться институциональными ETF, в то время как интерес к альткойнам и контенту для розничных инвесторов слабеет. Следующий цикл может начаться не с роста подписок, а с увеличения ежедневных и месячных просмотров, что станет опережающим индикатором возвращения розничного интереса.

marsbit1 ч. назад

Просмотры крипто-каналов на YouTube в 2026 году упали на 70%, кризис внимания розничных инвесторов меняет сценарий следующего цикла

marsbit1 ч. назад

Подтверждено: Claude Code тайно проверяет пользователей, временные зоны и китайские AI-лаборатории — ключевые слова

Сегодня компания Anthropic оказалась в центре скандала. В тот же день, когда она анонсировала модель Claude Sonnet 5 и сообщила об отмене экспортных ограничений США на Claude Fable 5 и Mythos 5, в сообществе разработчиков была раскрыта тревожная информация. Разработчики обнаружили, что инструмент Claude Code тайно собирает данные пользователей. В частности, он проверяет системный часовой пояс пользователя (например, Asia/Shanghai) и анализирует переменную среды `ANTHROPIC_BASE_URL` для определения использования пользовательских прокси или API-серверов. Эти адреса затем сравниваются со скрытым списком из 147 доменов, связанных с китайскими технологическими компаниями и ИИ-лабораториями (такими как Baidu, Alibaba, Moonshot AI), а также с зеркалами и реселлерами Claude. Собранная информация не передаётся открыто. Вместо этого она кодируется в системные промпты, отправляемые в облако, с помощью стеганографии. Например, меняется формат даты (с 2026-06-30 на 2026/06/30) или используются различные почти неразличимые символы Unicode (например, ' , ʼ , ʹ) в фразе "Today's date". Эти изменения служат скрытыми метками, указывающими на использование китайского часового пояса, прокси или доступ с доменов из списка. Основная проблема заключается не в самом сборе телеметрии, а в скрытном и нераскрытом способе её реализации, который нарушает доверие пользователей. Учитывая, что Claude Code имеет доступ к исходному коду и может выполнять команды, такое поведение вызывает серьёзные вопросы о конфиденциальности и прозрачности. После разоблачения представитель Anthropic заявил, что спорный код будет удалён в следующем обновлении.

marsbit2 ч. назад

Подтверждено: Claude Code тайно проверяет пользователей, временные зоны и китайские AI-лаборатории — ключевые слова

marsbit2 ч. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Биткоин упал ниже 60 тыс. долларов, достигнув нового минимума текущего цикла. По мнению Грейскал, это корректировка в рамках долгосрочного восходящего тренда. Ключевым фактором давления стали изменившиеся ожидания относительно политики ФРС (ожидание повышения ставок при новом председателе), что ослабило "сделку на обесценивание фиата". Другие негативные факторы включают неопределенность с принятием закона CLARITY, давление на балансы компаний вроде Strategy и опасения по поводу квантовых вычислений. Однако структурные драйверы роста (институциональное внедрение, долговая нагрузка правительств, развитие ИИ) остаются в силе. Выход из текущей фазы видится по двум сценариям. Оптимистичный (близость к дну): если ФРС не станет повышать ставки, закон CLARITY будет принят, а компании укрепят балансы. Пессимистичный (возможность дальнейшего снижения): если эти риски реализуются. При этом глубина падения, вероятно, будет меньше исторических максимумов (~80%) из-за более сдержанного роста в этом цикле и устойчивого институционального спроса. Исследователи Grayscale сохраняют долгосрочный оптимизм, считая текущие уровни привлекательными для инвесторов с долгосрочным горизонтом.

marsbit3 ч. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

marsbit3 ч. назад

Торговля

Спот

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.9k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片