Flower AI 和 Vana 正在构建无需数据中心的先进 AI 模型

深潮发布于2025-05-02更新于2025-05-02

一种新的众包训练方式通过互联网开发大型语言模型(LLMs),可能会在今年晚些时候以一个巨大的1000亿参数模型震撼AI行业。

一种新的众包训练方式通过互联网开发大型语言模型(LLMs),可能会在今年晚些时候以一个巨大的1000亿参数模型震撼AI行业。

研究人员利用分布在全球的GPU,并结合私有和公共数据,训练了一种新型的大型语言模型(LLM),这一举动表明,构建人工智能的主流方式可能会被颠覆。Flower AI和Vana这两家初创公司,采用非常规的方法共同创建了这一新模型,名为Collective-1。

Flower公司开发了可以将训练分散到数百台通过互联网连接的计算机上的技术。该公司的技术已经被一些公司用于训练AI模型,而无需集中计算资源或数据。Vana则提供了包括来自X、Reddit和Telegram的私密消息在内的数据源。

在现代标准下,Collective-1的规模相对较小,拥有70亿个参数——这些参数的组合赋予了模型其能力——相比之下,今天最先进的模型如ChatGPT、Claude和Gemini的参数数目达到数百亿。剑桥大学计算机科学家、Flower AI的联合创始人Nic Lane表示,分布式的方法承诺将远远超出Collective-1的规模。Lane补充说,Flower AI正在使用常规数据训练一个拥有300亿参数的模型,并计划在今年晚些时候训练另一个拥有1000亿参数的模型——接近行业领导者的规模。“这可能会真正改变人们对AI的看法,所以我们对此非常努力,”Lane说。他表示,该初创公司还在训练中加入图像和音频,以创建多模态模型。

分布式模型构建也可能动摇塑造AI行业的权力动态。目前,AI公司通过将大量训练数据与集中在数据中心的强大计算能力结合来构建模型,这些数据中心配备了先进的GPU,并通过超高速光纤电缆连接在一起。它们还严重依赖通过抓取公开可访问的(尽管有时是受版权保护的)材料,包括网站和书籍,创建的数据集。

这种方法意味着,只有最富有的公司和拥有大量强大芯片的国家才能够开发出最强大和最有价值的模型。即使是开源模型,如Meta的Llama和DeepSeek的R1,也是由拥有大型数据中心的公司构建的。分布式方法可能使较小的公司和大学能够通过汇聚不同的资源来构建先进的AI。或者,它可能允许缺乏传统基础设施的国家将多个数据中心联网,以构建更强大的模型。

Lane相信,AI行业将越来越多地寻求新的方法,使训练突破单个数据中心的限制。他说:“分布式的方法让你能以比数据中心模型更优雅的方式扩展计算能力。”

安全与新兴技术中心的AI治理专家Helen Toner表示,Flower AI的方法“有趣且可能非常相关”于AI竞争和治理。“它可能会继续在前沿技术方面挣扎,但可能是一个有趣的快速跟随者的方法,”Toner说。

分而治之

分布式AI训练涉及重新思考用于构建强大AI系统的计算方式的划分。创建一个LLM涉及将大量文本输入模型,模型调整其参数以产生对提示的有用响应。在数据中心内部,训练过程被划分,以便可以在不同的GPU上运行部分,然后定期合并为一个主模型。

新的方法允许通常在大型数据中心内部完成的工作在可能相隔数英里并通过相对较慢或不稳定的互联网连接连接的硬件上进行。

一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种新的计算划分和整合方案,称为DIstributed PAth COmposition(DiPaCo),使分布式学习更加高效。

为了构建Collective-1和其他LLMs,Lane和来自英国和中国的学术合作者开发了一种名为Photon的新工具,使分布式训练更高效。Lane表示,Photon在数据表示和共享及整合训练方面比谷歌的方法更高效。该过程比常规训练慢,但更灵活,允许添加新硬件以加速训练。

Photon是与北京邮电大学和浙江大学的研究人员合作开发的。该团队上个月以开源许可证发布了该工具,允许任何人使用这一方法。

Flower AI在构建Collective-1的努力中与Vana合作,Vana正在开发新的方法,让用户与AI构建者共享个人数据。Vana的软件允许用户贡献来自X和Reddit等平台的私密数据用于训练大型语言模型,并可能指定允许的最终用途,甚至从他们的贡献中获利。

Vana 的联合创始人Anna Kazlauskas表示,这一想法是使未开发的数据可用于AI训练,同时也给予用户对其信息如何用于AI的更多控制。“这些数据通常无法被纳入AI模型,因为它们并不是公开可用的,”Kazlauskas说,“这是用户首次直接贡献的数据被用于训练基础模型,用户拥有他们的数据所创建的AI模型的所有权。”

伦敦大学学院的计算机科学家Mirco Musolesi表示,分布式AI训练的一个关键好处可能是解锁新类型的数据。“将其扩展到前沿模型将使AI行业能够利用大量去中心化和隐私敏感的数据,例如在医疗和金融领域进行训练,而不必面临数据集中化带来的风险,”他说。

你对分布式机器学习有什么看法?

热门币种推荐

你可能也喜欢

Web3 熊市生存指南:十本帮你穿越周期的好书

Crypto行业已历经多轮牛熊周期,熊市不仅是低谷,更是重塑认知、沉淀能力的关键时期。为了帮助从业者穿越周期,本文推荐了十本涵盖科技、经济、哲学等领域的经典著作,旨在提供超越短期市场波动的深层思考。 首先,《2049:未来10000天的可能》提供了科技发展的长期视角,强调加密资产与AI结合的未来潜力。《人的行动》从哲学层面探讨行动的本质与信念,为在不确定性中坚持提供理论基础。《技术的本质》揭示了技术通过组合进化发展的规律,有助于理解区块链的演进逻辑。 《遥远的救世主》剖析文化属性,强调自强不息的“强势文化”才是立足之本。《主权个人》则预见了一个由技术赋能、个人主权崛起的未来世界。《以日为鉴:衰退时代生存指南》以日本为例,指出即使在整体下行环境中,依然存在结构性机会。 《货币的非国家化》为加密货币提供了经济学理论基础,主张货币应通过市场竞争而非国家垄断产生。《段永平投资问答录》回归朴素的投资智慧,强调“做对的事”和建立“不做清单”的重要性。《巴拉吉预言:技术、真相和构建未来的指南》大胆预测了加密技术将带来的根本性社会变革。 最后,《毛泽东选集》提供了一套在劣势中分析形势、积蓄力量、争取胜利的方法论,对理解技术革命面临的挑战具有启发意义。 这十本书从不同维度出发,共同指向如何在熊市中保持清醒、坚定信念并提升认知深度,从而为迎接下一个周期做好准备。

Foresight News2小时前

Web3 熊市生存指南:十本帮你穿越周期的好书

Foresight News2小时前

交易

现货

热门文章

从H2A到A2A:AI Agent经济体与Crypto新机遇

6月17日,哈佛大学独立研究员、美国AI科学院(NAAI)通讯院士、比特币基金会终身会员韩锋做客火币HTX《大咖讲堂》第三期,以《从H2A到A2A》为主题,分享了其对Agent经济、Crypto基础设施及数字社会未来发展的思考。

8人学过发布于 2026.07.01更新于 2026.07.01

从H2A到A2A:AI Agent经济体与Crypto新机遇

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片