人工智能训练模型的隐性成本

币界网发布于2024-08-25更新于2024-08-25

币界网报道:

构建和支持现代人工智能模型需要大量投资,可能超过数亿美元。据估计,这些成本在不久的将来可能会达到10亿美元。

这一支出主要是由于使用Nvidia GPU等实体的计算能力,每个GPU的成本约为30000美元,可能需要数千美元才能提高效率。研究人员表示,用于开发此类模型的训练数据集的质量和数量非常重要。

行业领导者揭示了人工智能开发的惊人成本

OpenAI的James Betker认为,模型的性能是训练数据的函数,而不是模型的设计或架构。他的断言是,在大数据集上训练的模型将达到相同的结果。因此,数据是人工智能技术进步的关键。

人工智能公司Anthropic AI的首席执行官Dario Amodei在in Good Company播客中分享了他对这些挑战的财务方面的见解。他表示,训练目前的模型,如ChatGPT-4,估计耗资约1亿美元,未来几年训练未来模型可能需要100亿至1000亿美元。

生成性人工智能模型,以及大公司创建的模型,其核心是统计模型。因此,他们使用了很多例子来预测最可能的结果。艾伦人工智能研究所(AI2)的Kyle Lo表示,性能的提高主要归功于数据,尤其是在训练环境保持一致的情况下。

数据集中化引发了道德和可访问性问题

获取高质量数据的高昂成本使人工智能的发展成为发达国家少数大公司的专利。这种资源的聚集也引起了人们对人工智能技术可用性和滥用可能性的担忧。

仅OpenAI就在数据许可证上花费了数亿美元,Meta也考虑过购买数据访问的出版商。人工智能培训数据市场预计将扩大,数据代理可能会从中受益。

问题源于可疑的数据采集实践。据报道,许多公司在未经内容所有者授权的情况下捕获了大量内容,一些公司利用来自不同平台的数据,不向用户支付报酬。正如我们之前报道的那样,OpenAI使用其Whisper音频转录模型转录了100多万小时的YouTube视频,以微调GPT-4。

组织致力于创建开放获取的人工智能培训数据集

由于数据采集竞赛带来了一些问题,需要独立各方做出一些努力,使训练数据集公开可用。一些组织,如EleutherAI和Hugging Face,正在创建可供公众用于人工智能开发的大型数据集。

《华尔街日报》最近强调了解决数据采集问题的两种潜在策略:生成数据生成和课程学习。合成数据是使用人工智能模型本身创建的,而课程学习试图以结构化的方式为模型提供高质量的数据,以便它们即使在数据较少的情况下也能建立联系。然而,这两种方法仍处于发展阶段,其疗效尚未得到测试。

你可能也喜欢

Circle首席执行官Allaire表示,USDC的网络效应将难以被Open USD复制

Circle首席执行官Jeremy Allaire对Open USD稳定币联盟的推出做出回应,为USDC的竞争优势辩护。他认为稳定币的成功取决于长期网络效应,而非费用结构或共享治理模式。 Allaire在社交平台发长文表示,Circle近十年来在流动性、监管审批和开发者基础设施方面的投入,已构建起新进入者难以复制的优势。他比喻稳定币网络更像互联网平台,其价值随更多开发者、企业和金融机构的接入而增长。他列举了USDC通过数千次集成、跨链协议等工具以及全球银行关系与监管合规所巩固的网络效应。 根据Artemis数据,2026年第一季度USDC处理了近30万亿美元链上交易,占美元稳定币总交易量的约80%,USDT占20%,其他所有美元稳定币合计不足0.5%。 Allaire对Open USD提出的免铸造赎回费、共享储备经济和联盟治理等核心主张提出质疑。他认为赎回政策受更广泛市场现实影响,且Circle已将大部分收入分享给分销伙伴,同时保留足够资金持续投资基础设施。他对大型联盟治理模式的创新效率表示怀疑,并透露Circle早期曾尝试类似模式,后发现小型战略合作更为有效。 对于Coinbase参与Open USD的传闻,Allaire强调双方在USDC上的合作“一如既往稳固”,并预计许多Open USD创始成员将继续同时使用USDC。最后,他欢迎Open USD加入稳定币生态,并重申Circle将通过其基础设施产品支持多发行方。

ambcrypto1小时前

Circle首席执行官Allaire表示,USDC的网络效应将难以被Open USD复制

ambcrypto1小时前

Riot Platforms出售500枚BTC,是否为比特币Q3的早期预警?

比特币挖矿向人工智能(AI)转型成为第三季度日益增长的风险。近期,Riot Platforms出售了约500枚BTC(价值约3000万美元),这实时凸显了其战略转向。尽管比特币价格自2025年第四季度初以来首次跌破5.7万美元,但RIOT股价却与之脱钩,第二季度上涨了120%。 该公司上一季度出售了3,778枚BTC,但仅挖出1,473枚,导致其比特币持有量同比下降约18%。最近的500枚BTC出售延续了这一模式,表明其比特币库存策略趋于平稳,重心正转向与AI相关的扩张,将BTC更多地用作投资数据中心和算力的现金储备。 与此同时,比特币矿工压力加剧。上半年比特币连续两个季度下跌,而估算生产成本约为7.8万美元,当前现货价格已低于5.8万美元,这意味着挖矿处于亏本状态。尽管6月比特币算力反弹,表明网络活动和矿工参与度短期回升,但更高的算力会加剧竞争、提升挖矿难度,从而挤压矿工收益。 这种环境可能加速战略转变。对于大型矿工而言,持续的利润压力增加了多元化需求,包括逐步转向AI和高性能计算。因此,矿工可能越来越多地将持有的比特币作为现金用于资助此类投资,而非长期持有,这预示着下半年矿工行为将发生结构性转变。Riot Platforms近期出售500枚BTC,可能正是比特币进入第三季度时这一更广泛趋势的早期信号。

ambcrypto2小时前

Riot Platforms出售500枚BTC,是否为比特币Q3的早期预警?

ambcrypto2小时前

交易

现货
活动图片