人工智能训练模型的隐性成本

币界网Xuất bản vào 2024-08-25Cập nhật gần nhất vào 2024-08-25

币界网报道:

构建和支持现代人工智能模型需要大量投资,可能超过数亿美元。据估计,这些成本在不久的将来可能会达到10亿美元。

这一支出主要是由于使用Nvidia GPU等实体的计算能力,每个GPU的成本约为30000美元,可能需要数千美元才能提高效率。研究人员表示,用于开发此类模型的训练数据集的质量和数量非常重要。

行业领导者揭示了人工智能开发的惊人成本

OpenAI的James Betker认为,模型的性能是训练数据的函数,而不是模型的设计或架构。他的断言是,在大数据集上训练的模型将达到相同的结果。因此,数据是人工智能技术进步的关键。

人工智能公司Anthropic AI的首席执行官Dario Amodei在in Good Company播客中分享了他对这些挑战的财务方面的见解。他表示,训练目前的模型,如ChatGPT-4,估计耗资约1亿美元,未来几年训练未来模型可能需要100亿至1000亿美元。

生成性人工智能模型,以及大公司创建的模型,其核心是统计模型。因此,他们使用了很多例子来预测最可能的结果。艾伦人工智能研究所(AI2)的Kyle Lo表示,性能的提高主要归功于数据,尤其是在训练环境保持一致的情况下。

数据集中化引发了道德和可访问性问题

获取高质量数据的高昂成本使人工智能的发展成为发达国家少数大公司的专利。这种资源的聚集也引起了人们对人工智能技术可用性和滥用可能性的担忧。

仅OpenAI就在数据许可证上花费了数亿美元,Meta也考虑过购买数据访问的出版商。人工智能培训数据市场预计将扩大,数据代理可能会从中受益。

问题源于可疑的数据采集实践。据报道,许多公司在未经内容所有者授权的情况下捕获了大量内容,一些公司利用来自不同平台的数据,不向用户支付报酬。正如我们之前报道的那样,OpenAI使用其Whisper音频转录模型转录了100多万小时的YouTube视频,以微调GPT-4。

组织致力于创建开放获取的人工智能培训数据集

由于数据采集竞赛带来了一些问题,需要独立各方做出一些努力,使训练数据集公开可用。一些组织,如EleutherAI和Hugging Face,正在创建可供公众用于人工智能开发的大型数据集。

《华尔街日报》最近强调了解决数据采集问题的两种潜在策略:生成数据生成和课程学习。合成数据是使用人工智能模型本身创建的,而课程学习试图以结构化的方式为模型提供高质量的数据,以便它们即使在数据较少的情况下也能建立联系。然而,这两种方法仍处于发展阶段,其疗效尚未得到测试。

Nội dung Liên quan

Solana và Hợp đồng Tương lai Dogecoin Kể Những Câu Chuyện Khác nhau Khi Các Vị thế Mua Dài hạn Giải tỏa

Dogecoin (DOGE) và Solana (SOL) đang cho thấy hai bức tranh trái ngược trên thị trường phái sinh. Trong khi số tiền cam kết (open interest) cho Dogecoin giảm mạnh từ 1,7 tỷ USD xuống dưới 960 triệu USD, thì chỉ số này của Solana lại tăng lên 5,5 tỷ USD. Điều quan trọng cần hiểu là việc giảm open interest của DOGE chủ yếu đến từ việc các lệnh mua dài hạn (long positions) bị thanh lý hoặc đóng cửa, chứ không phải do áp lực bán khống gia tăng. Điều này cho thấy đòn bẩy đang rút khỏi Dogecoin. Ngược lại, mức open interest cao của Solana chỉ ra rằng các nhà giao dịch vẫn đang tích cực thể hiện quan điểm tăng giá với SOL, phản ánh dòng vốn có thể đang xoay vòng giữa các tài sản tiền điện tử. Bối cảnh này rất quan trọng cho các nhà giao dịch. Nó không chỉ là câu chuyện về giá mà còn là tín hiệu về sự thay đổi trong khẩu vị rủi ro và vị thế trên thị trường. Trong một thị trường vẫn chịu ảnh hưởng bởi dòng tiền ETF, đòn bẩy và thanh khoản luân chuyển, những tín hiệu về cấu trúc thị trường như vậy cần được phân tích một cách thận trọng, cùng với các điều kiện vĩ mô và thanh khoản rộng hơn, thay vì coi đó là một đảm bảo chắc chắn cho biến động giá trong tương lai.

bitcoinist11 phút trước

Solana và Hợp đồng Tương lai Dogecoin Kể Những Câu Chuyện Khác nhau Khi Các Vị thế Mua Dài hạn Giải tỏa

bitcoinist11 phút trước

Đế chế tiền mã hóa của Trump tạo ra 1,4 tỷ USD vào năm 2025: WLFI, TRUMP dưới sự giám sát

Tổng thống Donald Trump công bố một sự chuyển hướng lớn trong đế chế tài chính của mình khi các khoản đầu tư tiền mã hóa đã trở thành nguồn thu nhập chính, vượt xa các dự án truyền thống. Trong năm 2025, các dự án tiền mã hóa có sự hậu thuẫn của gia đình ông đã tạo ra hơn 1,4 tỷ USD doanh thu. Phần lớn đến từ việc bán token World Liberty Financial (WLFI) và đồng memecoin TRUMP chính thức, dù giá TRUMP đã giảm mạnh từ đỉnh 74,24 USD xuống còn 1,67 USD. Thành công này đã đưa lợi ích kinh doanh của Trump vào trung tâm cuộc tranh luận chính sách về tiền mã hóa. Các đạo luật như GENIUS Act và CLARITY Act nhằm tạo khuôn khổ rõ ràng hơn cho stablecoin và thị trường tài sản số, nhưng cũng làm dấy lên lo ngại về xung đột lợi ích, vì các quy định thân thiện có thể làm lợi cho doanh nghiệp của tổng thống. Trong khi đó, hoạt động thực thi của SEC và CFTC đối với tiền mã hóa đã giảm mạnh vào năm 2025, cho thấy sự chuyển trọng tâm của cơ quan quản lý sang xây dựng khung pháp lý. Tuy nhiên, thị trường hiện vẫn chịu ảnh hưởng nhiều hơn bởi các yếu tố cơ bản như lãi suất và dòng tiền ETF. Áp lực về đạo đức và tính minh bạch dự kiến sẽ định hình lại các tiêu chuẩn quản lý và tăng cường trách nhiệm giải trình trong tương lai.

ambcrypto1 giờ trước

Đế chế tiền mã hóa của Trump tạo ra 1,4 tỷ USD vào năm 2025: WLFI, TRUMP dưới sự giám sát

ambcrypto1 giờ trước

Giao dịch

Giao ngay
活动图片