欲融资 65 亿美元的 OpenAI 趁热发布 o1 模型,一文了解 10 个关键要点

深潮Publié le 2024-09-18Dernière mise à jour le 2024-09-18

o1 或许代表着 OpenAI 的下一代大模型。

来源:福布斯

编译:MetaverseHub

上周有消息称,OpenAI 在新一轮融资中获得 65 亿美元,其市场估值也来到了 1500 亿美元

这笔融资再次肯定了 OpenAI 作为人工智能初创公司的巨大价值,也表明它愿意做出结构性改变,以吸引更多投资。

消息人士补充说,鉴于 OpenAI 收入的快速增长,这一轮大规模融资受到了投资者的强烈追捧,并可能在未来两周内敲定。

Thrive Capital、Khosla Ventures 和微软等现有投资者有望参与。包括英伟达和苹果在内的新投资者也计划参与投资,红杉资本也在洽谈回归投资事宜

同时,OpenAI 推出了 o1 系列,这是其迄今为止最复杂的人工智能模型,旨在出色地完成复杂的推理和问题解决任务。o1 模型使用了强化学习和思维链推理,代表了人工智能能力的重大进步。

OpenAI 通过不同的访问层级向 ChatGPT 用户和开发者提供 o1 模型。对于 ChatGPT 用户,ChatGPT Plus 计划的用户可以访问 o1-preview 模型,该模型具有高级推理和解决问题的能力。

OpenAI 的应用程序接口(API)允许开发人员在更高级别的订阅计划中访问 o1-preview 和 o1-mini。

这些模型在第 5 级 API 中提供,允许开发人员将 o1 模型的高级功能集成到自己的应用程序中。第 5 级 API 是 OpenAI 为访问其高级模型而提供的更高级别的订阅计划。

以下是有关 OpenAI o1 模型的 10 个关键要点:

01.两个模型变体:o1-Preview 和 o1-Mini

OpenAI 发布了两个变体:o1-preview 和 o1-mini。o1-preview 模型在复杂任务中表现出色,而 o1-mini 则为 STEM 领域(尤其是编码和数学)提供了更快、更具成本效益的优化解决方案。

02.高级思维链推理

o1 模型利用思维链过程,在做出回答之前会逐步推理。这种深思熟虑的方法提高了准确性,有助于处理需要多步骤推理的复杂问题,使其优于 GPT-4 等以前的模型。

思维链提示通过将复杂问题分解为连续的步骤来增强人工智能的推理能力,从而提高模型的逻辑和计算能力。

OpenAI 的 GPT-o1 模型将这一过程嵌入其架构中,模拟人类解决问题的过程,从而推进了这一过程。

这使得 GPT-o1 在竞技编程、数学和科学领域表现出色,同时也提高了透明度,因为用户可以跟踪模型的推理过程,这标志着类人人工智能推理的飞跃。

这种先进的推理能力会导致模型在做出响应前需要一定的时间,与 GPT-4 系列模型相比可能会显得缓慢。

03.增强的安全功能

OpenAI 在 o1 模型中嵌入了先进的安全机制。这些模型在不被允许的内容评估中表现出卓越的性能,显示出对「越狱」的抵抗性,使其在敏感用例中的部署更加安全。

人工智能模型「越狱」涉及绕过安全措施,容易引发有害或不道德的输出。随着人工智能系统变得越来越复杂,与「越狱」相关的安全风险也随之增加。

OpenAI 的 o1 模型,尤其是 o1-preview 变体,在安全测试中得分更高,显示出更强的抵御此类攻击的能力

这种增强的抵御能力得益于该模型的高级推理能力,这有助于它更好地遵守道德准则,使恶意用户更难操纵它。

04.在 STEM 基准测试中表现更佳

o1 模型在各种学术基准测试中名列前茅。例如,o1 在 Codeforces(编程竞赛)中排名第 89 位,在美国数学奥林匹克预选赛中名列前 500 名。

05.减少「高级幻觉」

大型语言模型中的「幻觉」是指生成错误或无据信息。OpenAI 的 o1 模型利用高级推理和思维链过程解决了这一问题,使其能够逐步思考问题

与以前的模型相比,o1 模型降低了「幻觉」发生率。

在 SimpleQA 和 BirthdayFacts 等数据集上进行的评估显示,o1-preview 在提供真实、准确的回答方面优于 GPT-4,从而降低了错误信息的风险。

06.基于多样化的数据集训练

o1 模型在公共、专有和定制数据集上进行了综合训练,使其既精通一般知识,又熟悉特定领域的主题。这种多样性使其具有强大的对话和推理能力。

07.价格友好且具成本效益

OpenAI 的 o1-mini 模型是 o1-preview 的高性价比替代品,价格便宜 80%,同时在数学和编码等 STEM 领域仍具有很强的性能

o1-mini 模型专为需要高精度、低成本的开发人员量身定制,非常适合预算有限的应用。这种定价策略可确保更多的人,尤其是教育机构、初创企业和小型企业,能够接触到先进的人工智能。

08.安全工作和外部「红队测试」

在大语言模型(LLM)中,「红队测试」是指通过模拟其他人的攻击,或者用可能导致模型做出有害、有偏见或与初衷不符的行为的方式来严格测试人工智能系统。

这对于在大规模部署模型之前找出内容安全、错误信息和道德界限等方面的漏洞至关重要。

通过使用外部测试人员和不同的测试场景,红队测试有助于使 LLM 更加安全、稳健并符合道德标准。这样可以确保模型能够抵御「越狱」或其他方式的操纵。

在部署之前,o1 模型经过了严格的安全评估,包括红队测试和准备框架评估。这些努力有助于确保模型符合 OpenAI 的高安全性和一致性标准。

09.更公平,更少偏见

o1-preview 模型在减少刻板答案方面的表现优于 GPT-4。在公平性评估中,它能更多地选择正确答案,同时在处理模棱两可的问题方面也有改进。

10.思维链监控与欺骗检测

OpenAI 采用了实验技术来监控 o1 模型的思维链,以在模型故意提供错误信息时检测欺骗行为。初步结果表明,在降低模型生成的错误信息所带来的潜在风险方面,该技术具有良好的前景。

OpenAI 的 o1 模型代表了人工智能推理和解决问题方面的重大进步,尤其在数学、编码和科学推理等 STEM 领域表现出色

随着高性能 o1-preview 和高性价比 o1-mini 的推出,这些模型针对一系列复杂任务进行了优化,同时通过广泛的红队测试确保了更高的安全性和道德合规性。

Lectures associées

Ripple ne se déplace pas au hasard : Les mouvements stratégiques derrière la domination du XRP

L'expert crypto BankXRP souligne que l'investissement récent de Ripple dans le routeur cross-chain Squid est une manœuvre stratégique pour renforcer l'utilité du XRP en tant qu'actif de paiement transfrontalier. Cet investissement de 6 millions de dollars rend le XRP Ledger accessible à l'ensemble de l'écosystème crypto, Squid connectant plus de 100 blockchains, dont Ethereum et Solana. Le PDG de Ripple, Brad Garlinghouse, a réaffirmé la volonté de l'entreprise d'opérer sur plusieurs réseaux, comme en témoignent aussi le lancement du stablecoin RLUSD sur Ethereum et les services de custodie multi-actifs. Parallèlement, le commentateur Xaif met en avant les atouts du XRP Ledger pour l'ère de la confidentialité et l'adoption institutionnelle. Le réseau intègre nativement la technologie de preuve à divulgation nulle de connaissance (ZK), permettant de masquer les détails des transactions tout en autorisant une vérification par les régulateurs. Avec une finalité de 3 à 5 secondes, des frais minimes et la solution On-Demand Liquidity (ODL) pour les transferts internationaux, le réseau est présenté comme idéal pour les paiements et une concurrence sérieuse face au système SWIFT. Plus de 300 institutions financières partenaires de Ripple attendaient ces fonctionnalités de confidentialité pour s'engager pleinement. Au moment de la rédaction, le cours du XRP est d'environ 1,34 $.

bitcoinistIl y a 2 h

Ripple ne se déplace pas au hasard : Les mouvements stratégiques derrière la domination du XRP

bitcoinistIl y a 2 h

Vitalik affirme qu'Ethereum doit être 'extraordinaire', mais que la Fondation n'en est pas le centre

Vitalik Buterin a publié un long texte en réponse aux critiques de la communauté concernant la Fondation Ethereum (EF) et les performances d'ETH. Il reconnaît un sentiment de "crise" et une divergence de priorités avec certains détracteurs qui reprochent à l'EF son manque de stratégie claire, ses turbulences internes et sa vente de tokens, la jugeant désalignée des intérêts des détenteurs d'ETH. Vitalik rejette l'idée que l'EF soit le "centre" d'Ethereum. Il la décrit plutôt comme un "nœud aux responsabilités définies" parmi d'autres, soulignant qu'elle ne détient que ~0.16% de l'offre totale d'ETH. L'EF se recentrera désormais sur des missions essentielles et à long terme pour la réussite d'Ethereum, cessant de vendre d'importantes quantités d'ETH. Il affirme qu'Ethereum doit être "incroyable", mais pas en poursuivant uniquement l'évolutivité. Il prône l'excellence dans la dimension "CROPS" : prouver l'absence de bugs via la vérification formelle, maintenir un consensus robuste et minimiser les intermédiaires pour une vraie confidentialité et résistance à la censure. Enfin, l'article note que si l'annonce de Vitalik marque une maturation de l'EF vers plus de gouvernance, la question de créer une nouvelle organisation alignée économiquement avec les intérêts d'Ethereum, évoquée par des experts comme Ryan Sean Adams, reste sans réponse. Combler ce vide pourrait être clé pour inverser la tendance baissière d'ETH.

链捕手Il y a 7 h

Vitalik affirme qu'Ethereum doit être 'extraordinaire', mais que la Fondation n'en est pas le centre

链捕手Il y a 7 h

Galxe : Comment une plateforme de quêtes s'est transformée en infrastructure de croissance pour le Web3

**Galxe : De plateforme de quêtes à infrastructure de croissance Web3** Initialement perçue comme une plateforme de quêtes Web3 classique où les utilisateurs effectuent des tâches pour gagner des récompenses, Galxe a évolué pour devenir un pilier essentiel de la croissance des écosystèmes (Optimism, Arbitrum, etc.). Son rôle va au-delà d’un simple outil de distribution d’incitations. **Problématique de la croissance Web3** : Contrairement au Web2 doté d’infrastructures de croissance matures (publicité, analyse de données), le Web3 manquait d’un système unifié pour identifier les utilisateurs réels, créer des profils exploitables et transformer le trafic incité en engagement durable. **La solution Galxe** : Son objectif principal est de structurer et de productiviser le processus de croissance. Elle transforme les actions utilisateurs ponctuelles et fragmentées (interactions sociales, activités on-chain) en **données d’identité et de comportement réutilisables et vérifiables** (credentials, OAT, Passport, Score). Ainsi, chaque participation enrichit un historique personnel valorisant pour l’utilisateur (« cultiver son portefeuille ») et fournit aux projets un bassin d’utilisateurs étiquetés et filtrables. **Mécanisme de parcours gamifié** : Galxe reconstitue la croissance en un parcours progressif et incitatif. Il guide les utilisateurs des actions simples (sociales) vers des engagements plus profonds (connexion de portefeuille, interactions on-chain complexes), éduquant ainsi aux écosystèmes et filtrant naturellement la qualité des participants grâce à une structure de récompenses adaptée. **Évolution vers une plateforme complète** : Au-delà des quêtes (Quest), Galxe développe un écosystème de produits (Passport, Starboard, Earndrop, Gravity) visant à couvrir toute la chaîne de croissance : identité, analyse, distribution de récompenses. Elle crée un **effet de réseau (flywheel)** : plus il y a de projets, plus les données sont riches ; plus les données sont riches, plus le ciblage est précis, attirant davantage de projets. **Conclusion** : Galxe représente un changement de paradigme pour la croissance Web3, passant d’une logique de « trafic motivé par les récompenses » à une logique « pilotée par l’identité ». En donnant une valeur durable et cumulative aux comportements, il jette les bases d’un nouveau modèle où la croissance s’appuie sur des réseaux de relations à long terme construits autour de l’identité numérique vérifiée.

marsbitIl y a 7 h

Galxe : Comment une plateforme de quêtes s'est transformée en infrastructure de croissance pour le Web3

marsbitIl y a 7 h

Pouls du marché du BTC : Semaine 22

Bitcoin a enregistré une baisse sur la semaine dernière, passant de 79 000 $ à un creux local près de 74 000 $ avant de rebondir vers 77 000 $. La dynamique des prix a reculé de 21,7 %, reflétant une activité plus modérée et une pression de vente accrue. Cependant, les indicateurs CVD Spot et Perpetual ont fortement augmenté, suggérant un allégement de la pression vendeuse et un sentiment de marché plus équilibré. Le volume Spot et l'intérêt ouvert sur les futures ont diminué, indiquant un appétit spéculatif réduit. Des signes de regain d'appétit pour le risque émergent, avec une forte hausse des paiements de financement des positions longues. Sur les marchés d'options, le Skew à 25 Delta a légèrement augmenté, signalant une demande accrue de protection contre les baisses. Dans le secteur TradFi, la MVRV des ETF spot américains et leurs flux nets se sont améliorés, bien que leur volume de transactions ait chuté, traduisant un ralentissement de l'activité spéculative. L'activité du réseau (adresses actives, volume des transferts) a légèrement diminué, évoquant une phase de consolidation. Les mesures de liquidité indiquent un profil plus stable et une conviction accrue des investisseurs. Les mesures de rentabilité signalent une augmentation potentielle du stress du marché, avec un déclin significatif du ratio de profit non réalisé net et une augmentation de la réalisation des pertes par rapport aux prises de bénéfices. En résumé, le marché montre des signes de modération et de consolidation, caractérisés par une activité réduite, un sentiment prudent et un mélange d'appétit pour le risque. Cette image nuancée souligne l'importance d'une surveillance continue.

insights.glassnodeIl y a 8 h

Pouls du marché du BTC : Semaine 22

insights.glassnodeIl y a 8 h

Trading

Spot
Futures
活动图片