谷歌新Gemini AI模型在基准测试中击败GPT-4o

币界网发布于2024-08-02更新于2024-08-02

币界网报道:

作者:Tristan Greene,CoinTelegraph;编译:陶朱,

生成式人工智能基准测试领域又出现了一位新霸主,它的名字是 Gemini 1.5 Pro。

之前的冠军 OpenAI 的 ChatGPT-4o 终于在 8 月 1 日被超越,当时谷歌悄然发布了其最新模型的实验版本。

Gemini 的最新更新没有大张旗鼓地发布,目前被标记为实验性的。但它很快引起了社交媒体上人工智能社区的关注,因为有报道称它在基准测试分数上超越了竞争对手。

人工智能基准

自 GPT-3 发布以来,OpenAI 的 ChatGPT 一直是生成式 AI 的标杆。过去一年左右,其最新模型 GPT-4o 和最接近的竞争对手 Anthropic 的 Claude-3 在大多数常见基准测试中都遥遥领先于大多数其他模型,几乎没有遇到任何竞争对手。

joLFxVORsiw7ebQNskYsq6svnXEnsKu4FYrunFjb.jpeg

来源:大型模型系统组织。

最受欢迎的基准测试之一是 LMSYS Chatbot Arena。它测试各种任务的模型并分配总体能力分数。GPT-4o 的得分为 1,286,而 Claude-3 获得了可观的 1,271 分。

Gemini 1.5 Pro 的先前版本得分为 1,261。但 8 月 1 日发布的实验版本 (Gemini 1.5 Pro 0801) 得分高达 1,300。

这表明它总体上比竞争对手更强大,但基准测试并不一定能准确反映 AI 模型能做什么和不能做什么。

社区兴奋

在没有更深入的比较的情况下,我们正进入一个 AI 聊天机器人市场已经足够成熟,可以提供多种选择的时代。最终由用户来决定哪种 AI 模型最适合他们。

据传,Gemini 的最新版本引起了一波兴奋,社交媒体上的用户称它“非常好”。一位 Redditor 甚至写道,它“完全胜过 4o”。

目前尚不清楚 Gemini 1.5 Pro 的实验版本是否会成为未来的默认版本。虽然截至本文发表时,它仍然普遍可用,但它处于早期发布或测试阶段这一事实表明,出于安全或协调原因,该模型可能会被撤销或更改。

热门币种推荐

你可能也喜欢

研报解读:CPO 爆发时,Coherent 在下什么棋

JP摩根分析师Samik Chatterjee在投资者会议上重申了对Coherent的增持评级,认为市场低估了其增长潜力。核心逻辑围绕三条业务线展开。 首先,数据中心对1.6T光收发器的需求持续强劲,价格环境健康。针对市场对CPO技术可能替代传统收发器的担忧,分析师认为CPO集成方案反而会增加对高端光学器件的需求。 其次,在CPO和光路交换市场,Coherent凭借其全面的光学组件产品组合(如激光器、隔离器等)占据优势。每个CPO芯片中,公司可获取的价值远高于传统收发器。其液晶技术的OCS解决方案在可靠性和功耗上优于MEMS方案,目标市场规模达40亿美元。 第三,公司计划两年内将磷化铟器件产能提升四倍,并向上游整合。作为全球两大高质量泵浦激光器供应商之一,公司正从销售器件转向提供完整的线卡或系统,单套方案售价可提升十倍以上。 毛利率方面,公司目标大于42%,并有上调可能,动力来自高端产品溢价、成本结构改善及新产品放量。此外,工业领域业务保持稳定增长,半导体制程设备订单增加,3D传感领域也存在新机会。 总体而言,AI推高算力需求,进而驱动高速光互联需求。Coherent在光通信芯片领域处于关键位置,CPO等新机会、工业业务的稳定增长以及毛利率改善空间共同支撑了其积极前景。

marsbit1小时前

研报解读:CPO 爆发时,Coherent 在下什么棋

marsbit1小时前

Dan Koe新文:逃离打工人宿命,如何在AI替代潮中生存下来?

本文探讨在AI技术浪潮下,如何摆脱传统“打工人”宿命,构建自己的事业以实现生存与成长。文章指出,真正的危机并非AI本身,而是将自身幸福完全寄托于他人。作者认为,许多工作因缺乏挑战和自主性,易使人陷入重复与无聊,从而成为“薪水奴隶”。 为在AI时代保持竞争力,个人需掌握五个核心要素:能动性(主动行动)、品味(价值判断)、说服力(影响他人)、坚持(耐受挫折)和迭代(持续优化)。这些能力无法通过单纯学习获得,必须在实践中锻炼。 文章建议,突破的关键在于转变身份,成为“不可被雇佣的人”。具体路径包括:1)彻底改变环境,重塑行为与身份;2)选择能提供真实反馈的载体(如创业),在试错中成长;3)掌握“代码”或“媒体”(内容创作)两项杠杆技能,其中媒体因价值主观、更依赖人的洞察力而更具优势。 最后,作者提出一个可操作的起点:每天抽出15分钟,通过三个步骤启动个人事业:1)挖掘自身独特的兴趣与能力作为“原始素材”;2)找到自己与主流观点不同的“反共识”洞察;3)立即发布第一条内容,获取真实反馈并开始迭代。核心在于行动起来,在创作与实践中学习,逐步建立不依赖雇主的独立事业。

marsbit1小时前

Dan Koe新文:逃离打工人宿命,如何在AI替代潮中生存下来?

marsbit1小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

595人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片