谷歌新Gemini AI模型在基准测试中击败GPT-4o

币界网Опубликовано 2024-08-02Обновлено 2024-08-02

币界网报道:

作者:Tristan Greene,CoinTelegraph;编译:陶朱,

生成式人工智能基准测试领域又出现了一位新霸主,它的名字是 Gemini 1.5 Pro。

之前的冠军 OpenAI 的 ChatGPT-4o 终于在 8 月 1 日被超越,当时谷歌悄然发布了其最新模型的实验版本。

Gemini 的最新更新没有大张旗鼓地发布,目前被标记为实验性的。但它很快引起了社交媒体上人工智能社区的关注,因为有报道称它在基准测试分数上超越了竞争对手。

人工智能基准

自 GPT-3 发布以来,OpenAI 的 ChatGPT 一直是生成式 AI 的标杆。过去一年左右,其最新模型 GPT-4o 和最接近的竞争对手 Anthropic 的 Claude-3 在大多数常见基准测试中都遥遥领先于大多数其他模型,几乎没有遇到任何竞争对手。

joLFxVORsiw7ebQNskYsq6svnXEnsKu4FYrunFjb.jpeg

来源:大型模型系统组织。

最受欢迎的基准测试之一是 LMSYS Chatbot Arena。它测试各种任务的模型并分配总体能力分数。GPT-4o 的得分为 1,286,而 Claude-3 获得了可观的 1,271 分。

Gemini 1.5 Pro 的先前版本得分为 1,261。但 8 月 1 日发布的实验版本 (Gemini 1.5 Pro 0801) 得分高达 1,300。

这表明它总体上比竞争对手更强大,但基准测试并不一定能准确反映 AI 模型能做什么和不能做什么。

社区兴奋

在没有更深入的比较的情况下,我们正进入一个 AI 聊天机器人市场已经足够成熟,可以提供多种选择的时代。最终由用户来决定哪种 AI 模型最适合他们。

据传,Gemini 的最新版本引起了一波兴奋,社交媒体上的用户称它“非常好”。一位 Redditor 甚至写道,它“完全胜过 4o”。

目前尚不清楚 Gemini 1.5 Pro 的实验版本是否会成为未来的默认版本。虽然截至本文发表时,它仍然普遍可用,但它处于早期发布或测试阶段这一事实表明,出于安全或协调原因,该模型可能会被撤销或更改。

Трендовые криптовалюты

Похожее

Если можно не вкладывать — не вкладываем: Девятилетний разбор ошибок венчурного капиталиста, прошедшего четыре цикла

**IOSG основатель Jocy: Девятилетний опыт прохождения четырех циклов — «Если можно не инвестировать, мы не инвестируем»** За девять лет инвестиций в Web3 через IOSG мы создали «базу данных неудачных основателей», чтобы учиться на ошибках. Вот ключевые паттерны провала и качества успешных основателей. **6 портретов неудачных основателей:** 1. **Эмоционально неустойчивые.** Рушатся под давлением (80% снижение, атаки сообщества), вступают в конфликты вместо решения проблем. 2. **Без истинного голода / с запасным путем.** Имея «мягкую подушку» (богатство, путь назад в корпорацию), не выкладываются полностью в критические моменты. 3. **С неконтролируемым Эго.** * «Идеальные исполнительные машины»: сильны в исполнении, но хрупки, когда меняются фундаментальные правила (новые направления). * «Профессорский тип»: глубокая экспертиза, но часто слабое понимание бизнеса и неготовность учиться (uncoachable). * **Зависимые от прошлого пути:** пытаются копировать успех предыдущего цикла в новых условиях. 4. **Приоритет токенов, а не продукта.** Если токен — лишь инструмент финансирования, а реальный денежный поток и активы отделены в другой компании, проект нежизнеспособен. 5. **Без тезиса о выходе (Exit Thesis) с первого дня.** Не понимают стратегию капитала: что докажет этот раунд, какие метрики откроют следующий, как инвесторы в итоге получат возврат. 6. **Без опыта полного рыночного цикла.** Не проходили полный бычий/медвежий рынок (например, 2018, 2022), недооценивают свою уязвимость в кризис. Для таких команд мы ограничиваем начальные инвестиции. **Качества успешных основателей (обратная сторона):** * **Одержимость проблемой:** живут ею 24/7. * **Второй стартап + неконсенсусное видение:** извлекли уроки из прошлой неудачи, имеют смелые независимые тезисы. * **Отличные коммуникации + контролируемое Эго:** умеют ясно доносить сложные идеи; амбициозны, но не самонадеянны. * **Не сдаются, выносливы:** устойчивы к публичному давлению, гибко обновляют убеждения на основе новых данных (Байесовское мышление). * **Глобальное видение, Agency и Taste (вкус):** с первого дня мыслят глобально. В эпоху ИИ ценятся способность действовать самостоятельно (Agency) и вкус/чувство прекрасного для постановки оригинальных задач. **Три совета основателям для выживания:** 1. **Денежный поток важнее нарратива.** Выживут те, у кого есть реальная выручка. 2. **Не спешите выпускать токен.** Это тяжелое обязательство. Скрытые затраты (маркет-мейкеры, ликвидность, compliance) могут достигать миллионов долларов. Если не привлекли такой капитал — вы не готовы. 3. **Уважайте ликвидность.** Продавайте на пике, покупайте на дне для поддержки протокола. Оценка привлечения должна соответствовать реалистичным результатам за 3 года. **Как мы оцениваем основателей (по框架张一鸣):** * **Основа (Эмпатия):** умение работать с людьми, лидерство, эмоциональная стабильность. * **Середина (Логика и инструменты):** структурированное мышление. * **Вершина (Воображение):** видение того, что возможно, но еще не существует. **Итог:** За девять лет мы научились не столько находить лучших, сколько не ошибаться. Главное правило: **«Если можно не инвестировать — не инвестируем».** Именно дисциплина отказа от сомнительных сделок, а не единичные гениальные решения, позволяет пройти через циклы в постоянно меняющемся мире Crypto.

Foresight News6 мин. назад

Если можно не вкладывать — не вкладываем: Девятилетний разбор ошибок венчурного капиталиста, прошедшего четыре цикла

Foresight News6 мин. назад

SemiAnalysis разбирает по косточкам ChangXin Memory Technologies: выручка в $500 млрд, IPO в суперцикле

SemiAnalysis представляет подробный анализ ChangXin Memory Technologies (CXMT), готовящейся к крупнейшему в истории Китая IPO в области полупроводников. Основанная в 2016 году, компания начала с приобретения патентов и привлечения специалистов обанкротившегося немецкого производителя DRAM Qimonda. При десятилетней финансовой поддержке властей Хэфэя, CXMT впервые вышла на прибыль в 2025 году. В первом квартале 2026 года ее выручка достигла $7,3 млрд. Отчет раскрывает данные предстоящего IPO: в 2026 году выручка может превысить $50 млрд, что обусловлено в основном сверхциклом роста цен на DRAM, а не резким увеличением доли рынка. CXMT быстро наращивает производственные мощности, к концу 2026 года достигнув ~350 тыс. пластин в месяц, приблизившись к Micron. Однако ее рентабельность пока зависит от высоких цен, а стоимость бита DDR5 остается на ~30% выше, чем у лидеров рынка. Ключевая проблема CXMT — отставание в производстве HBM. Лишь малая часть мощностей выделена под HBM, а технологические трудности, особенно в стековом монтаже кристаллов, приводят к низкому общему выходу годной продукции (~25% для HBM3 8-hi). Компания, вероятно, сосредоточится на HBM3E. Хотя коммерчески выгоднее производить commodity DRAM, государственное давление в целях импортозамещения в сфере AI-вычислений может заставить CXMT увеличить инвестиции в HBM. Структура IPO показывает сложную схему владения с преобладанием государственного капитала и соглашений о совместных действиях, что позволяет консолидировать прибыль заводов, где CXMT имеет менее 50% доли. При запланированном привлечении ~$4,1 млрд средства будут направлены в основном на развитие основных технологий DRAM, а не на HBM. Такие клиенты, как Alibaba, выступая одновременно акционером и заказчиком, обеспечивают стабильный внутренний спрос. В будущем CXMT станет серьезным конкурентом для Samsung, SK Hynix и Micron на глобальном рынке памяти.

marsbit24 мин. назад

SemiAnalysis разбирает по косточкам ChangXin Memory Technologies: выручка в $500 млрд, IPO в суперцикле

marsbit24 мин. назад

От Corning до Ciena: 10-кратные возможности на цепочке оптической связи для ИИ

Переход от меди к оптическим технологиям в дата-центрах ИИ создает инвестиционные возможности не только для известных компаний-производителей чипов, но и для ключевых поставщиков по всей цепочке создания стоимости в фотонике. Основной тезис: по мере перехода от 800G к 1.6T и далее к 3.2T, наибольшую выгоду получат компании, поставляющие критически важные компоненты, которые необходимы всем крупным игрокам, а не только самые разрекламированные бренды. **Ключевые компании и их роль:** * **Corning:** Лидер в производстве оптического волокна. Имеет долгосрочные контракты на миллиарды долларов с такими гигантами, как Meta, Amazon, Microsoft и другими. Высокая рентабельность и эффект масштаба. * **Amphenol:** Крупный производитель высокоскоростных соединителей и кабелей (как медных, так и оптических) для стоек ИИ-серверов. Эффективно интегрирует приобретения, демонстрируя высокий рост и прибыльность. * **Credo Technology:** Предоставляет решения для передачи данных (как по меди, так и по оптике), выступая "мостом" между старыми и новыми технологиями. Имеет высокие темпы роста, но также высокие риски из-за концентрации клиентов. * **Ciena:** Лидер в области когерентной оптики, чьи решения позволяют увеличить пропускную способность существующих волокон без их замены. Имеет значительный портфель заказов. * **AXT и VEO Solutions:** Компании "верхнего уровня" цепочки поставок. AXT производит ключевые материалы для оптических лазеров, но сталкивается с рисками экспортного регулирования. VEO Solutions предоставляет тестовое оборудование, необходимое всем участникам рынка ("лопаты для золотой лихорадки"). Также существуют специализированные ETF, такие как FOTO, для диверсифицированного инвестирования в фотонику. **Вывод:** Физические ограничения меди достигнуты. Переход на оптические технологии в дата-центрах ИИ неизбежен, а выгоды будут распределяться среди ключевых игроков по всей цепочке поставок — от материалов и компонентов до систем и тестирования.

marsbit38 мин. назад

От Corning до Ciena: 10-кратные возможности на цепочке оптической связи для ИИ

marsbit38 мин. назад

Collector Crypt с DAU всего 800 человек уже стал одним из самых прибыльных проектов в криптосфере?

**Collector Crypt (CARDS)**: Высокодоходный проект на Solana, оцифровывающий физические коллекционные карточки (в основном Pokémon). Он создает полную финансовую инфраструктуру вокруг этого актива. **Ключевая бизнес-модель**: Основная прибыль генерируется через систему «Гача» (цифровые кейсы). Платформа покупает карты оптом со скидкой 5-15%, пользователи открывают кейсы и могут либо оставить карты, либо немедленно продать их обратно платформе с дисконтом 7-15%. Средний выигрыш пользователя (EV) составляет около +2%, а платформа захватывает около 4.5% прибыли. **Революция рынка**: Проект бросает вызов таким гигантам, как eBay, где комиссии продавца достигают 16-20%. Collector Crypt взимает всего 2% за сделки, предлагая мгновенные расчеты, застрахованное хранение и удобную торговлю, кардинально улучшая пользовательский опыт. **Финансовые показатели**: В мае годовая прибыль оценивалась в ~53 млн долларов, а в июне темпы роста достигли ~109 млн долларов. При текущей полностью разводненной стоимости (FDV) ~550 млн долларов проект демонстрирует исключительную рентабельность. Помимо «Гачи», будущие источники дохода включают комиссии на вторичном рынке, партнерские доли и инструменты для участия в аукционах eBay. **Токеномика**: Общее предложение токенов — 20 млрд, но реальное циркулирующее предложение к 2027 году, вероятно, будет значительно меньше (около 13 млрд в самых агрессивных предположениях), что делает текущую оценку привлекательной. Команда уже начала выкуп токенов на открытом рынке. **Потенциал**: При всего около 800 ежедневных активных пользователей проект генерирует значительную прибыль. Он позиционирует себя не просто как торговая площадка для карточек, а как финансовая инфраструктура для нового класса активов — коллекционных предметов, открывая этот рынок для институциональных инвесторов. Расширение на спортивные карты и другие категории коллекционирования только начинается.

Foresight News51 мин. назад

Collector Crypt с DAU всего 800 человек уже стал одним из самых прибыльных проектов в криптосфере?

Foresight News51 мин. назад

Сенат США нацелен на осень 2026 года для выпуска законопроекта о налогообложении криптовалют на фоне продвижения закона CLARITY Act

Сенат США планирует представить законопроект о налогообложении криптовалют к осени 2026 года, параллельно продвигая закон CLARITY Act. Сенатор Стив Дэйнс сообщил, что республиканцы уже разработали основу законопроекта, схожую с недавними предложениями Палаты представителей. Растущий интерес Конгресса к четким налоговым правилам для цифровых активов стимулировал эту работу, при этом Комитет по финансам Сената ранее уже обсуждал такие вопросы, как стейкинг и майнинг. В то же время законодатели продолжают работу над всеобъемлющим законом CLARITY Act, который определяет правила регулирования криптовалютного рынка и разграничивает полномочия федеральных органов. Этот законопроект был одобрен Комитетом по банковским делам Сената, и его поддержали более 200 компаний отрасли, считающих, что четкое регулирование стимулирует инновации и инвестиции. Оба проекта — налоговый законопроект Сената и CLARITY Act — рассматриваются как взаимодополняющие шаги по созданию комплексной правовой базы для цифровых активов в США. Активность Конгресса указывает на ускорение процесса разработки соответствующего законодательства.

TheNewsCrypto54 мин. назад

Сенат США нацелен на осень 2026 года для выпуска законопроекта о налогообложении криптовалют на фоне продвижения закона CLARITY Act

TheNewsCrypto54 мин. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.9k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片