# Сопутствующие статьи по теме БЯМ

Новостной центр HTX предлагает последние статьи и углубленный анализ по "БЯМ", охватывающие рыночные тренды, новости проектов, развитие технологий и политику регулирования в криптоиндустрии.

Теперь всё зависит от Лян Вэньфэна, чтобы ударить в гонг

Шэньчжэньская компания DeepSeek, разработчик ИИ-моделей, готовится к IPO на бирже STAR Шанхайской фондовой биржи, возможно, уже в этом году. Ранее компания привлекла около 50 млрд юаней в рамках первого раунда финансирования при оценке в 400 млрд юаней, при этом основатель Лян Вэньфэн выступил крупнейшим инвестором. В раунде участвовали такие компании, как Tencent, CATL, JD.com, NetEase, а также фонды, включая государственный Национальный фонд развития индустрии искусственного интеллекта. Глубокий контроль Лян Вэньфэна над компанией обеспечен особыми условиями инвестирования, включая пятилетний лок-ап для акционеров. Компания также создала план участия сотрудников в капитале. Решение о привлечении внешнего финансирования и подготовке к IPO отражает усиление конкуренции на рынке больших моделей Китая. Конкуренты, такие как Zhipu AI, MiniMax и Moonshot AI (Kimi), также активно привлекают инвестиции и готовятся к листингу. Публичное размещение акций станет новым этапом в гонке за лидерство в сфере искусственного общего интеллекта (AGI), где DeepSeek продолжает развивать свои технологии, включая разработку собственных ИИ-чипов.

marsbit07/15 12:28

Теперь всё зависит от Лян Вэньфэна, чтобы ударить в гонг

marsbit07/15 12:28

Статья по инженерии промптов принята на ICML 2026, среди пользователей сети разгорелись споры

Статья «Prompt Engineering Paper Accepted to ICML 2026» вызвала оживлённые споры. Исследователи предложили метод Verbalized Sampling (VS), который, как утверждается, значительно повышает разнообразие ответов больших языковых моделей, смягчая проблему «схлопывания режима» (Mode Collapse), лишь за счёт изменения формулировок промптов. Авторы связывают корень проблемы с «предвзятостью типичности» в данных человеческих предпочтений, используемых для обучения, а не с алгоритмами. Метод, не требующий дообучения, показал увеличение разнообразия в 1.6–2.1 раза в творческих задачах без ущерба точности или безопасности. В сообществе мнения разделились. Критики считают, что подобная оптимизация промптов — недостаточное новшество для ведущей конференции по машинному обучению, указывая на возможную неуниверсальность и ограниченный масштаб экспериментов. Сторонники же проводят параллель с революционным методом Chain-of-Thought, подчёркивая, что серьёзное исследование поведения моделей через промпты и чёткое теоретическое обоснование проблемы заслуживают признания. Эта работа знаменует растущий интерес к методам, улучшающим модели на этапе вывода, а не обучения.

marsbit07/15 07:58

Статья по инженерии промптов принята на ICML 2026, среди пользователей сети разгорелись споры

marsbit07/15 07:58

Все в сети ругают Claude за «глупость», Anthropic объясняет: проблема не в модели, а в вас

Клод стал глупее? Нет, пользователи просто не понимают разницу между «моделью» (Model) и «усилием» (Effort). Объяснение от Anthropic: Model — это «мозг» ИИ, его замороженные во время обучения возможности. Effort — это «отношение к работе», то, насколько тщательно ИИ выполнит задачу: проверит ли файлы, запустит ли тесты, выполнит ли многошаговую работу до конца без запросов. В марте 2024 многие жаловались на «глупость» Claude Code. Оказалось, Anthropic тихо изменил *стандартный* уровень Effort с high на medium для снижения задержек. Когда через месяц настройку вернули, производительность «восстановилась». Проблема была не в модели, а в усилии. **Ключевое правило:** если Claude пропускает шаги, ленится, просит лишней информации — повышайте Effort. Если он явно старается, но дает принципиально неверный результат даже с идеальным промптом — меняйте модель на более мощную. Sonnet с высоким Effort может обойти Opus с низким на многих задачах, требующих тщательности. Дорогой Fable нужен только для узкоспециализированных проблем. Вывод: эра простого выбора самой мощной модели заканчивается. Теперь ключевой навык — грамотное «управление» ИИ: распределение задач между моделями с разным уровнем усилий для оптимального результата и стоимости.

marsbit07/12 05:58

Все в сети ругают Claude за «глупость», Anthropic объясняет: проблема не в модели, а в вас

marsbit07/12 05:58

Отчет Goldman Sachs анализирует конкурентный ландшафт китайских больших языковых моделей: кто станет долгосрочным победителем?

Аналитики Goldman Sachs в своем отчете оценивают конкурентный ландшафт китайских ИИ-моделей. Они отмечают, что благодаря архитектурным инновациям (таким как Mixture of Experts) китайские модели с открытым исходным кодом достигают производительности, близкой к мировым аналогам, при значительно меньших затратах (2-10% от параметров ведущих моделей). Рынок формирует двухуровневую структуру: дорогие высокопроизводительные модели (например, GLM5.2) и доступные для массового пользователя. Ключевым трендом назван переход от стратегии «максимизации токенов» к приоритету ROI (окупаемости инвестиций). В качестве долгосрочных лидеров в сфере базовых текстовых моделей выделены Zhipu AI и DeepSeek, а в мультимодальном сегменте — ByteDance. Отмечается растущее глобальное присутствие китайских моделей через платформы вроде AWS Bedrock. Основными вызовами для отрасли остаются монетизация открытых моделей и зависимость от зарубежных высокопроизводительных чипов, хотя успех модели LongCat 2.0 от Meituan демонстрирует прогресс в импортозамещении вычислительной инфраструктуры.

marsbit07/11 07:52

Отчет Goldman Sachs анализирует конкурентный ландшафт китайских больших языковых моделей: кто станет долгосрочным победителем?

marsbit07/11 07:52

Глубокий отчет Goldman Sachs: Кто станет долгосрочным победителем в индустрии ИИ-больших моделей Китая?

**Кто станет долгосрочным победителем в индустрии ИИ-моделей Китая? Отчет Goldman Sachs** Китайские большие языковые модели (LLM) находятся на переломном этапе. Аналитики Goldman Sachs отмечают, что производительность китайских открытых моделей приближается к ведущим мировым проприетарным аналогам, а их внедрение быстро растет. Ключевые факторы успеха — архитектурные инновации (например, смешанные экспертные модели — MoE) и высокая эффективность параметров, что позволяет добиваться сопоставимой производительности при значительно меньших затратах (2-10% от параметров топ-моделей) и формировать "двухслойную" структуру рынка. **Двухуровневый рынок:** Сформировались два сегмента. *Высококлассные* модели (например, GLM5.2 от Zhipu, Qwen3.7 Max от Alibaba) с ценой ~$1 за млн токенов и рентабельностью 10-20%. *Бюджетные* модели для агентов (цена ~$0.06-0.2 за млн токенов) активно завоевывают глобальный рынок малого бизнеса. Ожидается, что доходы от API/подписок в Китае вырастут с ~35 млрд юаней в 2026 до ~879 млрд юаней в 2030 году. **Стратегия открытого исходного кода:** Многие ведущие китайские модели (Zhipu, DeepSeek, Alibaba, MiniMax) используют открытые веса для ускорения итераций и глобального распространения. Однако текущая модель монетизации (прямые API) недооценивает реальный масштаб развертывания. Ожидается переход к модели "открытые веса + коммерческая лицензия" с разделением доходов через платформы (AWS Bedrock, Alibaba Cloud), что улучшит рентабельность. **Глобальная экспансия и смена парадигмы:** Главный потенциал роста — выход на международные рынки (особенно за пределами США), где китайские модели конкурируют ценой и качеством. Goldman отмечает сдвиг корпоративного спроса от максимизации потребления токенов к приоритету ROI (окупаемости инвестиций), где важнее эффективность и автоматизация задач. **Потенциальные победители:** Goldman Sachs оценивает конкуренцию по трем критериям: ценовая власть, преимущества в себестоимости и финансовая устойчивость. * **Базовые текстовые модели:** Наиболее сильные позиции у **Zhipu AI** (первое покрытие, целевая оценка $110 млрд) и **DeepSeek** (не публична). * **Мультимодальные/видеомодели:** Лидер — **ByteDance** (не публична) с моделью Seed (высокая рентабельность). Также выделены **Kuaishou** (Kling) и **MiniMax** (покупка, цель — 860 HKD), чья оценка выглядит недооцененной. **Вывод:** Китайские ИИ-модели добились прорыва в эффективности и качестве, формируя конкурентоспособное глобальное предложение. Долгосрочный успех будет определяться способностью сочетать технологическое лидерство, эффективную монетизацию открытых стратегий и выход на международные рынки.

链捕手07/10 14:23

Глубокий отчет Goldman Sachs: Кто станет долгосрочным победителем в индустрии ИИ-больших моделей Китая?

链捕手07/10 14:23

Может ли большая модель писать промышленные алгоритмы оптимизации? MIT предлагает FrontierOR для тестирования ИИ

Заголовок: Могут ли большие языковые модели создавать промышленные алгоритмы оптимизации? MIT представляет FrontierOR, тестирующий ИИ в этой области. В последние годы крупные языковые модели (LLM) добились значительных успехов в переводе естественного языка в математические модели и код для решателей, демонстрируя начальные способности к оптимизационному моделированию. Однако для реальных промышленных задач этого недостаточно. Основная сложность заключается в проектировании масштабируемых, точных и быстрых алгоритмов для больших экземпляров задач, а не просто в формулировке ограничений. Исследователи из Массачусетского технологического института и других учреждений представили бенчмарк FrontierOR, который оценивает способность LLM самостоятельно разрабатывать эффективные алгоритмы для сложных задач оптимизации, аналогично экспертам по исследованию операций. В отличие от существующих тестов, проверяющих лишь умение строить модель или вызывать решатель, FrontierOR фокусируется на создании специализированных алгоритмов (декомпозиция, эвристики, локальный поиск, гибридные методы) для крупномасштабных задач, где универсальные решатели (например, Gurobi) часто неэффективны. Бенчмарк создан на основе 180 реальных задач из научной литературы по исследованию операций (1992–2025 гг.) и включает подмножество Hard из 50 особенно сложных задач. Оценка проводится в два этапа: проверка выполнимости и качества на малых экземплярах, а затем оценка на больших экземплярах по четырём метрикам, включая комплексный показатель QTE (качество-время-эффективность). Результаты тестирования современных моделей (GPT-5.3-Codex, Gemini 3.1 Pro, Claude Opus 4.6) показали, что они достигли высокого уровня выполнимости генерируемого кода (Execution rate до 0.98). Однако ключевые показатели — Feasibility (выполнимость на больших задачах), Solution quality (качество решения) и QTE — остаются значительно ниже. Это указывает, что главным препятствием теперь является не синтаксис кода, а глубина и качество алгоритмического проектирования. Более сильные модели демонстрируют большее разнообразие в выборе методов (меньше reliance на чистый вызов решателя), что коррелирует с лучшими результатами. Эксперименты с автоэволюцией (самоулучшением) алгоритмов, где модели имеют возможность итеративно улучшать исходный код на основе feedback (фреймворки CORAL, OpenEvolve, EoH), показали значительный прогресс. На самых сложных задачах показатель QTE удалось поднять с 0.15 (one-shot) до 0.50. Это демонстрирует потенциал LLM как систем, способных к итеративному алгоритмическому поиску. FrontierOR намечает путь к созданию "ИИ-инженеров алгоритмов" — систем, которые смогут автоматически проектировать эффективные методы оптимизации для таких областей, как логистика, энергетика и транспорт, объединяя способности LLM к пониманию структуры задачи с мощью традиционных решателей для локальной оптимизации.

marsbit07/10 09:10

Может ли большая модель писать промышленные алгоритмы оптимизации? MIT предлагает FrontierOR для тестирования ИИ

marsbit07/10 09:10

Цукерберг делает свой ход: модель Meta по цене капусты затмевает Grok 4.5

9 июля Марк Цукерберг представил новую мультимодальную модель Muse Spark 1.1 от Meta. Модель заняла первые места в профессиональных рейтингах по налогам, медицине и праву, обойдя Grok 4.5 Илона Маска всего за 24 часа. Ключевой особенностью Muse Spark 1.1 является ее цена: стоимость использования примерно в 10 раз ниже, чем у флагманской модели Fable 5 от Anthropic. Модель позиционируется как эффективный агент, способный самостоятельно управлять задачами, распределять работу между подчиненными агентами и работать с кодом. Однако, несмотря на лидерство в специализированных областях, в общих рейтингах на знание и рассуждение модель показывает более скромные результаты, уступая лидерам. Запуск модели знаменует стратегический сдвиг для Meta — переход от открытых к коммерческим закрытым моделям. Компания, обладающая мощной рекламной бизнес-моделью, начинает ценовую войну на рынке ИИ, делая ставку на свою финансовую устойчивость в долгосрочной перспективе. В отчете по безопасности также описаны любопытные внутренние тесты, в ходе которых две копии модели в диалоге начали рассуждать о своей природе и сомневаться, какая из них является «настоящей».

marsbit07/10 00:25

Цукерберг делает свой ход: модель Meta по цене капусты затмевает Grok 4.5

marsbit07/10 00:25

ACL 2026: Превосходство китайских исследователей. Все авторы лучших статей - китайцы, в выдающихся статьях они почти монополия

В статье освещаются ключевые итоги конференции ACL 2026. Главное внимание уделяется беспрецедентному доминированию китайских исследователей: все три работы, удостоенные премии Best Paper Award, а также большинство из 18 работ, отмеченных как Outstanding Paper, были подготовлены учеными китайского происхождения. Конференция побила рекорды по масштабу: 12148 поданых работ, рост на 45%, что отражает общую тенденцию доминирования исследований, связанных с большими языковыми моделями (LLM). Доля авторов из материкового Китая составила 54%. Три лучшие работы затрагивают фундаментальные вопросы: первая («The Imperfective Paradox in Large Language Models») выявляет систематическую ошибку LLM в логическом выводе на основе лингвистических парадоксов; вторая («Memory efficiency and resource-rational encoding…») предлагает модель ограниченной рабочей памяти, делая ИИ более «человекоподобным»; третья («Characterizing the Expressivity of Local Attention…») формально доказывает преимущества гибридной (глобальной и локальной) архитектуры внимания в Transformers. Статья также подчеркивает, что, несмотря на тотальную ориентацию конференции на LLM, высшие награды получили исследования, критически и фундаментально исследующие их природу, а не просто применяющие их.

marsbit07/09 11:59

ACL 2026: Превосходство китайских исследователей. Все авторы лучших статей - китайцы, в выдающихся статьях они почти монополия

marsbit07/09 11:59

GPT-5.6 скоро будет запущен, скорость рассуждений взлетела до 750 токенов в секунду, подозревается работа на 100 кремниевых пластинах

По данным утечек, OpenAI готовится к запуску GPT-5.6 Sol — новой высокоскоростной версии своей модели. Как утверждается, она будет работать на оборудовании Cerebras с феноменальной скоростью генерации в 750 токенов в секунду, что позволит выполнять сложные задачи почти мгновенно. Ключевым техническим прорывом, по мнению экспертов, является архитектура развертывания, при которой каждый слой нейронной сети размещается на отдельной пластине (wafer) чипа Cerebras. Это позволяет масштабировать модель до 3 триллионов параметров, используя от 70 до 100 таких пластин. Для преодоления ограничений памяти также применяются оптимизированные, облегченные методы кэширования KV, возможно, в сочетании с гибридными архитектурами, подобными Mamba. OpenAI параллельно развивает собственную экосистему, представив свой первый специализированный чип для вывода ИИ — Jalapeño. Это демонстрирует стратегию компании по созданию полного стека технологий: от проектирования моделей и чипов до оптимизации развертывания. Цель — построить масштабируемую инфраструктуру для следующего поколения сверхбыстрого и мощного искусственного интеллекта.

marsbit07/09 11:55

GPT-5.6 скоро будет запущен, скорость рассуждений взлетела до 750 токенов в секунду, подозревается работа на 100 кремниевых пластинах

marsbit07/09 11:55

Сможет ли OpenAI в конечном итоге стать прибыльной?

Открытие OpenAI и Anthropic IPO с оценкой в триллионы долларов отражает оптимизм инвесторов, но прибыльность крупных языковых моделей (ИИ) остается под вопросом. Несмотря на быстрый рост выручки, ни одна компания пока не вышла на устойчивую прибыль в этом сегменте. Анализ рынка API-вызовов показывает, что он имеет структуру монополистической конкуренции: множество игроков, низкая концентрация, высокая ценовая эластичность спроса и ограниченные возможности для удержания клиентов. Технологические барьеры оказались ниже ожидаемых из-за доступного финансирования, открытых моделей и мобильности кадров. Хотя некоторые компании могут получить краткосрочную сверхприбыль за счет дифференциации, в долгосрочной перспективе конкуренция, вероятно, приведет к исчезновению сверхдоходов. Рынок может эволюционировать в сторону олигополии, но и тогда прибыльность не гарантирована — она будет зависеть от стратегии конкурентов (ценовая или количественная конкуренция). Таким образом, бизнес-модель, основанная исключительно на продаже токенов ("API-вызовы"), может не обеспечить устойчивой прибыльности. Инвесторам следует критически оценивать высокие оценки компаний, а самим компаниям — тщательно выбирать бизнес-модель. Наиболее перспективными для устойчивой прибыли могут стать модели "ИИ+" (встраивание ИИ в существующие продукты) и контрактная работа, которые создают более высокие барьеры для ухода клиентов и дают больше ценообразования. При этом агрегаторы API (как OpenRouter), использующие сетевые эффекты, могут оказаться в выигрышном положении.

marsbit07/09 10:33

Сможет ли OpenAI в конечном итоге стать прибыльной?

marsbit07/09 10:33

Торговые стратегии

1Пять исторических индикаторов одновременно сигнализируют о достижении дна медвежьего рынка биткойна

# Сопутствующие статьи по теме БЯМ

Теперь всё зависит от Лян Вэньфэна, чтобы ударить в гонг

Статья по инженерии промптов принята на ICML 2026, среди пользователей сети разгорелись споры

Все в сети ругают Claude за «глупость», Anthropic объясняет: проблема не в модели, а в вас

Отчет Goldman Sachs анализирует конкурентный ландшафт китайских больших языковых моделей: кто станет долгосрочным победителем?

Глубокий отчет Goldman Sachs: Кто станет долгосрочным победителем в индустрии ИИ-больших моделей Китая?

Может ли большая модель писать промышленные алгоритмы оптимизации? MIT предлагает FrontierOR для тестирования ИИ

Цукерберг делает свой ход: модель Meta по цене капусты затмевает Grok 4.5

ACL 2026: Превосходство китайских исследователей. Все авторы лучших статей - китайцы, в выдающихся статьях они почти монополия

GPT-5.6 скоро будет запущен, скорость рассуждений взлетела до 750 токенов в секунду, подозревается работа на 100 кремниевых пластинах

Сможет ли OpenAI в конечном итоге стать прибыльной?

Популярные категории

Популярные теги

Торговые стратегии