Запуск Gemma 4 на iPhone стал вирусным: как далеко эра нулевых токенов?

marsbitОпубликовано 2026-04-06Обновлено 2026-04-06

Введение

Новая модель Gemma 4 от Google, основанная на архитектуре Gemini 3, поддерживает нативные мультимодальные возможности и занимает третье место в рейтинге Arena AI. Её компактные версии (E2B и E4B) могут работать локально на смартфонах, таких как iPhone и Samsung Galaxy, с контекстным окном до 128K и скоростью генерации более 40 токенов в секунду. Это открывает возможности для использования в медицине и других чувствительных сферах. Хотя модель демонстрирует высокую производительность в простых задачах, таких как генерация текста и кода, она испытывает трудности с сложными задачами, например, при работе в качестве агента с инструментами и структурированным выводом. Несмотря на некоторые ограничения, появление таких моделей, как Gemma 4, может изменить индустрию ИИ, переместив выполнение повседневных задач на локальные устройства и сократив зависимость от облачных API. В будущем локальные модели могут стать достаточно мощными, чтобы конкурировать с облачными решениями, что приведёт к пересмотру бизнес-моделей в отрасли.

Редакция Machine Heart

Недавно представленная Google открытая модель Gemma 4 стала большим сюрпризом для индустрии.

Она использует технологическую архитектуру, родственную Gemini 3, поддерживает нативную многомодальность, заняла третье место в мировом рейтинге Arena AI и предлагает несколько моделей. Меньшие модели — E2B (2,3B эффективных параметров) и E4B (4,5B эффективных параметров) — можно развертывать и запускать локально на мобильных устройствах с контекстным окном до 128K, что делает их «карманной заменой Gemini».

Как и ожидалось, модель быстро стала новой игрушкой для пользователей смартфонов.

Пост пользователя X набрал сотни тысяч просмотров. В видео он показал, как запускает Gemma 4 на iPhone локально, включая обработку изображений, аудио и управление фонариком. Он отметил, что Gemma 4 невероятно быстра и ощущается как магия.

На iPhone 17 Pro измерили скорость: если телефон использует чип Apple, то с помощью MLX (фреймворка машинного обучения от Apple), оптимизированного под эти чипы, скорость вывода модели может превышать 40 токенов в секунду.

На Samsung Galaxy также достигли аналогичной скорости, даже в режиме размышления. Это заставило многих воскликнуть: «Слишком быстро, чтобы быть правдой».

Такая скорость делает запуск моделей ИИ на мобильных устройствах жизнеспособным вариантом в будущем, особенно полезным в чувствительных сценариях, таких как медицина.

Контекстное окно в 128k также делает这些小模型 более привлекательными.

Как же запустить? Всё просто, это не только для гиков, ведь Google выпустил официальное приложение — Google AI Edge Gallery. Желающие могут скачать его, затем загрузить нужную версию модели и запустить.

И, будучи официальным продуктом Google, беспокоиться о безопасности особо не стоит.

Помимо мобильных версий, некоторые пробовали запускать более крупные версии Gemma 4 на мощном железе, например, Gemma 4 Mixture-of-Experts 26B на MacBook Pro с M5 Pro.

При обычном диалоге модель всё ещё довольно быстра, генерация текста и объяснение кода идут гладко.

Но когда её начали использовать как coding agent, возникли проблемы. Для работы агента требуются большой контекст (у Gemma 4 26B — 256k), сложные промпты и стабильный вызов инструментов. Gemma 4 явно не справлялась: зависала, выдавала ошибки или некорректные структуры вывода.

Переломный момент наступил, когда модель заменили на qwen3-coder. В той же среде создание файлов, выполнение команд и многошаговые задачи пошли нормально. Проблема, по его мнению, не в фреймворке агента, а в том, оптимизирована ли модель для «вызова инструментов + структурированного вывода». Здесь Gemma 4, возможно, не дотягивает, либо разработчик ещё не нашёл правильный способ использования.

Кроме того, некоторые отмечают, что интеллектуальный уровень Gemma 4 пока несколько ограничен.

Тем не менее, появление такого «производительного малютки», как Gemma 4, нельзя недооценивать. Если в будущем множество повседневных запросов, чатов, простых рассуждений, генерации кода и понимания изображений можно будет выполнять локально, без покупки токенов, то поставщикам токенов придётся несладко?

Конечно, сейчас ситуация не столь печальна. Ведь между открытыми моделями и передовыми закрытыми флагманами ещё есть разрыв, и большинство мощных открытых моделей по-прежнему ограничены аппаратными возможностями, пока не достигли приемлемого уровня на edge-устройствах.

Но тренд будущего ясен. В краткосрочной перспективе облачные закрытые модели сохранят лидерство в сложных рассуждениях и масштабной многозадачной коллаборации. Но в долгосрочной — с прогрессом железа и оптимизацией квантования, edge-модели постепенно отвоюют у облака高频简单任务 (высокочастотные простые задачи).

Поставщикам, живущим только за счёт продажи токенов и API-подписок, придётся активнее бороться за «по-настоящему сложные» части — сверхмощные агенты, сверхдлинный надёжный контекст и специализированные возможности, требующие огромных объёмов актуальных данных.

Gemma 4 — это только начало. Следующим сюрпризом может стать edge-модель, в повседневном использовании которой пользователь вообще не почувствует разницы между «локальным» и «облачным». Когда этот день наступит, вся бизнес-модель индустрии ИИ переживет настоящую перетряску.

Статья из WeChat Official Account «Machine Heart» (ID: almosthuman2014), автор: Редакция Machine Heart

Трендовые криптовалюты

Haedal ProtocolHAEDAL

Связанные с этим вопросы

QЧто такое Gemma 4 и почему она вызвала такой ажиотаж?

AGemma 4 — это новая модель искусственного интеллекта с открытым исходным кодом от Google, основанная на той же архитектуре, что и Gemini 3. Она поддерживает нативную многомодальность, занимает третье место в рейтинге Arena AI и имеет несколько вариантов, включая компактные модели (например, E2B и E4B), которые можно запускать локально на смартфонах. Её способность работать на мобильных устройствах с высокой скоростью (до 40 токенов в секунду на iPhone) и большим контекстным окном (128K) вызвала большой интерес.

QНа каких устройствах можно запустить Gemma 4 локально и как это сделать?

AGemma 4 можно запустить на современных смартфонах, таких как iPhone (с чипом Apple) и Samsung Galaxy, а также на более мощных устройствах, например, MacBook Pro с чипом M5. Для этого нужно скачать официальное приложение Google AI Edge Gallery, выбрать и загрузить нужную версию модели, после чего можно использовать её без подключения к интернету.

QКакие преимущества даёт локальный запуск моделей ИИ, таких как Gemma 4?

AЛокальный запуск обеспечивает высокую скорость обработки (до 40 токенов/с), конфиденциальность данных (что важно в медицине и других чувствительных сферах), отсутствие зависимости от интернета и необходимости покупать токены у облачных провайдеров. Это делает ИИ более доступным и удобным для повседневных задач.

QКакие ограничения есть у Gemma 4 при использовании в качестве coding agent?

AПри использовании для сложных задач, таких как работа в качестве coding agent, Gemma 4 (особенно версия 26B) может сталкиваться с проблемами: ошибками, зависаниями, некорректным структурированием вывода. Это связано с недостаточной оптимизацией модели для инструментов вызова и структурированного вывода, в отличие от некоторых других моделей, например, qwen3-coder.

QКак появление моделей вроде Gemma 4 может повлиять на будущее индустрии ИИ?

AЛокальные модели, такие как Gemma 4, могут изменить бизнес-модели индустрии ИИ, сократив зависимость от продажи токенов и облачных API. В будущем они могут взять на себя частые и простые задачи (чат, генерация кода, анализ изображений), вынуждая облачных провайдеров концентрироваться на более сложных сценариях, таких как продвинутые агенты, сверхдлинный контекст и специализированные возможности, требующие больших данных.

Похожее

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

Высший суд Австралии единогласно поддержал позицию Комиссии по ценным бумагам и инвестициям (ASIC) в деле против компании Block Earner. Суд постановил, что её продукт "Earner" с фиксированной доходностью, предлагавшийся в 2022 году, является финансовым продуктом и деривативом по существующему законодательству. Это означает, что для его предложения требовалась лицензия на предоставление финансовых услуг (AFSL). Дело возвращено в Федеральный суд для определения штрафных санкций. Данное решение создаёт важный прецедент, проясняя применение традиционного финансового регулирования к криптовалютным продуктам, предлагающим структурированную доходность. Оно подтверждает, что экономическая сущность продукта важнее его названия. Регуляторы теперь имеют чёткие правовые основания рассматривать подобные продукты как инвестиционные инструменты, требующие лицензирования. Хотя оспариваемый продукт более не предлагается, это решение затрагивает многие существующие и планируемые криптопродукты в Австралии и отражает глобальный тренд на подчинение крипто-доходных продуктов установленным регуляторным режимам. Для индустрии это означает необходимость переоценки соответствия продуктов законодательству, а для потребителей — напоминание о рисках, связанных с нелицензированными доходными продуктами.

bitcoinist1 ч. назад

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

bitcoinist1 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

Блокчейн-кошелек Blockchain.com расширяет доступ к токенизированным акциям и ETF США через интеграцию с Ondo Finance. Партнерство позволяет соответствующим критериям пользователям, особенно за пределами США, получать доступ к традиционным финансовым активам напрямую через привычный криптокошелек, минуя традиционные брокерские платформы. Ondo Finance, известный игрок на рынке токенизированных реальных активов (RWA), обеспечивает технологическую и регуляторную основу для этих активов. Эта интеграция является частью общей тенденции, когда криптоплатформы стремятся сделать токенизированные традиционные активы такими же простыми в использовании, как и обычные криптотокены. Однако широкому внедрению все еще могут препятствовать вопросы регулирования, хранения активов и их выкупа.

bitcoinist3 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

bitcoinist3 ч. назад

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

6 июня 2026 года на выставке Computex NVIDIA анонсировала свой первый процессор Vera CPU, что знаменует серьезный вход компании на рынок серверных процессоров. Это событие подчеркивает растущую ключевую роль CPU в эпоху ИИ-агентов, когда задачи, связанные с выводом (инференсом) и управлением, требуют все большей вычислительной мощности и эффективности процессоров. Рынок серверных процессоров переживает бум. Прогнозы, такие как отчет UBS, предполагают, что его объем может вырасти с примерно 300 млрд долларов в 2025 году до 1700 млрд долларов к 2030 году. Основной драйвер роста — ИИ-агенты, которые выполняют сложные многошаговые задачи, требующие интенсивной работы CPU для управления потоками данных, вызова инструментов и обработки контекста. В таких сценариях нагрузка на CPU может достигать 70-90%, а соотношение CPU к GPU в системах стремится к 1:1, в отличие от 1:8 в эпоху обучения моделей. Это привело к изменению спроса и даже к росту цен на серверные CPU впервые за более чем десятилетие. AMD и Intel столкнулись с дефицитом мощностей. Спрос разделился на высокопроизводительные CPU для работы внутри стоек с GPU и более умеренные, но массовые CPU для развертывания независимых узлов агентов. Новая конкурентная динамика привлекла новых игроков, таких как NVIDIA с ее ARM-архитектурой, и открыла возможности для китайских производителей CPU, таких как Hygon (HaiGuang). Их рост поддерживается как общим рыночным бумом, так и политикой импортозамещения (программа «синьчуан»), требующей замены иностранного оборудования в государственном секторе к 2027 году. Таким образом, в центре следующего этапа развития ИИ находится не только GPU, но и эффективное взаимодействие CPU и GPU, что переопределяет ландшафт полупроводниковой индустрии.

marsbit3 ч. назад

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

marsbit3 ч. назад

Технологический поток Разведуправления: Директор по ИИ AMD публично раскритиковал Claude Code, заявив, что он «стал глупее и ленивее», Трамп заявил о полном прекращении огня в Ормузском проливе, но в проливе осталось около 80 морских мин

Эксклюзив Wired: SK Telecom, стратегический партнер Anthropic, находится под проверкой экспортного контроля США из-за возможного трансфера технологий модели Mythos. GLM-5.2 от китайской Z.AI: модель, по заявлениям, близкая по производительности к Claude Opus, полностью обходится без чипов Nvidia. В сфере чипов: MIT создает собственную ОС для изучения работы процессоров; ASML опровергает заявления США о поставках передовых EUV-установок в Китай; Amazon планирует продавать свои AI-чипы Trainium/Inferentia сторонним компаниям. Безопасность: обнаружено 10 тыс. репозиториев на GitHub, распространяющих вредоносное ПО; Apple исправила критическую уязвимость прослушки в Beats Studio Buds. На рынке: акции полупроводниковых компаний резко выросли (Intel +10.6%, Micron +8.7%); SpaceX упала на 3.56%. Геополитика и экономика: Несмотря на заявление Трампа о перемирии, в главном фарватере Ормузского пролива остается около 80 необезвреженных мин, что удерживает 80 супертанкеров с 80 млн баррелей нефти. Иран отменил дипломатическую поездку в Швейцарию. Основной контекст: Временная "разрядка" в геополитике контрастирует с глубокой и долгосрочной реструктуризацией глобальных технологических и полупроводниковых цепочек, где независимость от доминирующих игроков становится ключевым трендом.

marsbit3 ч. назад

Технологический поток Разведуправления: Директор по ИИ AMD публично раскритиковал Claude Code, заявив, что он «стал глупее и ленивее», Трамп заявил о полном прекращении огня в Ормузском проливе, но в проливе осталось около 80 морских мин

marsbit3 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

Южная Корея планирует включить финтех-компании в новую систему лицензирования трансграничных переводов виртуальных активов, которая должна быть введена в декабре. Согласно поправкам в Закон о валютных операциях, компаниям, осуществляющим такие переводы, необходимо будет зарегистрироваться в Министерстве экономики и финансов и отчитываться через национальную систему валютной отчётности. Это сделано для того, чтобы вывести криптовалютные переводы из-под неформального надзора и снизить риски отмывания денег. Изначально ожидалось, что доступ к системе получат в основном криптобиржи, такие как Upbit и Bithumb. Однако регуляторы, включая Банк Кореи, рассматривают возможность расширения круга участников, включив в него нетрадиционные криптоплатформы и финтех-фирмы, если они смогут эффективно осуществлять переводы. Министерство экономики и финансов и Банк Кореи совместно с отраслевыми участниками разрабатывают финальные правила реализации рамок регулирования до их запуска в декабре. Это происходит на фоне усиления надзора за цифровыми активами в стране, включая разработку правил для токенизированных ценных бумаг.

TheNewsCrypto5 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

TheNewsCrypto5 ч. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

Запуск Gemma 4 на iPhone стал вирусным: как далеко эра нулевых токенов?

Введение

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

Торговля

Популярные статьи

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Топ вопросы

Популярные категории

Популярные теги