Запуск Gemma 4 на iPhone стал вирусным: как далеко эра нулевых токенов?

marsbitОпубликовано 2026-04-06Обновлено 2026-04-06

Введение

Новая модель Gemma 4 от Google, основанная на архитектуре Gemini 3, поддерживает нативные мультимодальные возможности и занимает третье место в рейтинге Arena AI. Её компактные версии (E2B и E4B) могут работать локально на смартфонах, таких как iPhone и Samsung Galaxy, с контекстным окном до 128K и скоростью генерации более 40 токенов в секунду. Это открывает возможности для использования в медицине и других чувствительных сферах. Хотя модель демонстрирует высокую производительность в простых задачах, таких как генерация текста и кода, она испытывает трудности с сложными задачами, например, при работе в качестве агента с инструментами и структурированным выводом. Несмотря на некоторые ограничения, появление таких моделей, как Gemma 4, может изменить индустрию ИИ, переместив выполнение повседневных задач на локальные устройства и сократив зависимость от облачных API. В будущем локальные модели могут стать достаточно мощными, чтобы конкурировать с облачными решениями, что приведёт к пересмотру бизнес-моделей в отрасли.

Редакция Machine Heart

Недавно представленная Google открытая модель Gemma 4 стала большим сюрпризом для индустрии.

Она использует технологическую архитектуру, родственную Gemini 3, поддерживает нативную многомодальность, заняла третье место в мировом рейтинге Arena AI и предлагает несколько моделей. Меньшие модели — E2B (2,3B эффективных параметров) и E4B (4,5B эффективных параметров) — можно развертывать и запускать локально на мобильных устройствах с контекстным окном до 128K, что делает их «карманной заменой Gemini».

Как и ожидалось, модель быстро стала новой игрушкой для пользователей смартфонов.

Пост пользователя X набрал сотни тысяч просмотров. В видео он показал, как запускает Gemma 4 на iPhone локально, включая обработку изображений, аудио и управление фонариком. Он отметил, что Gemma 4 невероятно быстра и ощущается как магия.

На iPhone 17 Pro измерили скорость: если телефон использует чип Apple, то с помощью MLX (фреймворка машинного обучения от Apple), оптимизированного под эти чипы, скорость вывода модели может превышать 40 токенов в секунду.

На Samsung Galaxy также достигли аналогичной скорости, даже в режиме размышления. Это заставило многих воскликнуть: «Слишком быстро, чтобы быть правдой».

Такая скорость делает запуск моделей ИИ на мобильных устройствах жизнеспособным вариантом в будущем, особенно полезным в чувствительных сценариях, таких как медицина.

Контекстное окно в 128k также делает这些小模型 более привлекательными.

Как же запустить? Всё просто, это не только для гиков, ведь Google выпустил официальное приложение — Google AI Edge Gallery. Желающие могут скачать его, затем загрузить нужную версию модели и запустить.

И, будучи официальным продуктом Google, беспокоиться о безопасности особо не стоит.

Помимо мобильных версий, некоторые пробовали запускать более крупные версии Gemma 4 на мощном железе, например, Gemma 4 Mixture-of-Experts 26B на MacBook Pro с M5 Pro.

При обычном диалоге модель всё ещё довольно быстра, генерация текста и объяснение кода идут гладко.

Но когда её начали использовать как coding agent, возникли проблемы. Для работы агента требуются большой контекст (у Gemma 4 26B — 256k), сложные промпты и стабильный вызов инструментов. Gemma 4 явно не справлялась: зависала, выдавала ошибки или некорректные структуры вывода.

Переломный момент наступил, когда модель заменили на qwen3-coder. В той же среде создание файлов, выполнение команд и многошаговые задачи пошли нормально. Проблема, по его мнению, не в фреймворке агента, а в том, оптимизирована ли модель для «вызова инструментов + структурированного вывода». Здесь Gemma 4, возможно, не дотягивает, либо разработчик ещё не нашёл правильный способ использования.

Кроме того, некоторые отмечают, что интеллектуальный уровень Gemma 4 пока несколько ограничен.

Тем не менее, появление такого «производительного малютки», как Gemma 4, нельзя недооценивать. Если в будущем множество повседневных запросов, чатов, простых рассуждений, генерации кода и понимания изображений можно будет выполнять локально, без покупки токенов, то поставщикам токенов придётся несладко?

Конечно, сейчас ситуация не столь печальна. Ведь между открытыми моделями и передовыми закрытыми флагманами ещё есть разрыв, и большинство мощных открытых моделей по-прежнему ограничены аппаратными возможностями, пока не достигли приемлемого уровня на edge-устройствах.

Но тренд будущего ясен. В краткосрочной перспективе облачные закрытые модели сохранят лидерство в сложных рассуждениях и масштабной многозадачной коллаборации. Но в долгосрочной — с прогрессом железа и оптимизацией квантования, edge-модели постепенно отвоюют у облака高频简单任务 (высокочастотные простые задачи).

Поставщикам, живущим только за счёт продажи токенов и API-подписок, придётся активнее бороться за «по-настоящему сложные» части — сверхмощные агенты, сверхдлинный надёжный контекст и специализированные возможности, требующие огромных объёмов актуальных данных.

Gemma 4 — это только начало. Следующим сюрпризом может стать edge-модель, в повседневном использовании которой пользователь вообще не почувствует разницы между «локальным» и «облачным». Когда этот день наступит, вся бизнес-модель индустрии ИИ переживет настоящую перетряску.

Статья из WeChat Official Account «Machine Heart» (ID: almosthuman2014), автор: Редакция Machine Heart

Трендовые криптовалюты

Связанные с этим вопросы

QЧто такое Gemma 4 и почему она вызвала такой ажиотаж?

AGemma 4 — это новая модель искусственного интеллекта с открытым исходным кодом от Google, основанная на той же архитектуре, что и Gemini 3. Она поддерживает нативную многомодальность, занимает третье место в рейтинге Arena AI и имеет несколько вариантов, включая компактные модели (например, E2B и E4B), которые можно запускать локально на смартфонах. Её способность работать на мобильных устройствах с высокой скоростью (до 40 токенов в секунду на iPhone) и большим контекстным окном (128K) вызвала большой интерес.

QНа каких устройствах можно запустить Gemma 4 локально и как это сделать?

AGemma 4 можно запустить на современных смартфонах, таких как iPhone (с чипом Apple) и Samsung Galaxy, а также на более мощных устройствах, например, MacBook Pro с чипом M5. Для этого нужно скачать официальное приложение Google AI Edge Gallery, выбрать и загрузить нужную версию модели, после чего можно использовать её без подключения к интернету.

QКакие преимущества даёт локальный запуск моделей ИИ, таких как Gemma 4?

AЛокальный запуск обеспечивает высокую скорость обработки (до 40 токенов/с), конфиденциальность данных (что важно в медицине и других чувствительных сферах), отсутствие зависимости от интернета и необходимости покупать токены у облачных провайдеров. Это делает ИИ более доступным и удобным для повседневных задач.

QКакие ограничения есть у Gemma 4 при использовании в качестве coding agent?

AПри использовании для сложных задач, таких как работа в качестве coding agent, Gemma 4 (особенно версия 26B) может сталкиваться с проблемами: ошибками, зависаниями, некорректным структурированием вывода. Это связано с недостаточной оптимизацией модели для инструментов вызова и структурированного вывода, в отличие от некоторых других моделей, например, qwen3-coder.

QКак появление моделей вроде Gemma 4 может повлиять на будущее индустрии ИИ?

AЛокальные модели, такие как Gemma 4, могут изменить бизнес-модели индустрии ИИ, сократив зависимость от продажи токенов и облачных API. В будущем они могут взять на себя частые и простые задачи (чат, генерация кода, анализ изображений), вынуждая облачных провайдеров концентрироваться на более сложных сценариях, таких как продвинутые агенты, сверхдлинный контекст и специализированные возможности, требующие больших данных.

Похожее

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

Южная Корея планирует включить финтех-компании в новую систему лицензирования трансграничных переводов виртуальных активов, которая должна быть введена в декабре. Согласно поправкам в Закон о валютных операциях, компаниям, осуществляющим такие переводы, необходимо будет зарегистрироваться в Министерстве экономики и финансов и отчитываться через национальную систему валютной отчётности. Это сделано для того, чтобы вывести криптовалютные переводы из-под неформального надзора и снизить риски отмывания денег. Изначально ожидалось, что доступ к системе получат в основном криптобиржи, такие как Upbit и Bithumb. Однако регуляторы, включая Банк Кореи, рассматривают возможность расширения круга участников, включив в него нетрадиционные криптоплатформы и финтех-фирмы, если они смогут эффективно осуществлять переводы. Министерство экономики и финансов и Банк Кореи совместно с отраслевыми участниками разрабатывают финальные правила реализации рамок регулирования до их запуска в декабре. Это происходит на фоне усиления надзора за цифровыми активами в стране, включая разработку правил для токенизированных ценных бумаг.

TheNewsCrypto1 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

TheNewsCrypto1 ч. назад

Мэтт Дэймон выступит на Ripple Swell, поскольку продвижение RLUSD от Water.org привлекает внимание

Мэтт Дэймон выступит на конференции Ripple Swell 2026 в Нью-Йорке в качестве основного докладчика. Он является соучредителем некоммерческой организации Water.org, которая недавно запустила кампанию Get Blue для расширения доступа к безопасной воде и санитарии. Ripple указана в материалах кампании как эксклюзивный партнер по цифровым активам и платежам. Партнерство предполагает использование Ripple Payments и стейблкоина Ripple USD (RLUSD) для более эффективного и дешевого перемещения средств микрофинансовым партнерам в развивающихся странах. Это сотрудничество представляет RLUSD в новом свете — не как инструмент для торговли или расчетов, а как часть платежной инфраструктуры для гуманитарных целей. Участие знаменитости помогает Ripple выйти на более широкую аудиторию и представить стейблкоин как практическое решение для филантропии, где важны скорость и низкая стоимость транзакций. Однако важно отметить, что ключевая работа по решению водного кризиса остается за местными партнерами Water.org.

bitcoinist1 ч. назад

Мэтт Дэймон выступит на Ripple Swell, поскольку продвижение RLUSD от Water.org привлекает внимание

bitcoinist1 ч. назад

Microsoft выявляет новое крипто-вредоносное ПО, нацеленное на адреса кошельков и приватные ключи

В феврале 2026 года Microsoft Threat Intelligence обнаружила новую вредоносную кампанию, нацеленную на пользователей криптовалют. Вредоносная программа, классифицируемая как Trojan/CryptoBandits.A, распространяется через зараженные USB-накопители с помощью файлов .lnk. Особенность этой атаки заключается в использовании технологии Windows Script Host и ActiveX для запуска упакованного Tor-прокси без необходимости в установщике или обычных управляющих серверах. После заражения система подключается к серверам в сети Tor через локальный SOCKS5-прокси. Основная функция вредоноса — слежка за буфером обмена. Он ищет и крадет сид-фразы (12 и 24 слова), приватные ключи Bitcoin и Ethereum, а также адреса кошельков. Обнаружив скопированный адрес, программа подменяет его на адрес, контролируемый злоумышленниками, что позволяет перехватывать переводы. Кроме того, программа делает скриншоты экрана и отправляет их через Tor, что дает атакующим информацию о балансах и активности пользователей. Угроза также обладает возможностью удаленного выполнения кода и обеспечивает свое постоянство в системе через планировщик заданий. В качестве мер защиты Microsoft рекомендует отключать автозапуск для USB, ограничивать использование сценариев и исполняемых ярлыков с внешних накопителей, а также отслеживать подозрительную активность, такую как выполнение JavaScript, работу прокси на localhost:9050 и мониторинг буфера обмена.

TheNewsCrypto1 ч. назад

Microsoft выявляет новое крипто-вредоносное ПО, нацеленное на адреса кошельков и приватные ключи

TheNewsCrypto1 ч. назад

Без отдела продаж и с оборотом в 20 миллионов долларов: как AI-сотрудник Viktor привлек 30 000 компаний?

Традиционное корпоративное ПО требует обширных продаж и долгого внедрения. ИИ-сотрудник Viktor, разработанный командой с опытом в DeepMind, бросает вызов этому подходу. Он позиционируется как «коллега третьего уровня» (Tier 3 AI Coworker), способный на сквозное выполнение задач, а не просто на помощь. Пользователи могут упоминать его в Slack или Microsoft Teams, давая задания на естественном языке, например, «подготовь отчёт по продажам». Viktor самостоятельно подключается к CRM, генерирует графики и отправляет результат. Без отдела продаж и длительных проектов внедрения, через модель роста, управляемую продуктом (PLG), Viktor достиг $20 млн годового дохода, обслужив 30 000 компаний на платформе Slack. Ключом стал минимальный порог входа: бесплатный кредит в $100 и оплата за фактически выполненные задачи, а не за лицензии на сотрудников. Теперь продукт доступен в Microsoft Teams, открывая доступ к 320 млн пользователей. Viktor устраняет барьер сложных промптов, выполняя работу от начала до конца, и может работать автономно, например, проводя сверку счетов ночью или создавая презентации из данных разных систем. Он запоминает коррекции и контекст, становясь «слоем процессов» компании. Однако переход в корпоративную среду Teams сталкивается с проблемами соответствия и безопасности. Полная автоматизация вызывает опасения из-за «чёрного ящика» решений и рисков ошибок с доступом к критическим системам. Баланс между эффективностью и контролем остаётся главным вызовом для внедрения ИИ-сотрудников в бизнес-процессы. Viktor демонстрирует привлекательность модели с нулевым порогом входа, но для масштабирования в крупных организациях необходимы доверие и надёжные рамки управления.

marsbit2 ч. назад

Без отдела продаж и с оборотом в 20 миллионов долларов: как AI-сотрудник Viktor привлек 30 000 компаний?

marsbit2 ч. назад

Интервью с сооснователем CoreWeave: Спрос на ИИ, кажется, «обостряется» с каждым днём

Интервью с руководителями CoreWeave показало, что спрос на ИИ-инфраструктуру продолжает стремительно расти. Согласно Brannin McBee и Nick Robbins, запросы на вычислительные мощности не только не снижаются, но и «обостряются каждый день новыми способами». Особенно заметен всплеск в сегментах агентного ИИ и инференса, что увеличивает важность не только GPU, но и CPU, а также систем хранения данных. CoreWeave, обладающая уникальным положением на рынке и обслуживающая ведущие компании вроде OpenAI, Anthropic, Meta и NVIDIA, видит структурные изменения в нагрузках. Основное узкое место смещается с доступности GPU на более комплексные инфраструктурные проблемы: наличие подготовленных дата-центров («powered shells»), логистика, квалифицированные кадры и общая способность к исполнению проектов. Компания строит свой бизнес, ориентируясь на четкие требования клиентов, и уже адаптировала архитектуру своих дата-центров под растущие потребности в CPU и памяти. Что касается конкуренции, CoreWeave выделяется репутацией, подтвержденной независимыми рейтингами, и способностью быстро разворачивать высокопроизводительные системы. В ближайшие годы ожидается массовое развертывание новых платформ, таких как Vera Rubin, при этом модель ценообразования CoreWeave защищает ее маржу от волатильности стоимости компонентов, таких как HBM.

marsbit2 ч. назад

Интервью с сооснователем CoreWeave: Спрос на ИИ, кажется, «обостряется» с каждым днём

marsbit2 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Как купить 4

Добро пожаловать на HTX.com! Мы сделали приобретение 4 (4) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки 4 (4).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение 4 (4)После приобретения вами 4 (4) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля 4 (4)С легкостью торгуйте 4 (4) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

672 просмотров всегоОпубликовано 2025.10.20Обновлено 2026.06.02

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

В 2025 году экосистема TRON быстро развивается, уделяя особое внимание взаимодействию, безопасности и практическому внедрению.

2.2k просмотров всегоОпубликовано 2025.12.30Обновлено 2025.12.30

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

活动图片