L'exécution locale de Gemma 4 sur iPhone fait sensation : à quelle distance se trouve l'ère du zéro token ?

marsbitPublié le 2026-04-06Dernière mise à jour le 2026-04-06

Résumé

Le nouveau modèle Gemma 4 de Google, récemment open-source, permet une exécution locale sur smartphone avec des performances remarquables. Les versions allégées (E2B et E4B) offrent une fenêtre contextuelle de 128K et atteignent une vitesse de traitement dépassant 40 tokens par seconde sur iPhone 17 Pro et appareils Android compatibles, grâce à des optimisations logicielles comme MLX d'Apple. Bien que simple à utiliser via l'application officielle Google AI Edge Gallery, Gemma 4 montre des limites dans des tâches complexes comme l'appel d'outils structurés ou le codage agent, où des modèles comme Qwen3-coder restent supérieurs. Malgré une intelligence parfois jugée "limite", sa capacité à traiter localement requêtes, discussions et génération de code ouvre la voie à une réduction de la dépendance aux APIs cloud. Cette avancée annonce un changement de paradigme : les modèles locaux pourraient à terme remplacer les solutions cloud pour les tâches courantes, poussant les fournisseurs de tokens à se concentrer sur des capacités plus avancées comme les agents complexes ou le traitement de données massives. Gemma 4 n'est qu'un début ; la frontière entre local et cloud s'estompera bientôt.

Rédaction de Machine Heart

Le nouveau modèle open source de Google, Gemma 4, a offert une belle surprise au secteur il y a quelques jours.

Il adopte une architecture technologique homologue à celle de Gemini 3, prend en charge le multimodal natif, a obtenu la troisième place mondiale au classement Arena AI, et propose plusieurs modèles. Les plus petits modèles — E2B (2,3 milliards de paramètres effectifs) et E4B (4,5 milliards de paramètres effectifs) — peuvent être déployés et exécutés localement sur un téléphone portable, avec une fenêtre contextuelle atteignant 128K. On peut dire que c'est un « substitutif à Gemini qui tient dans la poche ».

Sans surprise, le modèle est rapidement devenu un nouveau jouet pour les utilisateurs de mobiles.

Un post d'un utilisateur de X a notamment été vu des centaines de milliers de fois. Il y a partagé une vidéo montrant comment il exécutait Gemma 4 localement sur son iPhone, y compris le traitement d'images, d'audio et le contrôle de l'interrupteur de la lampe torche. Il a déclaré que Gemma 4 était incroyablement rapide, comme par magie.

Quelqu'un a quantifié cette vitesse sur un iPhone 17 Pro, indiquant que si le téléphone utilise une puce Apple, alors avec l'aide de MLX (le framework d'apprentissage automatique d'Apple) optimisé pour cette puce, la vitesse d'inférence du modèle peut dépasser 40 tokens par seconde.

D'autres ont également obtenu des vitesses similaires sur un Samsung Galaxy, et ce même avec le mode de réflexion activé. Ce qui pousse à s'exclamer que c'est « trop rapide pour être vrai ».

Une telle vitesse fait de l'exécution de modèles d'IA sur appareil mobile une option viable pour l'avenir, et elle est très utile dans des scénarios sensibles comme la santé.

La fenêtre contextuelle de 128k rend également ces petits modèles plus attractifs.

Alors, comment l'exécuter ? C'est en fait très simple, ce n'est pas réservé aux geeks, car Google a publié une application officielle — Google AI Edge Gallery. Les personnes souhaitant l'expérimenter sur leur téléphone peuvent simplement télécharger cette application, puis télécharger la version du modèle qu'ils souhaitent exécuter, l'ouvrir et c'est parti.

De plus, comme c'est une publication officielle de Google, les problèmes de sécurité ne sont pas vraiment à craindre.

Outre ces petits modèles exécutés sur mobile, certains ont testé des versions plus grandes de Gemma 4 sur du matériel plus puissant, comme l'exécution de Gemma 4 Mixture-of-Experts 26B sur un MacBook Pro version M5 Pro.

Pour une conversation directe, ce modèle est encore rapide, la génération de texte et l'explication de code sont fluides.

Mais lorsqu'il a vraiment utilisé Gemma 4 comme agent de codage, les problèmes sont apparus. Car exécuter un agent nécessite un grand contexte (Gemma 4 26B a une fenêtre contextuelle de 256k), des prompts complexes et des appels d'outils stables. Gemma 4 a clairement du mal à tenir le coup sur ces aspects, plantant souvent, générant des erreurs, ou produisant une structure de sortie incorrecte.

Le point de basculement est survenu lorsqu'il a remplacé le modèle par qwen3-coder. Dans le même environnement, la création de fichiers, l'exécution de commandes et les tâches à plusieurs étapes fonctionnaient normalement. Il estime que le problème ne vient pas du framework d'agent, mais du modèle lui-même et de son éventuelle optimisation pour les « appels d'outils + sortie structurée ». Sur ce point, Gemma 4 n'est peut-être pas encore assez abouti, ou peut-être que ce développeur n'a tout simplement pas encore trouvé la bonne méthode.

De plus, certains disent que le niveau intellectuel de Gemma 4 est encore un peu limité.

Malgré cela, l'émergence de Gemma 4, cette « petite bombe de performances », ne doit pas être sous-estimée. Si à l'avenir, une grande partie des requêtes quotidiennes, des discussions, des raisonnements simples, de la génération de code et des tâches de compréhension d'images peuvent être exécutées localement, sans avoir à acheter de tokens, les vendeurs de tokens ne se retrouveraient-ils pas dans une position délicate ?

Bien sûr, la situation actuelle n'est pas encore si pessimiste, car il existe encore un écart entre les modèles open source disponibles et les modèles propriétaires de pointe, et la plupart des modèles open source performants sont encore limités par les capacités matérielles, ne pouvant temporairement pas atteindre un niveau utilisable sur les appareils.

Mais la tendance future est claire. À court terme, les modèles propriétaires cloud conservent leur avance sur le raisonnement complexe de pointe et la collaboration multi-agents à très grande échelle ; mais à long terme, avec la progression du matériel et l'optimisation continue des techniques de quantification, les modèles on-device grignoteront progressivement les tâches simples et fréquentes du cloud.

Les acteurs qui ne vivent que de la vente de tokens et d'abonnements API devront se concentrer plus intensément sur les parties « vraiment difficiles » — les agents ultra-puissants, les contextes longs et fiables, et les capacités spécialisées nécessitant des données massives en temps réel.

Gemma 4 n'est qu'un début. La prochaine surprise pourrait bien être qu'un modèle on-device rende l'utilisateur totalement incapable de sentir la différence entre « local » et « cloud » lors d'une utilisation quotidienne. Le jour où cela arrivera, l'ensemble du modèle économique de l'industrie de l'IA connaîtra un véritable bouleversement.

Cet article provient du compte WeChat officiel « Machine Heart » (ID: almosthuman2014), auteur : Machine Heart

Cryptos en tendance

Haedal ProtocolHAEDAL

Questions liées

QQu'est-ce que Gemma 4 et pourquoi est-il considéré comme une surprise dans l'industrie ?

AGemma 4 est un nouveau modèle open-source de Google, basé sur la même architecture technique que Gemini 3. Il prend en charge le multimodal natif, se classe troisième au classement Arena AI et propose plusieurs modèles, dont des versions plus petites conçues pour fonctionner localement sur les téléphones. Il est considéré comme une surprise en raison de ses performances élevées et de son accessibilité sur les appareils mobiles.

QQuelle est la vitesse de traitement de Gemma 4 sur un iPhone 17 Pro avec la puce Apple ?

ASur un iPhone 17 Pro équipé d'une puce Apple et optimisé avec MLX (le framework d'apprentissage automatique d'Apple), la vitesse d'inférence de Gemma 4 peut dépasser 40 tokens par seconde.

QComment peut-on exécuter Gemma 4 localement sur un téléphone mobile ?

APour exécuter Gemma 4 localement sur un téléphone, les utilisateurs peuvent télécharger l'application officielle Google AI Edge Gallery, puis télécharger la version du modèle qu'ils souhaitent exécuter. Une fois installé, le modèle peut être exécuté directement depuis l'application.

QQuelles sont les limitations de Gemma 4 lorsqu'il est utilisé comme agent de codage ?

ALorsqu'il est utilisé comme agent de codage, Gemma 4 rencontre des problèmes avec les grands contextes (fenêtre contextuelle de 256k pour la version 26B), les invites complexes et les appels d'outils stables. Il a tendance à planter, à générer des erreurs ou à produire des structures de sortie incorrectes, contrairement à d'autres modèles comme qwen3-coder qui fonctionnent mieux dans ces scénarios.

QQuel impact Gemma 4 pourrait-il avoir sur l'avenir des modèles d'IA et les entreprises qui vendent des tokens ?

AGemma 4 pourrait permettre à de nombreuses tâches quotidiennes (requêtes, discussions, raisonnements simples, génération de code, compréhension d'images) d'être exécutées localement sans avoir à acheter des tokens. Cela pourrait menacer les entreprises qui dépendent de la vente de tokens ou d'abonnements API, les obligeant à se concentrer sur des capacités plus avancées comme les agents ultra-performants, les contextes longs et fiables, et les compétences spécialisées nécessitant des données massives en temps réel.

Lectures associées

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les actions préférées STRC de Strategy, dont le prix de clôture était de 89,46 $ fin juillet (bien en dessous de leur valeur nominale de 100 $), maintiendront leur dividende à 12 % pour le mois d'août. Le président exécutif Michael Saylor a confirmé cette information, notant que le dividende est désormais versé deux fois par mois. Malgré une perte nette importante au deuxième trimestre (8,22 milliards de $), principalement due à une perte non réalisée sur ses réserves de Bitcoin, Strategy a constitué une réserve de trésorerie de 3,75 milliards de $ pour garantir le paiement des dividendes préférés. La direction réitère son objectif de faire remonter le cours de STRC vers 99-100 $ à terme et continue de racheter ces titres tant qu'ils se négocient en dessous du pair. Parallèlement, Saylor a évoqué une annonce potentielle concernant les avoirs en Bitcoin de l'entreprise, laissant entendre une possible évolution de sa stratégie de trésorerie.

cointelegraphIl y a 55 mins

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

cointelegraphIl y a 55 mins

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

Le portefeuille matériel Coldcard a été compromis, entraînant une nouvelle vague de retraits depuis les appareils vulnérables. Selon Galaxy Research, environ 1 367,05 BTC (88,6 millions de dollars) ont été dérobés à partir de 4 585 adresses. Le problème ne réside pas dans le firmware, qui a été corrigé, mais dans les phrases seed générées entre mars 2021 et les mises à jour correctives. Ces phrases, créées en raison d'une erreur de programmation ayant conduit à l'utilisation d'un générateur de nombres aléatoires logiciel (Yasmarang) au lieu du générateur matériel STM32, sont prévisibles et vulnérables à une attaque par force brute hors ligne. Les propriétaires concernés doivent impérativement générer une nouvelle phrase seed sur un firmware corrigé et transférer leurs actifs, sous peine de rester exposés. L'histoire d'un investisseur de 39 ans illustre l'impact dévastateur : après avoir accumulé 2 BTC (130 000 dollars) sur huit ans via un travail physique, en les conservant comme protection contre l'hyperinflation dans son pays, il a tout perdu en quelques minutes. Son cas montre que même les stratégies de conservation à long terme les plus prudentes ("cold storage") ne sont pas infaillibles. D'un point de vue historique, cet incident rappelle les faiblesses passées des générateurs de nombres aléatoires dans la cryptographie. Il remet en question l'idée reçue selon laquelle le stockage hors ligne garantit automatiquement une sécurité absolue. La communauté espère que le fabricant pourra aider à récupérer les fonds volés.

cryptonews.ruIl y a 58 mins

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

cryptonews.ruIl y a 58 mins

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

Les principales plateformes d'échange de cryptomonnaies sud-coréennes, Upbit et Bithumb, rapportent une forte augmentation du volume des transactions pour plusieurs altcoins. Sur les dernières 24 heures, le volume total des altcoins les plus populaires a atteint environ 347,7 millions de dollars. MetaDAO (META) arrive en tête, avec un volume de 65,84 millions de dollars uniquement sur Upbit, représentant 12,39% du volume spot total de la bourse. Euler ($EUL) suit avec 47,65 millions de dollars, et le $XRP, toujours populaire auprès des investisseurs sud-coréens, a atteint 38,11 millions de dollars. La liste complète des 15 altcoins montre une activité intense, notamment pour ThunderCore (TT, 35,64M$), Babylon (BABY, 25,15M$) et Geodnet (GEOD, 20,28M$). Cet engouement marqué pour des actifs numériques au-delà du Bitcoin illustre la dynamique spéculative sur le marché sud-coréen. *Ceci n'est pas un conseil en investissement.

cryptonews.ruIl y a 2 h

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

cryptonews.ruIl y a 2 h

Pourquoi le Bitcoin maintient 64 000 $ après la pause restrictive de la Fed

Le Bitcoin se stabilise autour de 64 000 $ après la décision de la Fed de maintenir ses taux d'intérêt dans la fourchette 3,50-3,75 %. Bien que perçu comme une pause, le vote a révélé des divisions internes, trois membres plaidant pour une hausse, signalant une attitude globalement restrictive. Cette position limite l'appétit pour les actifs risqués comme les cryptomonnaies. Le marché a réagi avec une volatilité modérée. Les FNB spot sur Bitcoin ont enregistré un afflux net de 32,1 millions de dollars, mettant fin à une série de sorties, tandis que les FNB Ethereum ont subi des sorties. Cela indique une rotation des capitaux vers l'actif principal. Les niveaux clés à surveiller pour le Bitcoin sont le support à 63 000-63 500 $ et la résistance autour de 66 000 $. Malgré la pression macroéconomique, le marché ne montre pas de signes de capitulation. Les fondamentaux du réseau Ethereum restent solides avec une file d'attente importante pour le staking. Le report du vote sur le CLARITY Act au Sénat américain a tempéré les attentes réglementaires immédiates. Pour la fin du mois, les données macro américaines (inflation, dépenses) guideront les senteurs. Le scénario de base prévoit une consolidation du Bitcoin entre 63 000 et 66 000 $. La résilience au-dessus de 63 000 $, le maintien de l'Ethereum au-dessus de 1 860 $ et la poursuite des entrées institutionnelles seront des facteurs déterminants pour une éventuelle reprise au second semestre.

cryptonews.ruIl y a 4 h

Pourquoi le Bitcoin maintient 64 000 $ après la pause restrictive de la Fed

cryptonews.ruIl y a 4 h

Parker Lewis explique pourquoi le bitcoin reste la meilleure monnaie

Parker Lewis, un analyste bitcoin renommé, a critiqué les stratégies marketing des entreprises qui se présentent comme des trésoreries crypto. Il estime que la vente d'actions privilégiées perpétuelles, présentées comme un "crédit numérique", déforme fondamentalement la nature du bitcoin. Il souligne que le bitcoin n'a pas de rendement fiduciaire intégré et que les promesses de dividendes reposent sur un modèle risqué nécessitant un afflux constant de nouveaux investisseurs. Lewis met en garde contre les risques de ces dérivés, notant que le marché des actions privilégiées perpétuelles (1 000 milliards de dollars) est minuscule comparé au marché du crédit mondial (300 000 milliards de dollars), car les institutions évitent ces risques qu'elles transfèrent aux particuliers. Il rejette également l'idée que la volatilité du bitcoin le rende impropre à la plupart des gens. Pour lui, cette volatilité est une conséquence naturelle de l'adoption massive d'un actif à offre fixe et inélastique. Il conseille d'acheter des bitcoins directement plutôt que des actions d'entreprises comme MicroStrategy. Détourner l'attention vers ces dérivés corporatifs fait oublier la vraie menace : la dépréciation rapide des monnaies fiduciaires. Lewis illustre cela avec son "indice du ribeye", montrant une inflation annuelle de 12 à 13% sur le prix d'un steak, bien supérieure aux chiffres officiels. La stratégie la plus sûre, selon lui, reste la possession directe de bitcoin et le contrôle de ses clés privées, pour se protéger des turbulences macroéconomiques, plutôt que de courir après des rendements corporatifs douteux qui amplifient les risques systémiques.

cryptonews.ruIl y a 4 h

Parker Lewis explique pourquoi le bitcoin reste la meilleure monnaie

cryptonews.ruIl y a 4 h

Trading

Spot

Articles tendance

Comment acheter 4

Bienvenue sur HTX.com ! Nous vous permettons d'acheter 4 (4) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément 4 (4).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos 4 (4)Après avoir acheté vos 4 (4), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des 4 (4)Tradez facilement 4 (4) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

729 vues totalesPublié le 2025.10.20Mis à jour le 2026.06.02

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de 4 (4) sont présentées ci-dessous.

L'exécution locale de Gemma 4 sur iPhone fait sensation : à quelle distance se trouve l'ère du zéro token ?

Résumé

Cryptos en tendance

Questions liées

Lectures associées

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

Pourquoi le Bitcoin maintient 64 000 $ après la pause restrictive de la Fed

Parker Lewis explique pourquoi le bitcoin reste la meilleure monnaie

Trading

Articles tendance

Comment acheter 4

Discussions

Catégories populaires

Tags tendances