La version vidéo de Nano Banana est arrivée : intégrant les connaissances mondiales de Gemini, la génération d'images de la banane d'origine ne prend que 4 secondes

marsbitPublié le 2026-07-01Dernière mise à jour le 2026-07-01

Résumé

Google dévoile deux nouveaux modèles multimodaux Gemini : Omni Flash pour la vidéo et Nano Banana 2 Lite pour l'image, offrant rapidité et coût réduit. Gemini Omni Flash, désormais accessible via API, combine les capacités de raisonnement multimodales de Gemini avec la génération et l'édition vidéo. Il permet de créer ou modifier des vidéos de 10 secondes à partir de texte, d'images ou de vidéos de référence, en utilisant des connaissances du monde réel pour assurer la cohérence. Son coût est de 0,10$ par seconde de vidéo générée. Google note toutefois des limitations actuelles, comme la durée maximale et des contraintes sur la cohérence des personnages. Parallèlement, Nano Banana 2 Lite est un modèle de génération d'images optimisé pour la vitesse et l'efficacité économique. Il génère une image en 1K en seulement 4 secondes pour environ 0,034$, soit cinq fois plus rapide et deux fois moins cher que son prédécesseur Nano Banana 2, tout en conservant une bonne qualité de rendu, notamment pour le texte. Le véritable potentiel réside dans l'utilisation combinée des deux modèles : Nano Banana 2 Lite peut générer rapidement des images, qui sont ensuite utilisées comme base par Omni Flash pour créer des vidéos. Google illustre cette synergie avec trois démonstrations : "Anywhere" pour insérer une personne dans des paysages dynamiques, "Space Lift" pour visualiser des concepts de décoration d'intérieur, et "Omni Product Studio" pour créer automatiquement des visuels et vidéos mar...

Bien que le codage reste un peu brouillon, Google a vraiment quelques tours dans son sac quand il s'agit de « multimodal ».

Gemini Omni Flash a officiellement ouvert son API, la version vidéo de Nano Banana.

Transformer « Harry Potter » par un Muggle n'est plus un rêve. Voyons ces quatre tours de magie numérique exécutés par Gemini Omni :

C'est trop incroyable. Cette cohérence et cette clarté du texte... plus besoin d'écran vert ou d'effets spéciaux, on peut diffuser en direct Docteur Strange.

Parallèlement, la « banane » tant attendue accueille également sa version « à la vitesse de la lumière ».

Nano Banana 2 Lite : à ce jour, le modèle d'image Gemini le plus rapide et le plus économique.

Sans exagération — 4 secondes pour générer une image, une image en résolution 1K ne coûte qu'environ 20 centimes.

Comparé à Nano Banana 2, cette vitesse est tout simplement fulgurante.

Sans parler de GPT Image 2, qui met 3 minutes pour générer une seule image...

Pas étonnant que Gemini 3.5 Pro n'ait pas vu le jour pendant si longtemps. Tout le temps a été consacré au multimodal tant chéri, n'est-ce pas, Hassabis !!

Gemini Omni Flash

Présenté pour la première fois lors de la Google I/O 2026, Gemini Omni Flash combine profondément les capacités de raisonnement multimodal de Gemini avec la génération et l'édition vidéo, suscitant déjà beaucoup d'attention à l'époque.

Aujourd'hui, ce modèle est officiellement ouvert aux développeurs via l'API Gemini et Google AI Studio. Il peut générer et éditer facilement des vidéos de haute qualité en s'appuyant sur diverses entrées telles que le texte, les images et les vidéos.

Quatre capacités clés :

Édition vidéo conversationnelle : modifier et affiner des vidéos en langage naturel, comme on modifierait un document Feishu.

Référence multimodale : combiner des images, du texte, des vidéos en entrée, pour maintenir le contrôle et la cohérence de la scène.

Connaissance du monde réel : utiliser les connaissances de Gemini en histoire, biologie, logique narrative, etc., pour construire des vidéos, sans avoir à décrire sur trois pages le style architectural.

Synchronisation texte et mouvement : via de simples prompts, lier directement le texte et les graphismes aux actions de la vidéo.

Le prix est aussi très compétitif : coût de sortie vidéo par seconde 0,10 dollar, au même niveau que Veo 3.1 Fast.

En termes de positionnement, bien que tous deux soient des modèles légers de génération vidéo, Omni Flash met davantage l'accent sur les connaissances mondiales de Gemini, et son écosystème se rapproche aussi entièrement de la couche Gemini.

Mais Google est aussi assez transparent, listant activement une série de limitations actuelles :

1. Pour le moment, ne supporte que la génération de vidéos de 10 secondes ; des durées plus longues suivront ;

2. Ne supporte pas encore l'upload de référence audio et l'extension de scène ;

3. L'API supporte des vidéos de référence jusqu'à 3 secondes, mais le modèle ne peut pas encore traiter correctement ce type d'entrée ;

4. La cohérence des personnages lors des changements de scène et des mouvements de caméra reste limitée.

Nano Banana 2 Lite

Nano Banana 2 Lite (alias gemini-3.1-flash-lite-image) est conçu pour un traitement ultra-rapide.

Optimisé de manière ciblée, il vise les scénarios d'application en temps réel extrêmement sensibles à la latence et nécessitant un traitement par lots massif d'images en très peu de temps — par exemple, la génération par lots de matériel e-commerce, l'itération rapide de créations publicitaires, les chaînes de production de contenu automatisées.

Deux atouts principaux —

Vitesse lumière : latence de génération d'environ 4 secondes, soit un cinquième de celle de Nano Banana 2 (environ 20 secondes).

Prix imbattable : une image 1K ne coûte qu'environ 0,034 dollar, soit la moitié du prix de Nano Banana 2 et le quart de celui de Nano Banana Pro.

La vitesse et le prix ont été réduits, mais les capacités de génération et d'édition d'images n'ont pas vraiment été affectées. Nano Banana 2 Lite conserve toujours d'excellents effets de rendu de texte, se situant au même niveau que Grok et d'autres modèles sur les benchmarks.

C'est pourquoi la recommandation de Google est la suivante : si vous utilisez encore la première génération de Nano Banana pour économiser, changez vite. La version Lite surpasse l'ancienne sur tous les indicateurs clés.

L'union fait la force

Attendez, ne partez pas encore.

On pensait qu'il s'agissait simplement de deux modèles lancés en parallèle, mais Google indique : il y a plus.

La véritable magie réside dans l'utilisation en cascade de ces modèles.

Comme on le sait, la création AIGC nécessite des itérations répétées, et la gestion des matériaux est assez pénible.

Désormais, grâce à ces deux modèles, plus besoin de ré-uploader sans cesse des fichiers, la génération d'images et la création vidéo sont parfaitement connectées.

Concrètement, on peut d'abord utiliser Nano Banana 2 Lite pour générer rapidement des images, puis donner les images générées comme matériel de référence à Gemini Omni Flash pour les transformer en vidéo d'un clic.

Pour démontrer la puissance de ce workflow magique 1+1>2, Google a même spécialement créé 3 applications de démonstration :

1. Anywhere (N'importe où)

Prenez un selfie ou uploadez une photo, NB2 Lite vous place instantanément dans des dizaines de sites emblématiques.

Puis cliquez sur l'image, Omni Flash transforme le site statique en un court métage dynamique.

Le tourisme cybernétique, le voilà de bout en bout.

2. Space Lift (Ascenseur spatial)

Celui-ci est un peu effrayant. On sent qu'en le combinant avec le modèle mondial Genie, cela pourrait à l'venir menacer pas mal d'entreprises SaaS traditionnelles de solutions de décoration.

Uploadez une photo de votre pièce, NB2 Lite propose d'abord divers styles de décoration. Trouvez celui que vous aimez, cliquez sur le bouton vidéo, Omni peut directement vous offrir une visite cinématographique de l'espace.

3. Omni product studio (Studio produit Omni)

Une aubaine pour le commerce transfrontalier.

Prenez une photo de votre produit sur fond blanc, NB2 Lite génère diverses images scénarisées du produit, Omni Flash transforme ensuite l'image statique en une courte vidéo pour l'e-commerce.

Du « produit » au « matériel publicitaire », la chaîne entière s'exécute automatiquement.

Alors, à quoi sert vraiment le multimodal ?

Cette question, Google l'a sûrement entendue des milliers de fois.

Surtout en 2026, où le Codage équivaut presque à un synonyme d'intelligence des modèles. Tout le monde se bat à mort sur le codage.

S'acharner sur le multimodal, pourquoi faire ?

On ne développera pas le discours sur la narration AGI. À court terme, il est vrai que cette gamme de modèles multimodaux de Google peut dynamiser pas mal de ses produits.

On ne va pas s'étendre sur la narration AGI. À court terme, il est vrai que cette gamme de modèles multimodaux de Google peut dynamiser pas mal de ses produits — Stitch en est un, la retouche photo intégrée aux Pixel en est un, l'émergence de Notebook LM est aussi assez impressionnante.

Les deux nouveaux modèles lancés cette fois-ci permettent de voir plus de potentiel d'application du multimodal dans des scénarios verticaux. E-commerce, décoration, courtes vidéos... la demande pour ces activités est réelle, et l'argent aussi.

Avec en plus le soutien de l'écosystème Android, on n'a pas vraiment à s'inquiéter de la commercialisation.

Google ne rattrape peut-être pas le retard en codage pour le moment, mais à la table du multimodal, Google est peut-être le seul joueur capable d'avoir une main complète.

Mais quand même...

Gemini 3.5 Pro, c'est pour quand au juste !!!

Liens de référence :[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Cet article provient du compte public WeChat « Quantum Bit », auteur : Concerné par les technologies de pointe

Cryptos en tendance

Questions liées

QQuel est le nom du modèle vidéo récemment publié par Google qui intègre les connaissances du monde de Gemini ?

ALe modèle vidéo récemment publié est appelé Gemini Omni Flash. Il combine les capacités de raisonnement multimodal de Gemini avec la génération et l'édition vidéo.

QQuel est le principal avantage du modèle Nano Banana 2 Lite (gemini-3.1-flash-lite-image) par rapport à ses prédécesseurs ?

ALe principal avantage de Nano Banana 2 Lite est sa vitesse. Il peut générer une image en environ 4 secondes, ce qui est cinq fois plus rapide que le Nano Banana 2 (environ 20 secondes).

QQuelle est l'une des limites actuelles du modèle Gemini Omni Flash mentionnée dans l'article ?

AL'une des limites actuelles de Gemini Omni Flash est qu'il ne prend en charge que la génération de vidéos d'une durée maximale de 10 secondes. Des durées plus longues seront supportées ultérieurement.

QQuel est l'usage pratique démontré par l'application de démonstration 'Space Lift' ?

AL'application de démonstration 'Space Lift' montre comment, à partir d'une simple photo d'une pièce, on peut générer des propositions de styles de décoration avec Nano Banana 2 Lite, puis les transformer en une visite cinématographique immersive de l'espace avec Gemini Omni Flash.

QSelon l'article, quel est l'avantage stratégique de Google dans le domaine de l'IA multimodale ?

ASelon l'article, l'avantage stratégique de Google dans le domaine de l'IA multimodale est sa capacité unique à jouer sur tous les tableaux, grâce à son écosystème (comme Android) et à sa gamme complète de modèles et de produits, ce qui facilite la commercialisation et l'adoption dans des scénarios verticaux comme le e-commerce ou la décoration.

Lectures associées

Qui est l'homme le plus doué pour gagner de l'argent dans la cryptosphère ? Trump engrange plus de 1,4 milliard de dollars en 2025

Le Bureau de l'éthique du gouvernement américain a publié le rapport financier 2025 de l'ancien président Donald Trump, révélant des revenus liés à la cryptomonnaie d'environ 1,427 milliard de dollars. Ces actifs, détenus via plusieurs entités, proviennent principalement de redevances sur des memecoins portant son nom (635 millions de dollars via CIC Digital LLC) et de bénéfices tirés de la vente de jetons de World Liberty Financial (près de 594 millions de dollars via DT Marks Defi LLC). Contrairement à la plupart des investisseurs subissant la baisse du marché, la fortune cryptographique de Trump, alimentée par son rôle d'émetteur, semble immunisée contre les risques de baisse. Le rapport soulève des questions éthiques cruciales, alors que le projet de loi CLARITY Act, visant à réguler le secteur, est en débat au Sénat. Des élus démocrates réclament l'interdiction pour les hauts fonctionnaires de détenir des actifs cryptos, arguant d'un conflit d'intérêts flagrant lorsque le principal bénéficiaire réglemente l'industrie. En comparaison, la divulgation du vice-président JD Vance, détenant pour 250 000 à 500 000 dollars de Bitcoin, paraît modeste. L'issue des négociations législatives déterminera si cette fusion des rôles de régulateur et de bénéficiaire restera une exception ou deviendra une norme.

Foresight NewsIl y a 4 mins

Qui est l'homme le plus doué pour gagner de l'argent dans la cryptosphère ? Trump engrange plus de 1,4 milliard de dollars en 2025

Foresight NewsIl y a 4 mins

Trump 25 ans de rapports financiers : la famille rapporte plus de 1 milliard de dollars par an grâce au crypto, tandis que les investisseurs individuels perdent de l'argent sur $TRUMP

Le rapport financier 2025 de Donald Trump révèle que ses entreprises liées aux crypto-monnaies ont généré près de 12 milliards de dollars de revenus, dépassant la plupart de ses actifs immobiliers historiques. Ces revenus proviennent principalement de deux sources : World Liberty Financial (plus de 5 milliards de dollars grâce à la vente de jetons de gouvernance) et CIC Digital LLC (environ 635 millions de dollars de redevances sur le memecoin $TRUMP). Cependant, la valeur de ces crypto-actifs s'est effondrée depuis leur lancement : $TRUMP est passé de 74 dollars à 1,68 dollar, et le jeton de World Liberty Financial a chuté de 80%. La majorité des investisseurs particuliers subissent des pertes, tandis que les entités liées à Trump détiennent encore environ 80% de l'offre de $TRUMP. Parallèlement, les activités immobilières de Trump à l'étranger ont également connu une expansion significative, avec des revenus provenant de projets dans des pays comme les Émirats arabes unis, l'Arabie saoudite et le Vietnam. La Maison Blanche affirme qu'il n'y a aucun conflit d'intérêts, soulignant que les affaires sont gérées par une fiducie familiale et que le président agit dans l'intérêt public. Cette croissance coïncide avec l'assouplissement par l'administration Trump de la réglementation fédérale sur les crypto-monnaies.

marsbitIl y a 6 mins

Trump 25 ans de rapports financiers : la famille rapporte plus de 1 milliard de dollars par an grâce au crypto, tandis que les investisseurs individuels perdent de l'argent sur $TRUMP

marsbitIl y a 6 mins

De la « Clustering d'adresses » aux « Normes de preuve » : Pourquoi Chainalysis veut-il redéfinir le traçage sur la blockchain ?

Auteur : 137Labs Fin juin 2026, Chainalysis a présenté un cadre de données intitulé "Blockchain Tracing Ontology", visant à établir un système de description unifié pour l'analyse blockchain. Cette initiative, plus proche d'une proposition de norme sectorielle que d'un simple produit, cherche à redéfinir les concepts fondamentaux de l'analyse on-chain et à créer un modèle de données explicable, vérifiable et reproductible pour le traçage. Un problème persistant dans l'industrie est la divergence des résultats entre différentes entreprises, malgré des données blockchain publiques. Les techniques de "regroupement d'adresses" (address clustering) varient, conduisant à des attributions contradictoires pour une même adresse selon les plateformes. Cette incohérence pose problème pour les enquêtes judiciaires, le gel d'actifs ou la lutte contre le blanchiment, où la simple conclusion "ceci est un portefeuille d'échange" n'est pas suffisante. La question cruciale devient : **pourquoi peut-on tirer cette conclusion ?** La proposition de Chainalysis n'est pas un nouvel algorithme, mais plutôt un "langage" commun - une ontologie - pour structurer et exprimer les résultats d'analyse de manière standardisée. Elle introduit des concepts plus granulaires comme le "Wallet Segment" (segment de portefeuille) pour mieux refléter la gestion complexe des portefeuilles institutionnels modernes, dépassant la notion limitée de "Cluster". Le changement clé réside dans le passage d'une focalisation sur le "résultat crédible" à un "processus crédible". Le cadre insiste sur la nécessité de documenter pour chaque conclusion : les preuves on-chain utilisées, les règles d'analyse appliquées, les informations hors-chaîne référencées, et un niveau de confiance attribué. Cette approche, inspirée en partie par le cas judiciaire Bitcoin Fog où les méthodes de Chainalysis ont été examinées, répond aux exigences de recevabilité des preuves en justice. Chainalysis souligne que l'analyse blockchain ne peut à elle seule identifier des personnes physiques ; elle révèle des relations entre adresses et des flux de fonds, mais l'identité réelle nécessite des preuves hors-chaîne (KYC, journaux serveurs). À long terme, cette ontologie cherche à faire évoluer l'industrie de l'analyse d'une approche "dirigée par l'expérience" vers une approche "dirigée par les normes". La valeur future ne résidera pas seulement dans la précision algorithmique, mais dans l'explicabilité, la qualité des données et la crédibilité des preuves, facilitant la collaboration entre analyseurs, régulateurs et autorités judiciaires. L'adoption éventuelle d'un tel standard pourrait réduire les coûts de communication et renforcer la fiabilité des investigations sur les actifs numériques.

marsbitIl y a 32 mins

De la « Clustering d'adresses » aux « Normes de preuve » : Pourquoi Chainalysis veut-il redéfinir le traçage sur la blockchain ?

marsbitIl y a 32 mins

Le « Tour des Conférences » du deuxième semestre est ouvert ! Itinéraire complet des Sommets Web3 Mondiaux 2026

L’agenda des conférences Web3 pour le second semestre 2026 est désormais ouvert, avec des événements majeurs répartis en Asie, en Europe, en Amérique du Nord et au Moyen-Orient. Le troisième trimestre démarre fort en juillet avec des événements phares au Japon (IVS à Kyoto et WebX à Tokyo) et la Canada Crypto Week à Toronto. Le mois d’août propose des rassemblements à Ho Chi Minh Ville (Conviction), à Bali (Coinfest Asia) et à Hong Kong (Bitcoin Hong Kong). Septembre est le mois le plus chargé, avec des sommets majeurs comme NFT NYC à New York, ETHRome en Italie, Money20/20 en Arabie Saoudite, la convention européenne à Barcelone et la Korea Blockchain Week à Séoul. Le quatrième trimestre est marqué par le TOKEN2049 de Singapour en octobre, qui sera la seule édition de l’année après l’annulation de l’événement de Dubaï. Novembre accueillera des événements techniques comme Devcon 8 à Bombay, Bitcoin Amsterdam et Solana Breakpoint à Londres. L’année se clôturera en décembre à Dubaï et Abu Dhabi avec Blockchain Life et Bitcoin MENA. L’article fournit une liste complète et mise à jour de tous ces sommets, incluant également ceux déjà tenus au premier semestre, pour aider les participants à planifier leur calendrier de conférences à l’échelle mondiale.

Foresight NewsIl y a 42 mins

Le « Tour des Conférences » du deuxième semestre est ouvert ! Itinéraire complet des Sommets Web3 Mondiaux 2026

Foresight NewsIl y a 42 mins

Trading

Spot

Articles tendance

Comment acheter 4

Bienvenue sur HTX.com ! Nous vous permettons d'acheter 4 (4) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément 4 (4).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos 4 (4)Après avoir acheté vos 4 (4), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des 4 (4)Tradez facilement 4 (4) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

459 vues totalesPublié le 2025.10.20Mis à jour le 2026.06.02

Comment acheter 4

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de 4 (4) sont présentées ci-dessous.

活动图片