From a Lunch Table to an Infinite Universe: Fei-Fei Li Bets on AI's Next Dimension

marsbitPublié le 2026-05-27Dernière mise à jour le 2026-05-27

Résumé

From a Lunch Table Conversation to an Infinite Universe: Fei-Fei Li Bets on AI's Next Frontier - Spatial Intelligence In an era dominated by large language models, AI pioneer Fei-Fei Li argues that true understanding requires spatial intelligence — the ability to perceive, reason, and interact within the physical 3D/4D world. She points to evolutionary history: spatial perception drove the Cambrian explosion 540 million years ago, while language is a far more recent, inherently "lossy" way to encode reality. Current models struggle with basic spatial tasks a child can do, like counting chairs in a video. Her company, World Labs, is pioneering this shift with "Marble," a model that generates navigable, consistent 3D worlds from text, images, or simple 3D inputs—distinct from video generators like Sora. Though smaller than models like GPT-5, due to scarce 3D data and early-stage scaling laws, Marble is already used in gaming, robot training (by NVIDIA), architectural design, and personalized therapy for conditions like OCD and acrophobia. Li envisions this technology enabling "infinite universes" for creativity, social interaction, and more. However, she cautions against utopian or dystopian extremes, advocating for a measured vision where AI enhances human dignity and prosperity, akin to how electricity transformed civilization. The journey is long — as evidenced by the 20-year path to viable autonomous vehicles — but the direction is clear: for AI to move from merely talki...

5 million years – that's the evolutionary age of human language. 540 million years – that's the starting point of the Cambrian explosion sparked by vision and spatial perception.

In 2025 and 2026, when nearly every top Silicon Valley lab was fiercely competing on language models, Professor Fei-Fei Li of Stanford University and founder of World Labs repeatedly raised a question that forced the industry to look up: If AI can only talk and look at pictures, it will never truly "understand" this world.

In three key interviews – the a16z Podcast in June 2025, the Cisco AI Summit in February 2026, and the in-depth 1-hour 19-minute Lenny's Podcast conversation released on May 22, 2026 – she systematically elaborated on a judgment that is being rapidly validated: Spatial Intelligence is the next frontier of AI.

Her statements in the a16z dialogue about "creating infinite universes" and "living in a multiverse," along with her views in Lenny's Podcast that "world models are the next frontier" and "AGI is more of a marketing term," have recently been widely reposted again on X.

"We Are Missing a World Model"

According to a16z partner Martin Casado, during a lunch meeting in Silicon Valley, a table full of AI practitioners was excitedly discussing large language models. Sitting at the other end of the table, Fei-Fei Li suddenly turned and asked him:

"Do you know what we are missing? We are missing a world model."

Casado, an early investor in World Labs and a long-time friend of Li's from her Stanford days, recalled that moment: "Everything clicked." He had independently reached a similar conclusion coming out of extensive investment in the image field: language is not the end of the story.

But Li's thinking on this issue goes back much further than most.

In April 2024, she gave a 15-minute TED Talk, using evolution as her starting point: The appearance of trilobites 540 million years ago allowed life to "see" the world for the first time. The birth of vision ignited an evolutionary race of intelligence, the nervous system began to develop, animals became active, and intelligence emerged. Language is merely a very recent product of this long race.

This judgment was repeatedly reinforced in the three interviews. At the Cisco AI Summit, her statement was more direct:

"Language's history is only about 500,000 years old. But 1.5 billion years ago, animals began to perceive light and touch their environment. The ability to understand, reason, interact, and navigate in the real 3D, 4D physical world is fundamental, as important as linguistic intelligence."

Li is not negating the value of linguistic intelligence. Her core argument is: Language is essentially a "lossy" way of encoding the world.

In the a16z interview, Casado conducted a thought experiment: Blindfold yourself, describe a room using language, then try to complete a task – your chance of success is extremely low. Because language's description of reality is always rough. Remove the blindfold, your brain instantly reconstructs the 3D space, and you can operate, touch, and move.

Li supplemented with a more extreme example from scientific history: Rosalind Franklin's X-ray diffraction photo of DNA was a flat, two-dimensional image, showing a pattern that looked like a cross with diffraction. But Watson and Crick reasoned from that two-dimensional photo to deduce the three-dimensional double-helix structure of DNA. "That structure cannot be two-dimensional. You cannot deduce that structure with two-dimensional thinking."

"If you observe human intelligence, much of it is beyond the scope of language. Language is a lossy way of capturing the world. Pure generative 'language' does not exist in nature; we look around, there are no ready-made sentences or words, yet the entire physical, perceptual, visual world exists."

This is a perspective easily overlooked: most capabilities of current large models are built on a format of information compression that is inherently lossy. In Lenny's Podcast, she used a more mundane test to puncture this illusion:

"Today, you take a model, give it a video clip showing a few office rooms, and ask the model to count the number of chairs. This is something a toddler can do, but AI cannot."

Not to mention deducing physical laws from celestial motion: "Let's give AI all the data, including modern instrument data that Newton didn't have, and ask it to create a set of 17th-century equations about the laws of object motion. Today's AI cannot do that."

Marble: Orders of Magnitude Smaller Than GPT-5

Pushing this judgment into a product is World Labs' first-generation model, Marble, released at the end of 2024.

At the Cisco AI Summit, Li detailed Marble's technical positioning: receiving text, images, video, or simple 3D inputs, and generating a "fully navigable, interactive, and permanently consistent 3D world." She specifically emphasized that this is fundamentally different from video generation models like Sora; environments generated by Marble possess geometric structure, not pixel animations that "look like" video.

In Lenny's Podcast, she used Plato's allegory of the cave for a deeper explanation: Prisoners are tied to chairs, only able to see two-dimensional shadows projected on the wall, but the real drama unfolds in the three-dimensional space behind them. Video models are those shadows, while spatial intelligence aims to create and reason about the real world behind those shadows.

A comparison: GPT-5's training compute is roughly on the order of 10^26 FLOPS, while Marble is several orders of magnitude smaller in scale. The reasons are two-fold: data acquisition difficulty is completely different (high-quality 3D physical data is extremely scarce), and this field is still in the early stages of the "scaling law upward curve."

In Lenny's Podcast, she further explained why robot learning cannot simply replicate the "bitter lesson" of language models. There is a famous assertion in AI: simple models with massive data will eventually surpass complex ones. But "language models have a perfect setup: the training data is words, and the output is also words." In robotics, "you want actions, but the training data lacks actions in the 3D world." This fundamental misalignment between training objectives and data form is the core challenge of robot learning.

World Labs employs a hybrid data strategy: internet-scale text, images, and video, plus simulation data, plus real-world captured data. Li admits, "We are still in the relatively early stages of exploring model architectures," but she expects "the next few years will be very exciting."

Right after, in February 2026, World Labs completed a $1 billion funding round, with participation from NVIDIA, AMD, a16z, valuing the company at around $5 billion, up from $1 billion a year earlier. In April, the team open-sourced the 3D Gaussian splatting rendering engine Spark 2.0, capable of real-time rendering of hundred-million-polygon 3D scenes in web browsers, shifting from a closed-source product to a dual-track strategy of "product + open-source ecosystem." The technical barrier for spatial intelligence is being rapidly lowered.

In Lenny's Podcast, Li also rarely revealed the hardships of entrepreneurship: "If I could whisper one thing to myself 18 months ago: 'The intensity of competition in this field, both technologically and for talent, far exceeds your imagination.'"

Infinite Universes and Multiverses

What really made that a16z interview go viral repeatedly on X was Li's statement about "infinite universes":

"In the entire history of human civilization, we have all lived together in one 3D world. Only a handful of people have been to the moon, but very few. And this technology makes digital virtual worlds incredibly rich. Suddenly, we can actually create infinite universes, some for robots, some for creativity, some for social interaction, some for travel, some for storytelling. Suddenly, we are able to live in a multiverse; the space for imagination is infinite."

Casado provided a more concrete technical explanation: from a single two-dimensional photo, the model can generate a complete 360-degree 3D representation, including the back of a table. You can manipulate, measure, stack—anything you can do in space can be achieved.

This is not science fiction. In the two interviews, Li listed applications where Marble is already being used:

• Game developers used early versions to create games

• A virtual production team collaborating with Sony reduced film production cycles by 40 times

• NVIDIA and multiple academic labs used Marble to train robots

• Architects and designers used it for interior design

• Clinical researchers created personalized immersive trigger environments for patients with OCD, acrophobia

• Someone used it to generate personalized yoga training spaces

The last application was particularly surprising. Li mentioned at the summit that OCD patients are triggered by very specific scenes, "for example, personally I am troubled by piles of dirty laundry, but everyone's trigger points are different." In Lenny's Podcast she added that after release, a friend called her overnight asking if Marble could be used to treat acrophobia. Building physical environments is extremely costly, while Marble only needs a prompt to generate various environments in minutes.

Plato's allegory of the cave is also the best entry point for understanding the 2D vs. 3D divergence.

Li used this allegory to explain: Prisoners tied to chairs can only see two-dimensional shadows projected on the wall. Current language models and video models are essentially those shadows, guessing 3D from 2D. The ambition of spatial intelligence is to create, reason about, and interact with the real world behind those shadows.

In terms of technical roadmap, she drew a clear boundary with a concise comparison:

"A car can be seen as a square robot moving on a two-dimensional plane, its goal is not to hit anything. A robot is a three-dimensional entity operating in a three-dimensional world; the goal of a general-purpose robot is to touch objects without breaking them. This is a higher-dimensional problem."

She also provided a timeline from personal experience: In 2006, she helped create the first self-driving car to travel 138 miles in the desert, predicting autonomous vehicles in 20 years. It wasn't until 2025 that Waymo began operating on city streets at scale.

"Seeing the North Star doesn't mean the journey will be short."

Casado added a more business-savvy observation in the a16z conversation: In the autonomous driving sector alone, the industry invested about $100 billion over 20 years to get where it is today. "Our original roadmap was to solve the world navigation problem first, but it turned out to be extremely difficult."

Li even shared a personal experience in the a16z interview to strengthen the point: About five years ago, she lost stereoscopic vision for several months due to a corneal injury. "Even though I knew very well how big my car was, roughly knew the size of my neighbor's parked car, and I had driven this road many years, I could not judge the distance between my car and the parked car very well. I could only drive at ten miles per hour to avoid scratching other cars."

A lifelong researcher of visual intelligence used her own firsthand struggle after losing depth perception to answer the question "why 3D is irreplaceable."

The Double-Edged Sword of Technology and the Measure of Civilization

Between technological optimism and doomsday rhetoric, Li chose a more restrained and actionable stance. She clearly expressed concern about polarized discourse at the Cisco AI Summit:

"The discussion online often tends to be black and white: either full-blown technological utopianism, ignoring that technology is a double-edged sword; or doomsday talk, as if human survival is at risk at any moment. For a technology so profound for human civilization, this way of discussion is irresponsible."

She didn't stop at criticism but offered a quantifiable anchor for value: electricity.

"If we rewind more than a hundred years, imagine how people then defined the success of electricity. I hope the vision then was: schools lit up, homes warm, machines empowered for industrialization, thereby extending human lifespans, allowing more children to be educated."

Then she applied this anchor to AI: "The definition of success should be that civilization becomes more beautiful, and civilization is composed of every individual pursuing happiness, prosperity, and dignity. That is the definition of success for AI and every technology."

At the end of Lenny's Podcast, she brought this concern down to specific people. She said wherever she goes, she is asked the same question: If I am a farmer, nurse, musician, will AI replace me? Her answer: "Ultimately, AI is about people. No technology should strip away human dignity. Human dignity and autonomy should be at the core of the development, deployment, and governance of every technology."

Looking back at the three interviews, a clear thread emerges.

Fei-Fei Li's thinking on spatial intelligence is not a rebellion against the wave of large models, but an extension built upon it. She saw the limits of language models earlier than most – what a lossy information compression format can do is ultimately limited. The problem spatial intelligence aims to solve is: evolving AI from "talking about the world" to "understanding the world," and ultimately to "acting in the world."

The World Labs team has about 30 people and has raised over $1 billion. Marble is the first-generation product, far smaller in scale than top language models. The scarcity of 3D data and the early state of model architectures determine this will not be a path achieved overnight. But Li said another thing in Lenny's Podcast, perhaps the best annotation for this patience:

"Our brains consume only about 20 watts, dimmer than any light bulb in the room, yet can do so much. The more I work in AI, the more I respect humans."

540 million years of evolution gave carbon-based life this 20-watt spatial intelligence. AI's evolution is being compressed to a few years.

Li did not give a timeline in the three interviews. She just repeatedly returned to that judgment extracted from evolution: perception precedes language, space precedes symbols. What is happening in Silicon Valley labs, Stanford labs, and World Labs offices is not a technological iteration, but an accelerated replay of evolution. (This article was first published on Titanium Media APP, author | Silicon Valley Tech News, editor | Zhao Hongyu)

Appendix: The text transcripts of the above three interviews are archived at 【ima Knowledge Base】 Fei-Fei Li Interviews https://ima.qq.com/wiki/?shareId=3f1d4b4c0d6cb2aeca250e2c5d068390e2d45895816ad607309820e25cb2e9c5

Questions liées

QAccording to the article, what is the fundamental limitation of current large language models that Li Fei-Fei emphasizes?

AThey are built on a 'lossy' information compression format (language) that inherently fails to capture the full richness of the physical, 3D world. Language is a very recent evolutionary development and a poor representation of spatial understanding, which is foundational to intelligence.

QWhat is the core capability of World Labs' Marble model, and how does it fundamentally differ from video generation models like Sora?

AMarble takes text, images, video, or simple 3D inputs and generates a fully navigable, interactive, and persistent 3D world with geometric structure. It creates a true 3D environment, not just a 'video-like' sequence of pixels that looks 3D, as Sora does. Marble aims to create and reason about the real world behind the 'shadows' (2D projections).

QWhat major challenge in robotics learning does Li Fei-Fei highlight, contrasting it with the success of language models?

ARobotics faces a 'fundamental mismatch' between its training objective (actions in the 3D world) and its available data. Unlike language models where training data (words) perfectly matches the output (text), robotics lacks sufficient 'action' data from the real 3D world to effectively train models to perform physical actions.

QBeyond technological applications, what is the 'civilizational yardstick' or definition of success that Li Fei-Fei proposes for AI technology?

AShe defines success by the broader impact on civilization: AI should make civilization better, where civilization is composed of individuals pursuing happiness, prosperity, and dignity. The ultimate goal is that any technology should not deprive humans of their dignity, and human dignity and autonomy should be central to AI development, deployment, and governance.

QWhat personal experience did Li Fei-Fei share to illustrate the irreplaceable importance of 3D spatial perception?

AShe shared that about five years ago, she temporarily lost her stereoscopic vision (3D depth perception) due to a corneal injury. Even with her full knowledge of her car's size and the familiar road, she could not accurately judge distances and had to drive very slowly (around 10 mph) to avoid hitting parked cars, demonstrating the critical role of innate 3D spatial understanding for basic tasks.

Lectures associées

Pourquoi les flux entrants des ETF XRP augmentent-ils tandis que Bitcoin et Ethereum enregistrent des sorties ?

Les fonds ETF adossés au XRP continuent d'enregistrer des entrées de capitaux régulières, tandis que les ETF Bitcoin et Ethereum subissent d'importantes sorties de fonds consécutives. Depuis le 20 mai, les ETF américains liés au XRP auraient attiré environ 35 millions de dollars d'entrées nettes, selon un analyste, alors que les produits Bitcoin et Ethereum ont vu des sorties combinées avoisinant 2 milliards de dollars sur la même période. Ce contraste marqué reflète un refroidissement de la demande institutionnelle pour les deux principales cryptomonnaies et un intérêt croissant pour des actifs alternatifs comme le XRP. Les observateurs évoquent des facteurs tels que son positionnement réglementaire, les perspectives d'expansion des ETF et des spéculations sur une éventuelle demande de type "trésorerie" liée à Ripple. Cependant, malgré ces entrées de fonds soutenues, le cours du XRP est resté atone, affichant même une baisse de plus de 6% sur la semaine passée. Dans le détail, les ETF XRP ont enregistré 17 jours consécutifs d'entrées nettes, avec 4,13 millions de dollars ajoutés le 1er juin. À l'inverse, les ETF spot Bitcoin ont connu leur 11e jour consécutif de sorties (-483,7 M$ le 1er juin) et les ETF Ethereum leur 15e jour consécutif (-44,4 M$ le 1er juin). Ce schéma suggère que les investisseurs institutionnels deviennent plus sélectifs, ciblant des actifs selon des récits de marché spécifiques plutôt qu'en effectuant des rotations larges vers les actifs à plus grande capitalisation.

bitcoinistIl y a 54 mins

Pourquoi les flux entrants des ETF XRP augmentent-ils tandis que Bitcoin et Ethereum enregistrent des sorties ?

bitcoinistIl y a 54 mins

Le paysage on-chain du Bitcoin est bien différent de son pic du marché haussier de 2021

Le paysage on-chain du Bitcoin présente une nette différence par rapport au pic du marché haussier de 2021. Malgré un prix actuel supérieur, l'activité sur le réseau a considérablement diminué. En mai 2021, le réseau enregistrait environ 1,12 million d'adresses actives et 489 000 nouvelles adresses créées par jour. Aujourd'hui, ces chiffres sont tombés à environ 624 000 et 278 000 respectivement, soit des baisses d'environ 44% et 43%. Cette réduction de l'activité des petits porteurs et des nouvelles participations est attribuée à plusieurs facteurs. L'émergence des FNB (ETF) spot et des véhicules d'investissement institutionnels permet aux investisseurs d'accéder au Bitcoin sans nécessiter de mouvements on-chain directs ou de création de portefeuilles. Parallèlement, de nombreux détenteurs à long terme adoptent un comportement plus passif, privilégiant la conservation de leurs actifs. Les analystes notent que cette baisse d'activité n'est pas nécessairement un signal baissier, la volatilité étant souvent le principal déclencheur des pics d'activité du réseau. L'intérêt croissant pour les actions et les métaux précieux pourrait également expliquer ce ralentissement. Au moment de la rédaction, le Bitcoin s'échange à environ 69 876 dollars, avec une hausse de près de 5% sur 24 heures et un volume de transactions en forte augmentation.

bitcoinistIl y a 2 h

Le paysage on-chain du Bitcoin est bien différent de son pic du marché haussier de 2021

bitcoinistIl y a 2 h

Après 540 000 lignes de code, Garry Tan constate que le vieux jeu de la programmation avec l'IA est terminé

Après avoir développé un projet de 540 000 lignes de code (Garry's List) avec Rails et des agents IA, Garry Tan, président de Y Combinator, constate que l'approche traditionnelle du développement logiciel est obsolète. Au lieu de célébrer la quantité de code, il souligne la valeur d'une nouvelle méthodologie : le GStack, un cadre de travail centré sur les flux d'agents IA. Selon lui, l'industrie s'est enfermée dans une logique de "usine Foxconn", entourant les modèles de langage (LLM) intelligents de tests, de validateurs et de mécanismes de contrôle redondants. Alors que le coût des LLM baisse et que leurs capacités augmentent, cette approche devient contre-productive. Elle restreint des agents capables d'autonomie. La solution ? Passer d'une logique de "plus de code" à une logique de "plus de capacités". Tan prône l'utilisation de "skill packs" (packs de compétences) – des modules d'aptitude réutilisables et testables, décrits en Markdown et accompagnés du code minimal nécessaire. L'agent IA peut lui-même générer le code, les tests et le système d'évaluation pour ces compétences. Il illustre ce pouvoir par un exemple : l'évaluation de 85 projets pour un hackathon, un travail de plusieurs jours, a été accomplie par un agent en 30 minutes. Une fois finalisée, cette capacité a été encapsulée dans un "skill pack" pour une réutilisation future. Tan défend le "tokenmaxxing" : il faut accepter de dépenser en tokens d'IA aujourd'hui pour vivre avec les méthodes de demain et acquérir un avantage concurrentiel. La rareté ne réside plus dans la capacité à écrire du code, mais dans la clarté, le jugement et la capacité à définir les bons problèmes. L'ingénieur du futur ne sera pas celui qui écrit le plus de code, mais celui qui, en en écrivant le moins, libère le plus d'intelligence.

marsbitIl y a 2 h

Après 540 000 lignes de code, Garry Tan constate que le vieux jeu de la programmation avec l'IA est terminé

marsbitIl y a 2 h

Trading

Spot
Futures

Articles tendance

Qu'est ce que $S$

Comprendre SPERO : Un aperçu complet Introduction à SPERO Alors que le paysage de l'innovation continue d'évoluer, l'émergence des technologies web3 et des projets de cryptomonnaie joue un rôle central dans la façon dont se dessine l'avenir numérique. Un projet qui a attiré l'attention dans ce domaine dynamique est SPERO, désigné comme SPERO,$$s$. Cet article vise à rassembler et à présenter des informations détaillées sur SPERO, afin d'aider les passionnés et les investisseurs à comprendre ses fondations, ses objectifs et ses innovations dans les domaines du web3 et de la crypto. Qu'est-ce que SPERO,$$s$ ? SPERO,$$s$ est un projet unique dans l'espace crypto qui cherche à tirer parti des principes de décentralisation et de la technologie blockchain pour créer un écosystème qui favorise l'engagement, l'utilité et l'inclusion financière. Le projet est conçu pour faciliter les interactions entre pairs de nouvelles manières, offrant aux utilisateurs des solutions et des services financiers innovants. Au cœur de SPERO,$$s$, l'objectif est d'autonomiser les individus en fournissant des outils et des plateformes qui améliorent l'expérience utilisateur dans l'espace des cryptomonnaies. Cela inclut la possibilité de méthodes de transaction plus flexibles, la promotion d'initiatives dirigées par la communauté et la création de voies pour des opportunités financières via des applications décentralisées (dApps). La vision sous-jacente de SPERO,$$s$ tourne autour de l'inclusivité, visant à combler les lacunes au sein de la finance traditionnelle tout en exploitant les avantages de la technologie blockchain. Qui est le créateur de SPERO,$$s$ ? L'identité du créateur de SPERO,$$s$ reste quelque peu obscure, car il existe peu de ressources publiques fournissant des informations détaillées sur son ou ses fondateurs. Ce manque de transparence peut découler de l'engagement du projet envers la décentralisation—une éthique que de nombreux projets web3 partagent, privilégiant les contributions collectives plutôt que la reconnaissance individuelle. En centrant les discussions autour de la communauté et de ses objectifs collectifs, SPERO,$$s$ incarne l'essence de l'autonomisation sans désigner des individus spécifiques. Ainsi, comprendre l'éthique et la mission de SPERO reste plus important que d'identifier un créateur unique. Qui sont les investisseurs de SPERO,$$s$ ? SPERO,$$s$ est soutenu par une diversité d'investisseurs allant des capital-risqueurs aux investisseurs providentiels dédiés à favoriser l'innovation dans le secteur crypto. L'objectif de ces investisseurs s'aligne généralement avec la mission de SPERO—priorisant les projets qui promettent des avancées technologiques sociétales, l'inclusivité financière et la gouvernance décentralisée. Ces fondations d'investisseurs s'intéressent généralement à des projets qui non seulement offrent des produits innovants, mais qui contribuent également positivement à la communauté blockchain et à ses écosystèmes. Le soutien de ces investisseurs renforce SPERO,$$s$ en tant que concurrent notable dans le domaine en rapide évolution des projets crypto. Comment fonctionne SPERO,$$s$ ? SPERO,$$s$ utilise un cadre multifacette qui le distingue des projets de cryptomonnaie conventionnels. Voici quelques-unes des caractéristiques clés qui soulignent son unicité et son innovation : Gouvernance décentralisée : SPERO,$$s$ intègre des modèles de gouvernance décentralisée, permettant aux utilisateurs de participer activement aux processus de décision concernant l'avenir du projet. Cette approche favorise un sentiment de propriété et de responsabilité parmi les membres de la communauté. Utilité du token : SPERO,$$s$ utilise son propre token de cryptomonnaie, conçu pour servir diverses fonctions au sein de l'écosystème. Ces tokens permettent des transactions, des récompenses et la facilitation des services offerts sur la plateforme, améliorant ainsi l'engagement et l'utilité globaux. Architecture en couches : L'architecture technique de SPERO,$$s$ supporte la modularité et l'évolutivité, permettant une intégration fluide de fonctionnalités et d'applications supplémentaires à mesure que le projet évolue. Cette adaptabilité est primordiale pour maintenir la pertinence dans le paysage crypto en constante évolution. Engagement communautaire : Le projet met l'accent sur des initiatives dirigées par la communauté, utilisant des mécanismes qui incitent à la collaboration et aux retours d'expérience. En cultivant une communauté forte, SPERO,$$s$ peut mieux répondre aux besoins des utilisateurs et s'adapter aux tendances du marché. Accent sur l'inclusion : En proposant des frais de transaction bas et des interfaces conviviales, SPERO,$$s$ vise à attirer une base d'utilisateurs diversifiée, y compris des individus qui n'ont peut-être pas engagé auparavant dans l'espace crypto. Cet engagement envers l'inclusion s'aligne avec sa mission globale d'autonomisation par l'accessibilité. Chronologie de SPERO,$$s$ Comprendre l'histoire d'un projet fournit des aperçus cruciaux sur sa trajectoire de développement et ses jalons. Voici une chronologie suggérée cartographiant les événements significatifs dans l'évolution de SPERO,$$s$ : Phase de conceptualisation et d'idéation : Les idées initiales formant la base de SPERO,$$s$ ont été conçues, s'alignant étroitement avec les principes de décentralisation et de concentration sur la communauté au sein de l'industrie blockchain. Lancement du livre blanc du projet : Suite à la phase conceptuelle, un livre blanc complet détaillant la vision, les objectifs et l'infrastructure technologique de SPERO,$$s$ a été publié pour susciter l'intérêt et les retours de la communauté. Construction de la communauté et engagements précoces : Des efforts de sensibilisation actifs ont été entrepris pour construire une communauté d'adopteurs précoces et d'investisseurs potentiels, facilitant les discussions autour des objectifs du projet et recueillant du soutien. Événement de génération de tokens : SPERO,$$s$ a organisé un événement de génération de tokens (TGE) pour distribuer ses tokens natifs aux premiers soutiens et établir une liquidité initiale au sein de l'écosystème. Lancement de la première dApp : La première application décentralisée (dApp) associée à SPERO,$$s$ a été mise en ligne, permettant aux utilisateurs d'interagir avec les fonctionnalités principales de la plateforme. Développement continu et partenariats : Des mises à jour et des améliorations continues des offres du projet, y compris des partenariats stratégiques avec d'autres acteurs de l'espace blockchain, ont façonné SPERO,$$s$ en un acteur compétitif et évolutif sur le marché crypto. Conclusion SPERO,$$s$ se dresse comme un témoignage du potentiel du web3 et de la cryptomonnaie pour révolutionner les systèmes financiers et autonomiser les individus. Avec un engagement envers la gouvernance décentralisée, l'engagement communautaire et des fonctionnalités conçues de manière innovante, il ouvre la voie vers un paysage financier plus inclusif. Comme pour tout investissement dans l'espace crypto en rapide évolution, les investisseurs et utilisateurs potentiels sont encouragés à mener des recherches approfondies et à s'engager de manière réfléchie avec les développements en cours au sein de SPERO,$$s$. Le projet illustre l'esprit d'innovation de l'industrie crypto, invitant à une exploration plus approfondie de ses nombreuses possibilités. Bien que le parcours de SPERO,$$s$ soit encore en cours, ses principes fondamentaux pourraient en effet influencer l'avenir de nos interactions avec la technologie, la finance et entre nous dans des écosystèmes numériques interconnectés.

101 vues totalesPublié le 2024.12.17Mis à jour le 2024.12.17

Qu'est ce que $S$

Qu'est ce que AGENT S

Agent S : L'avenir de l'interaction autonome dans Web3 Introduction Dans le paysage en constante évolution de Web3 et des cryptomonnaies, les innovations redéfinissent constamment la manière dont les individus interagissent avec les plateformes numériques. Un projet pionnier, Agent S, promet de révolutionner l'interaction homme-machine grâce à son cadre agentique ouvert. En ouvrant la voie à des interactions autonomes, Agent S vise à simplifier des tâches complexes, offrant des applications transformantes dans l'intelligence artificielle (IA). Cette exploration détaillée plongera dans les subtilités du projet, ses caractéristiques uniques et les implications pour le domaine des cryptomonnaies. Qu'est-ce qu'Agent S ? Agent S se présente comme un cadre agentique ouvert révolutionnaire, spécifiquement conçu pour relever trois défis fondamentaux dans l'automatisation des tâches informatiques : Acquisition de connaissances spécifiques au domaine : Le cadre apprend intelligemment à partir de diverses sources de connaissances externes et d'expériences internes. Cette approche double lui permet de construire un riche répertoire de connaissances spécifiques au domaine, améliorant ainsi sa performance dans l'exécution des tâches. Planification sur de longs horizons de tâches : Agent S utilise une planification hiérarchique augmentée par l'expérience, une approche stratégique qui facilite la décomposition et l'exécution efficaces de tâches complexes. Cette fonctionnalité améliore considérablement sa capacité à gérer plusieurs sous-tâches de manière efficace et efficiente. Gestion d'interfaces dynamiques et non uniformes : Le projet introduit l'Interface Agent-Ordinateur (ACI), une solution innovante qui améliore l'interaction entre les agents et les utilisateurs. En utilisant des Modèles de Langage Multimodaux de Grande Taille (MLLMs), Agent S peut naviguer et manipuler sans effort diverses interfaces graphiques. Grâce à ces fonctionnalités pionnières, Agent S fournit un cadre robuste qui aborde les complexités impliquées dans l'automatisation de l'interaction humaine avec les machines, préparant le terrain pour d'innombrables applications en IA et au-delà. Qui est le créateur d'Agent S ? Bien que le concept d'Agent S soit fondamentalement innovant, des informations spécifiques sur son créateur restent insaisissables. Le créateur est actuellement inconnu, ce qui souligne soit le stade naissant du projet, soit le choix stratégique de garder les membres fondateurs sous le radar. Quoi qu'il en soit, l'accent reste mis sur les capacités et le potentiel du cadre. Qui sont les investisseurs d'Agent S ? Étant donné qu'Agent S est relativement nouveau dans l'écosystème cryptographique, des informations détaillées concernant ses investisseurs et soutiens financiers ne sont pas explicitement documentées. Le manque d'aperçus publiquement disponibles sur les fondations d'investissement ou les organisations soutenant le projet soulève des questions sur sa structure de financement et sa feuille de route de développement. Comprendre le soutien est crucial pour évaluer la durabilité du projet et son impact potentiel sur le marché. Comment fonctionne Agent S ? Au cœur d'Agent S se trouve une technologie de pointe qui lui permet de fonctionner efficacement dans divers environnements. Son modèle opérationnel est construit autour de plusieurs caractéristiques clés : Interaction homme-ordinateur semblable à l'humain : Le cadre offre une planification IA avancée, s'efforçant de rendre les interactions avec les ordinateurs plus intuitives. En imitant le comportement humain dans l'exécution des tâches, il promet d'élever l'expérience utilisateur. Mémoire narrative : Utilisée pour tirer parti des expériences de haut niveau, Agent S utilise la mémoire narrative pour suivre les historiques de tâches, améliorant ainsi ses processus de prise de décision. Mémoire épisodique : Cette fonctionnalité fournit aux utilisateurs un accompagnement étape par étape, permettant au cadre d'offrir un soutien contextuel au fur et à mesure que les tâches se déroulent. Support pour OpenACI : Avec la capacité de fonctionner localement, Agent S permet aux utilisateurs de garder le contrôle sur leurs interactions et flux de travail, s'alignant avec l'éthique décentralisée de Web3. Intégration facile avec des API externes : Sa polyvalence et sa compatibilité avec diverses plateformes IA garantissent qu'Agent S peut s'intégrer sans effort dans des écosystèmes technologiques existants, en faisant un choix attrayant pour les développeurs et les organisations. Ces fonctionnalités contribuent collectivement à la position unique d'Agent S dans l'espace crypto, alors qu'il automatise des tâches complexes en plusieurs étapes avec un minimum d'intervention humaine. À mesure que le projet évolue, ses applications potentielles dans Web3 pourraient redéfinir la manière dont les interactions numériques se déroulent. Chronologie d'Agent S Le développement et les jalons d'Agent S peuvent être encapsulés dans une chronologie qui met en évidence ses événements significatifs : 27 septembre 2024 : Le concept d'Agent S a été lancé dans un document de recherche complet intitulé “Un cadre agentique ouvert qui utilise les ordinateurs comme un humain”, présentant les bases du projet. 10 octobre 2024 : Le document de recherche a été rendu publiquement disponible sur arXiv, offrant une exploration approfondie du cadre et de son évaluation de performance basée sur le benchmark OSWorld. 12 octobre 2024 : Une présentation vidéo a été publiée, fournissant un aperçu visuel des capacités et des caractéristiques d'Agent S, engageant davantage les utilisateurs et investisseurs potentiels. Ces jalons dans la chronologie illustrent non seulement les progrès d'Agent S, mais indiquent également son engagement envers la transparence et l'engagement communautaire. Points clés sur Agent S Alors que le cadre Agent S continue d'évoluer, plusieurs attributs clés se distinguent, soulignant sa nature innovante et son potentiel : Cadre innovant : Conçu pour offrir une utilisation intuitive des ordinateurs semblable à l'interaction humaine, Agent S propose une approche nouvelle de l'automatisation des tâches. Interaction autonome : La capacité d'interagir de manière autonome avec les ordinateurs via une interface graphique signifie un bond vers des solutions informatiques plus intelligentes et efficaces. Automatisation des tâches complexes : Avec sa méthodologie robuste, il peut automatiser des tâches complexes en plusieurs étapes, rendant les processus plus rapides et moins sujets aux erreurs. Amélioration continue : Les mécanismes d'apprentissage permettent à Agent S de s'améliorer grâce à ses expériences passées, améliorant continuellement sa performance et son efficacité. Polyvalence : Son adaptabilité à travers différents environnements d'exploitation comme OSWorld et WindowsAgentArena garantit qu'il peut servir un large éventail d'applications. Alors qu'Agent S se positionne dans le paysage Web3 et crypto, son potentiel à améliorer les capacités d'interaction et à automatiser les processus représente une avancée significative dans les technologies IA. Grâce à son cadre innovant, Agent S incarne l'avenir des interactions numériques, promettant une expérience plus fluide et efficace pour les utilisateurs à travers divers secteurs. Conclusion Agent S représente un saut audacieux en avant dans le mariage de l'IA et de Web3, avec la capacité de redéfinir notre interaction avec la technologie. Bien qu'il soit encore à ses débuts, les possibilités de son application sont vastes et convaincantes. Grâce à son cadre complet abordant des défis critiques, Agent S vise à mettre les interactions autonomes au premier plan de l'expérience numérique. À mesure que nous plongeons plus profondément dans les domaines des cryptomonnaies et de la décentralisation, des projets comme Agent S joueront sans aucun doute un rôle crucial dans la façon dont la technologie et la collaboration homme-machine évolueront à l'avenir.

812 vues totalesPublié le 2025.01.14Mis à jour le 2025.01.14

Qu'est ce que AGENT S

Comment acheter S

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Sonic (S) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Sonic (S).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Sonic (S)Après avoir acheté vos Sonic (S), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Sonic (S)Tradez facilement Sonic (S) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.7k vues totalesPublié le 2025.01.15Mis à jour le 2026.06.02

Comment acheter S

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de S (S) sont présentées ci-dessous.

活动图片