From a Lunch Table to an Infinite Universe: Fei-Fei Li Bets on AI's Next Dimension

marsbitОпубліковано о 2026-05-27Востаннє оновлено о 2026-05-27

Анотація

From a Lunch Table Conversation to an Infinite Universe: Fei-Fei Li Bets on AI's Next Frontier - Spatial Intelligence In an era dominated by large language models, AI pioneer Fei-Fei Li argues that true understanding requires spatial intelligence — the ability to perceive, reason, and interact within the physical 3D/4D world. She points to evolutionary history: spatial perception drove the Cambrian explosion 540 million years ago, while language is a far more recent, inherently "lossy" way to encode reality. Current models struggle with basic spatial tasks a child can do, like counting chairs in a video. Her company, World Labs, is pioneering this shift with "Marble," a model that generates navigable, consistent 3D worlds from text, images, or simple 3D inputs—distinct from video generators like Sora. Though smaller than models like GPT-5, due to scarce 3D data and early-stage scaling laws, Marble is already used in gaming, robot training (by NVIDIA), architectural design, and personalized therapy for conditions like OCD and acrophobia. Li envisions this technology enabling "infinite universes" for creativity, social interaction, and more. However, she cautions against utopian or dystopian extremes, advocating for a measured vision where AI enhances human dignity and prosperity, akin to how electricity transformed civilization. The journey is long — as evidenced by the 20-year path to viable autonomous vehicles — but the direction is clear: for AI to move from merely talki...

5 million years – that's the evolutionary age of human language. 540 million years – that's the starting point of the Cambrian explosion sparked by vision and spatial perception.

In 2025 and 2026, when nearly every top Silicon Valley lab was fiercely competing on language models, Professor Fei-Fei Li of Stanford University and founder of World Labs repeatedly raised a question that forced the industry to look up: If AI can only talk and look at pictures, it will never truly "understand" this world.

In three key interviews – the a16z Podcast in June 2025, the Cisco AI Summit in February 2026, and the in-depth 1-hour 19-minute Lenny's Podcast conversation released on May 22, 2026 – she systematically elaborated on a judgment that is being rapidly validated: Spatial Intelligence is the next frontier of AI.

Her statements in the a16z dialogue about "creating infinite universes" and "living in a multiverse," along with her views in Lenny's Podcast that "world models are the next frontier" and "AGI is more of a marketing term," have recently been widely reposted again on X.

"We Are Missing a World Model"

According to a16z partner Martin Casado, during a lunch meeting in Silicon Valley, a table full of AI practitioners was excitedly discussing large language models. Sitting at the other end of the table, Fei-Fei Li suddenly turned and asked him:

"Do you know what we are missing? We are missing a world model."

Casado, an early investor in World Labs and a long-time friend of Li's from her Stanford days, recalled that moment: "Everything clicked." He had independently reached a similar conclusion coming out of extensive investment in the image field: language is not the end of the story.

But Li's thinking on this issue goes back much further than most.

In April 2024, she gave a 15-minute TED Talk, using evolution as her starting point: The appearance of trilobites 540 million years ago allowed life to "see" the world for the first time. The birth of vision ignited an evolutionary race of intelligence, the nervous system began to develop, animals became active, and intelligence emerged. Language is merely a very recent product of this long race.

This judgment was repeatedly reinforced in the three interviews. At the Cisco AI Summit, her statement was more direct:

"Language's history is only about 500,000 years old. But 1.5 billion years ago, animals began to perceive light and touch their environment. The ability to understand, reason, interact, and navigate in the real 3D, 4D physical world is fundamental, as important as linguistic intelligence."

Li is not negating the value of linguistic intelligence. Her core argument is: Language is essentially a "lossy" way of encoding the world.

In the a16z interview, Casado conducted a thought experiment: Blindfold yourself, describe a room using language, then try to complete a task – your chance of success is extremely low. Because language's description of reality is always rough. Remove the blindfold, your brain instantly reconstructs the 3D space, and you can operate, touch, and move.

Li supplemented with a more extreme example from scientific history: Rosalind Franklin's X-ray diffraction photo of DNA was a flat, two-dimensional image, showing a pattern that looked like a cross with diffraction. But Watson and Crick reasoned from that two-dimensional photo to deduce the three-dimensional double-helix structure of DNA. "That structure cannot be two-dimensional. You cannot deduce that structure with two-dimensional thinking."

"If you observe human intelligence, much of it is beyond the scope of language. Language is a lossy way of capturing the world. Pure generative 'language' does not exist in nature; we look around, there are no ready-made sentences or words, yet the entire physical, perceptual, visual world exists."

This is a perspective easily overlooked: most capabilities of current large models are built on a format of information compression that is inherently lossy. In Lenny's Podcast, she used a more mundane test to puncture this illusion:

"Today, you take a model, give it a video clip showing a few office rooms, and ask the model to count the number of chairs. This is something a toddler can do, but AI cannot."

Not to mention deducing physical laws from celestial motion: "Let's give AI all the data, including modern instrument data that Newton didn't have, and ask it to create a set of 17th-century equations about the laws of object motion. Today's AI cannot do that."

Marble: Orders of Magnitude Smaller Than GPT-5

Pushing this judgment into a product is World Labs' first-generation model, Marble, released at the end of 2024.

At the Cisco AI Summit, Li detailed Marble's technical positioning: receiving text, images, video, or simple 3D inputs, and generating a "fully navigable, interactive, and permanently consistent 3D world." She specifically emphasized that this is fundamentally different from video generation models like Sora; environments generated by Marble possess geometric structure, not pixel animations that "look like" video.

In Lenny's Podcast, she used Plato's allegory of the cave for a deeper explanation: Prisoners are tied to chairs, only able to see two-dimensional shadows projected on the wall, but the real drama unfolds in the three-dimensional space behind them. Video models are those shadows, while spatial intelligence aims to create and reason about the real world behind those shadows.

A comparison: GPT-5's training compute is roughly on the order of 10^26 FLOPS, while Marble is several orders of magnitude smaller in scale. The reasons are two-fold: data acquisition difficulty is completely different (high-quality 3D physical data is extremely scarce), and this field is still in the early stages of the "scaling law upward curve."

In Lenny's Podcast, she further explained why robot learning cannot simply replicate the "bitter lesson" of language models. There is a famous assertion in AI: simple models with massive data will eventually surpass complex ones. But "language models have a perfect setup: the training data is words, and the output is also words." In robotics, "you want actions, but the training data lacks actions in the 3D world." This fundamental misalignment between training objectives and data form is the core challenge of robot learning.

World Labs employs a hybrid data strategy: internet-scale text, images, and video, plus simulation data, plus real-world captured data. Li admits, "We are still in the relatively early stages of exploring model architectures," but she expects "the next few years will be very exciting."

Right after, in February 2026, World Labs completed a $1 billion funding round, with participation from NVIDIA, AMD, a16z, valuing the company at around $5 billion, up from $1 billion a year earlier. In April, the team open-sourced the 3D Gaussian splatting rendering engine Spark 2.0, capable of real-time rendering of hundred-million-polygon 3D scenes in web browsers, shifting from a closed-source product to a dual-track strategy of "product + open-source ecosystem." The technical barrier for spatial intelligence is being rapidly lowered.

In Lenny's Podcast, Li also rarely revealed the hardships of entrepreneurship: "If I could whisper one thing to myself 18 months ago: 'The intensity of competition in this field, both technologically and for talent, far exceeds your imagination.'"

Infinite Universes and Multiverses

What really made that a16z interview go viral repeatedly on X was Li's statement about "infinite universes":

"In the entire history of human civilization, we have all lived together in one 3D world. Only a handful of people have been to the moon, but very few. And this technology makes digital virtual worlds incredibly rich. Suddenly, we can actually create infinite universes, some for robots, some for creativity, some for social interaction, some for travel, some for storytelling. Suddenly, we are able to live in a multiverse; the space for imagination is infinite."

Casado provided a more concrete technical explanation: from a single two-dimensional photo, the model can generate a complete 360-degree 3D representation, including the back of a table. You can manipulate, measure, stack—anything you can do in space can be achieved.

This is not science fiction. In the two interviews, Li listed applications where Marble is already being used:

• Game developers used early versions to create games

• A virtual production team collaborating with Sony reduced film production cycles by 40 times

• NVIDIA and multiple academic labs used Marble to train robots

• Architects and designers used it for interior design

• Clinical researchers created personalized immersive trigger environments for patients with OCD, acrophobia

• Someone used it to generate personalized yoga training spaces

The last application was particularly surprising. Li mentioned at the summit that OCD patients are triggered by very specific scenes, "for example, personally I am troubled by piles of dirty laundry, but everyone's trigger points are different." In Lenny's Podcast she added that after release, a friend called her overnight asking if Marble could be used to treat acrophobia. Building physical environments is extremely costly, while Marble only needs a prompt to generate various environments in minutes.

Plato's allegory of the cave is also the best entry point for understanding the 2D vs. 3D divergence.

Li used this allegory to explain: Prisoners tied to chairs can only see two-dimensional shadows projected on the wall. Current language models and video models are essentially those shadows, guessing 3D from 2D. The ambition of spatial intelligence is to create, reason about, and interact with the real world behind those shadows.

In terms of technical roadmap, she drew a clear boundary with a concise comparison:

"A car can be seen as a square robot moving on a two-dimensional plane, its goal is not to hit anything. A robot is a three-dimensional entity operating in a three-dimensional world; the goal of a general-purpose robot is to touch objects without breaking them. This is a higher-dimensional problem."

She also provided a timeline from personal experience: In 2006, she helped create the first self-driving car to travel 138 miles in the desert, predicting autonomous vehicles in 20 years. It wasn't until 2025 that Waymo began operating on city streets at scale.

"Seeing the North Star doesn't mean the journey will be short."

Casado added a more business-savvy observation in the a16z conversation: In the autonomous driving sector alone, the industry invested about $100 billion over 20 years to get where it is today. "Our original roadmap was to solve the world navigation problem first, but it turned out to be extremely difficult."

Li even shared a personal experience in the a16z interview to strengthen the point: About five years ago, she lost stereoscopic vision for several months due to a corneal injury. "Even though I knew very well how big my car was, roughly knew the size of my neighbor's parked car, and I had driven this road many years, I could not judge the distance between my car and the parked car very well. I could only drive at ten miles per hour to avoid scratching other cars."

A lifelong researcher of visual intelligence used her own firsthand struggle after losing depth perception to answer the question "why 3D is irreplaceable."

The Double-Edged Sword of Technology and the Measure of Civilization

Between technological optimism and doomsday rhetoric, Li chose a more restrained and actionable stance. She clearly expressed concern about polarized discourse at the Cisco AI Summit:

"The discussion online often tends to be black and white: either full-blown technological utopianism, ignoring that technology is a double-edged sword; or doomsday talk, as if human survival is at risk at any moment. For a technology so profound for human civilization, this way of discussion is irresponsible."

She didn't stop at criticism but offered a quantifiable anchor for value: electricity.

"If we rewind more than a hundred years, imagine how people then defined the success of electricity. I hope the vision then was: schools lit up, homes warm, machines empowered for industrialization, thereby extending human lifespans, allowing more children to be educated."

Then she applied this anchor to AI: "The definition of success should be that civilization becomes more beautiful, and civilization is composed of every individual pursuing happiness, prosperity, and dignity. That is the definition of success for AI and every technology."

At the end of Lenny's Podcast, she brought this concern down to specific people. She said wherever she goes, she is asked the same question: If I am a farmer, nurse, musician, will AI replace me? Her answer: "Ultimately, AI is about people. No technology should strip away human dignity. Human dignity and autonomy should be at the core of the development, deployment, and governance of every technology."

Looking back at the three interviews, a clear thread emerges.

Fei-Fei Li's thinking on spatial intelligence is not a rebellion against the wave of large models, but an extension built upon it. She saw the limits of language models earlier than most – what a lossy information compression format can do is ultimately limited. The problem spatial intelligence aims to solve is: evolving AI from "talking about the world" to "understanding the world," and ultimately to "acting in the world."

The World Labs team has about 30 people and has raised over $1 billion. Marble is the first-generation product, far smaller in scale than top language models. The scarcity of 3D data and the early state of model architectures determine this will not be a path achieved overnight. But Li said another thing in Lenny's Podcast, perhaps the best annotation for this patience:

"Our brains consume only about 20 watts, dimmer than any light bulb in the room, yet can do so much. The more I work in AI, the more I respect humans."

540 million years of evolution gave carbon-based life this 20-watt spatial intelligence. AI's evolution is being compressed to a few years.

Li did not give a timeline in the three interviews. She just repeatedly returned to that judgment extracted from evolution: perception precedes language, space precedes symbols. What is happening in Silicon Valley labs, Stanford labs, and World Labs offices is not a technological iteration, but an accelerated replay of evolution. (This article was first published on Titanium Media APP, author | Silicon Valley Tech News, editor | Zhao Hongyu)

Appendix: The text transcripts of the above three interviews are archived at 【ima Knowledge Base】 Fei-Fei Li Interviews https://ima.qq.com/wiki/?shareId=3f1d4b4c0d6cb2aeca250e2c5d068390e2d45895816ad607309820e25cb2e9c5

Пов'язані питання

QAccording to the article, what is the fundamental limitation of current large language models that Li Fei-Fei emphasizes?

AThey are built on a 'lossy' information compression format (language) that inherently fails to capture the full richness of the physical, 3D world. Language is a very recent evolutionary development and a poor representation of spatial understanding, which is foundational to intelligence.

QWhat is the core capability of World Labs' Marble model, and how does it fundamentally differ from video generation models like Sora?

AMarble takes text, images, video, or simple 3D inputs and generates a fully navigable, interactive, and persistent 3D world with geometric structure. It creates a true 3D environment, not just a 'video-like' sequence of pixels that looks 3D, as Sora does. Marble aims to create and reason about the real world behind the 'shadows' (2D projections).

QWhat major challenge in robotics learning does Li Fei-Fei highlight, contrasting it with the success of language models?

ARobotics faces a 'fundamental mismatch' between its training objective (actions in the 3D world) and its available data. Unlike language models where training data (words) perfectly matches the output (text), robotics lacks sufficient 'action' data from the real 3D world to effectively train models to perform physical actions.

QBeyond technological applications, what is the 'civilizational yardstick' or definition of success that Li Fei-Fei proposes for AI technology?

AShe defines success by the broader impact on civilization: AI should make civilization better, where civilization is composed of individuals pursuing happiness, prosperity, and dignity. The ultimate goal is that any technology should not deprive humans of their dignity, and human dignity and autonomy should be central to AI development, deployment, and governance.

QWhat personal experience did Li Fei-Fei share to illustrate the irreplaceable importance of 3D spatial perception?

AShe shared that about five years ago, she temporarily lost her stereoscopic vision (3D depth perception) due to a corneal injury. Even with her full knowledge of her car's size and the familiar road, she could not accurately judge distances and had to drive very slowly (around 10 mph) to avoid hitting parked cars, demonstrating the critical role of innate 3D spatial understanding for basic tasks.

Пов'язані матеріали

What Did Duan Yongping Buy in 2026? From a Small Position in Circle to Heavy Allocations in AI, a Breakdown of the Latest Holdings and New Market Signals

Summary: Duan Yongping's investment portfolio adjustments in Q1 2026, revealed via the H&H International Investment 13F filing, signal strategic shifts towards AI, consumer tech, and emerging digital finance. The total portfolio value reached approximately $20 billion, with high concentration in the top 10 holdings. Key new U.S. positions include a significant initial stake in Tesla (3.41 million shares) and smaller, exploratory positions in AI-focused companies like Palantir, Snowflake, and Synopsys. Notably, a small, new position in Circle (200k shares) marks his first entry into the crypto-related space, specifically targeting compliant stablecoin infrastructure. Major additions were made to existing core holdings: Nvidia (position nearly doubled), Pinduoduo, and Berkshire Hathaway. Apple remained the largest holding, though slightly reduced. Positions in Alibaba, ASML, and CoreWeave were liquidated. In the Hong Kong market, a pivotal move was the complete replacement of China Shenhua Energy with a position in Pop Mart. This highlights a strategic expansion into the Z-generation IP and emotional consumption sector, reflecting confidence in the founder and the brand's long-term potential. Overall, the adjustments demonstrate Duan's ongoing investment philosophy: focusing on "good businesses" with strong leadership, while cautiously expanding his circle of competence into high-growth areas like AI and new consumer trends through initial small positions and portfolio rebalancing.

marsbit5 хв тому

What Did Duan Yongping Buy in 2026? From a Small Position in Circle to Heavy Allocations in AI, a Breakdown of the Latest Holdings and New Market Signals

marsbit5 хв тому

Wall Street Takes Over Bitcoin and Stablecoins, But Where Are the Real Profit Opportunities for Retail Investors?

Wall Street is taking over Bitcoin and stablecoins, but where can retail investors really make money now? The common narrative is that Wall Street's dominance via ETFs and regulated stablecoins has structurally ended the era of easy 100x returns from altcoins. While this is true for Bitcoin and stablecoins, which are becoming traditional financial products, it's only half the story. Other crypto sectors are failing for their own reasons. GameFi is largely dead, with 93% of projects failed. NFTs are at multi-year lows with most collections losing all value. Memecoins persist but overwhelmingly benefit insiders and whales at the expense of late retail buyers. These sectors aren't being consumed by TradFi; they've exhausted their growth narratives. The real opportunities for retail in the next 6-12 months lie elsewhere: 1. **Prediction Markets:** Platforms like Polymarket have seen explosive growth (21x in a year) with a genuine, active retail user base. The utility of forecasting events provides sustainable demand beyond mere speculation. 2. **DeFi Yield:** While the era of 1000% APY farms is over, sustainable yields of 4-8% are available through liquid staking, regulated stablecoin platforms, and RWA lending. 3. **Select Altcoins:** If Bitcoin breaks its all-time high, a selective altcoin season could emerge. The favorable bets would be on ETH, assets within the Base and Solana ecosystems with real users, and asymmetric opportunities in AI-crypto and DePIN presales. The most likely market scenario (45% probability) is sideways action, making asset selection far more critical than broad market momentum. The playbook has changed. Actionable steps: Focus time on prediction markets; use DeFi for reliable yield, not lottery tickets; only buy altcoins with genuine user bases; and avoid GameFi, random NFTs, and new memecoins. The "TradFi is eating crypto" story misses the growing sectors. The easy money era is over, leaving a niche, selective market that requires real understanding, but opportunities remain for those who adapt.

marsbit46 хв тому

Wall Street Takes Over Bitcoin and Stablecoins, But Where Are the Real Profit Opportunities for Retail Investors?

marsbit46 хв тому

Торгівля

Спот
Ф'ючерси

Популярні статті

Що таке $S$

Розуміння SPERO: Комплексний огляд Вступ до SPERO Оскільки ландшафт інновацій продовжує еволюціонувати, виникнення технологій web3 та криптовалютних проектів відіграє ключову роль у формуванні цифрового майбутнього. Один з проектів, який привернув увагу в цій динамічній сфері, — це SPERO, позначений як SPERO,$$s$. Ця стаття має на меті зібрати та представити детальну інформацію про SPERO, щоб допомогти ентузіастам та інвесторам зрозуміти його основи, цілі та інновації в рамках web3 та крипто-сектору. Що таке SPERO,$$s$? SPERO,$$s$ — це унікальний проект у криптопросторі, який прагне використати принципи децентралізації та технології блокчейн для створення екосистеми, що сприяє залученню, корисності та фінансовій інклюзії. Проект розроблений для полегшення взаємодії між користувачами новими способами, надаючи їм інноваційні фінансові рішення та послуги. У своїй основі SPERO,$$s$ прагне надати можливості індивідам, забезпечуючи інструменти та платформи, які покращують користувацький досвід у криптовалютному просторі. Це включає в себе можливість більш гнучких методів транзакцій, сприяння ініціативам, що підтримуються спільнотою, та створення шляхів для фінансових можливостей через децентралізовані додатки (dApps). Основна концепція SPERO,$$s$ обертається навколо інклюзивності, прагнучи зменшити розриви в традиційній фінансовій системі, використовуючи переваги технології блокчейн. Хто є творцем SPERO,$$s$? Особистість творця SPERO,$$s$ залишається дещо невідомою, оскільки є обмежені публічно доступні ресурси, що надають детальну інформацію про його засновників. Ця відсутність прозорості може бути наслідком зобов'язання проекту до децентралізації — етики, яку багато проектів web3 поділяють, ставлячи колективні внески вище за індивідуальне визнання. Зосереджуючи обговорення навколо спільноти та її колективних цілей, SPERO,$$s$ втілює суть наділення без виділення конкретних осіб. Таким чином, розуміння етики та місії SPERO є більш важливим, ніж ідентифікація єдиного творця. Хто є інвесторами SPERO,$$s$? SPERO,$$s$ підтримується різноманітними інвесторами, починаючи від венчурних капіталістів до ангельських інвесторів, які прагнуть сприяти інноваціям у крипто-секторі. Зосередження цих інвесторів зазвичай узгоджується з місією SPERO — пріоритет надається проектам, які обіцяють технологічний прогрес у суспільстві, фінансову інклюзію та децентралізоване управління. Ці інвесторські фонди зазвичай зацікавлені в проектах, які не лише пропонують інноваційні продукти, але й позитивно впливають на спільноту блокчейн та її екосистеми. Підтримка з боку цих інвесторів підкріплює SPERO,$$s$ як значного конкурента в швидко змінюваній сфері крипто-проектів. Як працює SPERO,$$s$? SPERO,$$s$ використовує багатогранну структуру, яка відрізняє його від традиційних криптовалютних проектів. Ось деякі ключові особливості, які підкреслюють його унікальність та інноваційність: Децентралізоване управління: SPERO,$$s$ інтегрує моделі децентралізованого управління, надаючи користувачам можливість активно брати участь у процесах прийняття рішень щодо майбутнього проекту. Цей підхід сприяє відчуттю власності та відповідальності серед членів спільноти. Корисність токена: SPERO,$$s$ використовує свій власний криптовалютний токен, розроблений для виконання різних функцій в екосистемі. Ці токени дозволяють здійснювати транзакції, отримувати винагороди та полегшувати послуги, що пропонуються на платформі, підвищуючи загальну залученість та корисність. Шарова архітектура: Технічна архітектура SPERO,$$s$ підтримує модульність та масштабованість, що дозволяє безперешкодно інтегрувати додаткові функції та додатки в міру розвитку проекту. Ця адаптивність є надзвичайно важливою для збереження актуальності в постійно змінюваному крипто-ландшафті. Залучення спільноти: Проект підкреслює ініціативи, що підтримуються спільнотою, використовуючи механізми, які стимулюють співпрацю та зворотний зв'язок. Підтримуючи сильну спільноту, SPERO,$$s$ може краще задовольняти потреби користувачів та адаптуватися до ринкових тенденцій. Фокус на інклюзію: Пропонуючи низькі комісії за транзакції та зручні інтерфейси, SPERO,$$s$ прагне залучити різноманітну базу користувачів, включаючи осіб, які раніше не брали участі в крипто-просторі. Це зобов'язання до інклюзії узгоджується з його загальною місією наділення через доступність. Хронологія SPERO,$$s$ Розуміння історії проекту надає важливі уявлення про його розвиток та етапи. Нижче наведено пропоновану хронологію, що відображає значні події в еволюції SPERO,$$s$: Етап концептуалізації та ідеації: Початкові ідеї, що стали основою SPERO,$$s$, були сформовані, тісно пов'язані з принципами децентралізації та фокусом на спільноті в індустрії блокчейн. Запуск білого паперу проекту: Після концептуального етапу був випущений комплексний білий папір, що детально описує бачення, цілі та технологічну інфраструктуру SPERO,$$s$, щоб залучити інтерес та зворотний зв'язок від спільноти. Створення спільноти та ранні залучення: Активні зусилля були спрямовані на створення спільноти ранніх прихильників та потенційних інвесторів, що полегшило обговорення цілей проекту та отримання підтримки. Подія генерації токенів: SPERO,$$s$ провів подію генерації токенів (TGE) для розподілу своїх рідних токенів серед ранніх прихильників та встановлення початкової ліквідності в екосистемі. Запуск початкового dApp: Перший децентралізований додаток (dApp), пов'язаний з SPERO,$$s$, став доступним, дозволяючи користувачам взаємодіяти з основними функціями платформи. Постійний розвиток та партнерства: Безперервні оновлення та вдосконалення пропозицій проекту, включаючи стратегічні партнерства з іншими учасниками блокчейн-простору, сформували SPERO,$$s$ у конкурентоспроможного та еволюціонуючого гравця на крипто-ринку. Висновок SPERO,$$s$ є свідченням потенціалу web3 та криптовалют для революціонізації фінансових систем та наділення індивідів. Завдяки зобов'язанню до децентралізованого управління, залучення спільноти та інноваційно спроектованих функцій, він прокладає шлях до більш інклюзивного фінансового ландшафту. Як і з будь-якими інвестиціями в швидко змінюваному крипто-просторі, потенційним інвесторам та користувачам рекомендується ретельно досліджувати та обдумано взаємодіяти з поточними подіями в SPERO,$$s$. Проект демонструє інноваційний дух крипто-індустрії, запрошуючи до подальшого дослідження його численних можливостей. Хоча подорож SPERO,$$s$ ще триває, його основні принципи можуть справді вплинути на майбутнє того, як ми взаємодіємо з технологією, фінансами та один з одним у взаємопов'язаних цифрових екосистемах.

73 переглядів усьогоОпубліковано 2024.12.17Оновлено 2024.12.17

Що таке $S$

Що таке AGENT S

Агент S: Майбутнє автономної взаємодії в Web3 Вступ У постійно змінюваному ландшафті Web3 та криптовалюти інновації постійно переосмислюють, як люди взаємодіють з цифровими платформами. Один з таких новаторських проектів, Агент S, обіцяє революціонізувати взаємодію людини з комп'ютером через свою відкриту агентну структуру. Прокладаючи шлях для автономних взаємодій, Агент S прагне спростити складні завдання, пропонуючи трансформаційні застосування в штучному інтелекті (ШІ). Це детальне дослідження заглиблюється в складності проекту, його унікальні особливості та наслідки для сфери криптовалюти. Що таке Агент S? Агент S є революційною відкритою агентною структурою, спеціально розробленою для вирішення трьох основних викликів в автоматизації комп'ютерних завдань: Набуття специфічних знань у галузі: Структура інтелектуально навчається з різних зовнішніх джерел знань та внутрішнього досвіду. Цей подвійний підхід дозволяє їй створити багатий репозиторій специфічних знань у галузі, покращуючи її продуктивність у виконанні завдань. Планування на довгих горизонтах завдань: Агент S використовує планування з підкріпленням досвіду, стратегічний підхід, який полегшує ефективний розподіл та виконання складних завдань. Ця функція значно підвищує її здатність ефективно та результативно управляти кількома підзавданнями. Обробка динамічних, неоднорідних інтерфейсів: Проект представляє Інтерфейс Агент-Комп'ютер (ACI), інноваційне рішення, яке покращує взаємодію між агентами та користувачами. Використовуючи багатомодальні великі мовні моделі (MLLMs), Агент S може безперешкодно орієнтуватися та маніпулювати різноманітними графічними інтерфейсами користувача. Завдяки цим новаторським функціям Агент S надає надійну структуру, яка вирішує складнощі, пов'язані з автоматизацією людської взаємодії з машинами, прокладаючи шлях для численних застосувань у ШІ та за його межами. Хто є творцем Агент S? Хоча концепція Агент S є фундаментально новаторською, конкретна інформація про його творця залишається невідомою. Творець наразі невідомий, що підкреслює або початкову стадію проекту, або стратегічний вибір зберегти засновників у таємниці. Незважаючи на анонімність, акцент залишається на можливостях та потенціалі структури. Хто є інвесторами Агент S? Оскільки Агент S є відносно новим у криптографічній екосистемі, детальна інформація про його інвесторів та фінансових спонсорів не задокументована. Відсутність публічно доступних відомостей про інвестиційні фонди або організації, що підтримують проект, викликає питання щодо його фінансової структури та дорожньої карти розвитку. Розуміння підтримки є критично важливим для оцінки стійкості проекту та потенційного впливу на ринок. Як працює Агент S? В основі Агент S лежить передова технологія, яка дозволяє йому ефективно функціонувати в різних умовах. Його операційна модель побудована навколо кількох ключових функцій: Взаємодія з комп'ютером, подібна до людської: Структура пропонує розширене планування ШІ, прагнучи зробити взаємодії з комп'ютерами більш інтуїтивними. Імітуючи людську поведінку при виконанні завдань, вона обіцяє підвищити досвід користувачів. Наративна пам'ять: Використовується для використання високорівневого досвіду, Агент S використовує наративну пам'ять для відстеження історій завдань, тим самим покращуючи свої процеси прийняття рішень. Епізодична пам'ять: Ця функція надає користувачам покрокові інструкції, дозволяючи структурі пропонувати контекстуальну підтримку в міру виконання завдань. Підтримка OpenACI: Завдяки можливості працювати локально, Агент S дозволяє користувачам зберігати контроль над своїми взаємодіями та робочими процесами, узгоджуючи з децентралізованою етикою Web3. Легка інтеграція з зовнішніми API: Його універсальність і сумісність з різними платформами ШІ забезпечують те, що Агент S може безперешкодно вписатися в існуючі технологічні екосистеми, роблячи його привабливим вибором для розробників та організацій. Ці функціональні можливості колективно сприяють унікальному положенню Агент S у крипто-просторі, оскільки він автоматизує складні, багатоступеневі завдання з мінімальним втручанням людини. У міру розвитку проекту його потенційні застосування в Web3 можуть переосмислити, як відбуваються цифрові взаємодії. Хронологія Агент S Розробка та етапи Агент S можуть бути узагальнені в хронології, яка підкреслює його значні події: 27 вересня 2024 року: Концепція Агент S була представлена в комплексній науковій статті під назвою “Відкрита агентна структура, яка використовує комп'ютери як людина”, що демонструє основи проекту. 10 жовтня 2024 року: Наукова стаття була опублікована на arXiv, пропонуючи детальне дослідження структури та її оцінки продуктивності на основі бенчмарку OSWorld. 12 жовтня 2024 року: Було випущено відеопрезентацію, що надає візуальне уявлення про можливості та особливості Агент S, ще більше залучаючи потенційних користувачів та інвесторів. Ці маркери в хронології не лише ілюструють прогрес Агент S, але й вказують на його прихильність до прозорості та залучення громади. Ключові моменти про Агент S У міру розвитку структури Агент S кілька ключових характеристик виділяються, підкреслюючи її новаторський характер та потенціал: Інноваційна структура: Розроблена для забезпечення інтуїтивного використання комп'ютерів, подібного до людської взаємодії, Агент S пропонує новий підхід до автоматизації завдань. Автономна взаємодія: Здатність автономно взаємодіяти з комп'ютерами через GUI означає стрибок до більш інтелектуальних та ефективних обчислювальних рішень. Автоматизація складних завдань: Завдяки своїй надійній методології він може автоматизувати складні, багатоступеневі завдання, роблячи процеси швидшими та менш схильними до помилок. Безперервне вдосконалення: Механізми навчання дозволяють Агенту S покращуватися на основі минулого досвіду, постійно підвищуючи свою продуктивність та ефективність. Універсальність: Його адаптивність до різних операційних середовищ, таких як OSWorld та WindowsAgentArena, забезпечує його здатність служити широкому спектру застосувань. Оскільки Агент S займає своє місце в ландшафті Web3 та криптовалюти, його потенціал покращити можливості взаємодії та автоматизувати процеси означає значний прогрес у технологіях ШІ. Завдяки своїй інноваційній структурі Агент S є прикладом майбутнього цифрових взаємодій, обіцяючи більш безперешкодний та ефективний досвід для користувачів у різних галузях. Висновок Агент S представляє собою сміливий крок вперед у поєднанні ШІ та Web3, з можливістю переосмислити, як ми взаємодіємо з технологією. Хоча проект все ще на ранніх стадіях, можливості для його застосування є величезними та переконливими. Завдяки своїй комплексній структурі, що вирішує критичні виклики, Агент S прагне вивести автономні взаємодії на передній план цифрового досвіду. У міру того, як ми заглиблюємося в сфери криптовалюти та децентралізації, проекти, подібні до Агент S, безсумнівно, відіграватимуть ключову роль у формуванні майбутнього технологій та співпраці людини з комп'ютером.

659 переглядів усьогоОпубліковано 2025.01.14Оновлено 2025.01.14

Що таке AGENT S

Як купити S

Ласкаво просимо до HTX.com! Ми зробили покупку Sonic (S) простою та зручною. Дотримуйтесь нашої покрокової інструкції, щоб розпочати свою криптовалютну подорож.Крок 1: Створіть обліковий запис на HTXВикористовуйте свою електронну пошту або номер телефону, щоб зареєструвати обліковий запис на HTX безплатно. Пройдіть безпроблемну реєстрацію й отримайте доступ до всіх функцій.ЗареєструватисьКрок 2: Перейдіть до розділу Купити крипту і виберіть спосіб оплатиКредитна/дебетова картка: використовуйте вашу картку Visa або Mastercard, щоб миттєво купити Sonic (S).Баланс: використовуйте кошти з балансу вашого рахунку HTX для безперешкодної торгівлі.Треті особи: ми додали популярні способи оплати, такі як Google Pay та Apple Pay, щоб підвищити зручність.P2P: Торгуйте безпосередньо з іншими користувачами на HTX.Позабіржова торгівля (OTC): ми пропонуємо індивідуальні послуги та конкурентні обмінні курси для трейдерів.Крок 3: Зберігайте свої Sonic (S)Після придбання Sonic (S) збережіть його у своєму обліковому записі на HTX. Крім того, ви можете відправити його в інше місце за допомогою блокчейн-переказу або використовувати його для торгівлі іншими криптовалютами.Крок 4: Торгівля Sonic (S)Легко торгуйте Sonic (S) на спотовому ринку HTX. Просто увійдіть до свого облікового запису, виберіть торгову пару, укладайте угоди та спостерігайте за ними в режимі реального часу. Ми пропонуємо зручний досвід як для початківців, так і для досвідчених трейдерів.

1.5k переглядів усьогоОпубліковано 2025.01.15Оновлено 2025.03.21

Як купити S

Обговорення

Ласкаво просимо до спільноти HTX. Тут ви можете бути в курсі останніх подій розвитку платформи та отримати доступ до професійної ринкової інформації. Нижче представлені думки користувачів щодо ціни S (S).

活动图片