From a Lunch Table to an Infinite Universe: Fei-Fei Li Bets on AI's Next Dimension

marsbit2026-05-27 tarihinde yayınlandı2026-05-27 tarihinde güncellendi

Özet

From a Lunch Table Conversation to an Infinite Universe: Fei-Fei Li Bets on AI's Next Frontier - Spatial Intelligence In an era dominated by large language models, AI pioneer Fei-Fei Li argues that true understanding requires spatial intelligence — the ability to perceive, reason, and interact within the physical 3D/4D world. She points to evolutionary history: spatial perception drove the Cambrian explosion 540 million years ago, while language is a far more recent, inherently "lossy" way to encode reality. Current models struggle with basic spatial tasks a child can do, like counting chairs in a video. Her company, World Labs, is pioneering this shift with "Marble," a model that generates navigable, consistent 3D worlds from text, images, or simple 3D inputs—distinct from video generators like Sora. Though smaller than models like GPT-5, due to scarce 3D data and early-stage scaling laws, Marble is already used in gaming, robot training (by NVIDIA), architectural design, and personalized therapy for conditions like OCD and acrophobia. Li envisions this technology enabling "infinite universes" for creativity, social interaction, and more. However, she cautions against utopian or dystopian extremes, advocating for a measured vision where AI enhances human dignity and prosperity, akin to how electricity transformed civilization. The journey is long — as evidenced by the 20-year path to viable autonomous vehicles — but the direction is clear: for AI to move from merely talki...

5 million years – that's the evolutionary age of human language. 540 million years – that's the starting point of the Cambrian explosion sparked by vision and spatial perception.

In 2025 and 2026, when nearly every top Silicon Valley lab was fiercely competing on language models, Professor Fei-Fei Li of Stanford University and founder of World Labs repeatedly raised a question that forced the industry to look up: If AI can only talk and look at pictures, it will never truly "understand" this world.

In three key interviews – the a16z Podcast in June 2025, the Cisco AI Summit in February 2026, and the in-depth 1-hour 19-minute Lenny's Podcast conversation released on May 22, 2026 – she systematically elaborated on a judgment that is being rapidly validated: Spatial Intelligence is the next frontier of AI.

Her statements in the a16z dialogue about "creating infinite universes" and "living in a multiverse," along with her views in Lenny's Podcast that "world models are the next frontier" and "AGI is more of a marketing term," have recently been widely reposted again on X.

"We Are Missing a World Model"

According to a16z partner Martin Casado, during a lunch meeting in Silicon Valley, a table full of AI practitioners was excitedly discussing large language models. Sitting at the other end of the table, Fei-Fei Li suddenly turned and asked him:

"Do you know what we are missing? We are missing a world model."

Casado, an early investor in World Labs and a long-time friend of Li's from her Stanford days, recalled that moment: "Everything clicked." He had independently reached a similar conclusion coming out of extensive investment in the image field: language is not the end of the story.

But Li's thinking on this issue goes back much further than most.

In April 2024, she gave a 15-minute TED Talk, using evolution as her starting point: The appearance of trilobites 540 million years ago allowed life to "see" the world for the first time. The birth of vision ignited an evolutionary race of intelligence, the nervous system began to develop, animals became active, and intelligence emerged. Language is merely a very recent product of this long race.

This judgment was repeatedly reinforced in the three interviews. At the Cisco AI Summit, her statement was more direct:

"Language's history is only about 500,000 years old. But 1.5 billion years ago, animals began to perceive light and touch their environment. The ability to understand, reason, interact, and navigate in the real 3D, 4D physical world is fundamental, as important as linguistic intelligence."

Li is not negating the value of linguistic intelligence. Her core argument is: Language is essentially a "lossy" way of encoding the world.

In the a16z interview, Casado conducted a thought experiment: Blindfold yourself, describe a room using language, then try to complete a task – your chance of success is extremely low. Because language's description of reality is always rough. Remove the blindfold, your brain instantly reconstructs the 3D space, and you can operate, touch, and move.

Li supplemented with a more extreme example from scientific history: Rosalind Franklin's X-ray diffraction photo of DNA was a flat, two-dimensional image, showing a pattern that looked like a cross with diffraction. But Watson and Crick reasoned from that two-dimensional photo to deduce the three-dimensional double-helix structure of DNA. "That structure cannot be two-dimensional. You cannot deduce that structure with two-dimensional thinking."

"If you observe human intelligence, much of it is beyond the scope of language. Language is a lossy way of capturing the world. Pure generative 'language' does not exist in nature; we look around, there are no ready-made sentences or words, yet the entire physical, perceptual, visual world exists."

This is a perspective easily overlooked: most capabilities of current large models are built on a format of information compression that is inherently lossy. In Lenny's Podcast, she used a more mundane test to puncture this illusion:

"Today, you take a model, give it a video clip showing a few office rooms, and ask the model to count the number of chairs. This is something a toddler can do, but AI cannot."

Not to mention deducing physical laws from celestial motion: "Let's give AI all the data, including modern instrument data that Newton didn't have, and ask it to create a set of 17th-century equations about the laws of object motion. Today's AI cannot do that."

Marble: Orders of Magnitude Smaller Than GPT-5

Pushing this judgment into a product is World Labs' first-generation model, Marble, released at the end of 2024.

At the Cisco AI Summit, Li detailed Marble's technical positioning: receiving text, images, video, or simple 3D inputs, and generating a "fully navigable, interactive, and permanently consistent 3D world." She specifically emphasized that this is fundamentally different from video generation models like Sora; environments generated by Marble possess geometric structure, not pixel animations that "look like" video.

In Lenny's Podcast, she used Plato's allegory of the cave for a deeper explanation: Prisoners are tied to chairs, only able to see two-dimensional shadows projected on the wall, but the real drama unfolds in the three-dimensional space behind them. Video models are those shadows, while spatial intelligence aims to create and reason about the real world behind those shadows.

A comparison: GPT-5's training compute is roughly on the order of 10^26 FLOPS, while Marble is several orders of magnitude smaller in scale. The reasons are two-fold: data acquisition difficulty is completely different (high-quality 3D physical data is extremely scarce), and this field is still in the early stages of the "scaling law upward curve."

In Lenny's Podcast, she further explained why robot learning cannot simply replicate the "bitter lesson" of language models. There is a famous assertion in AI: simple models with massive data will eventually surpass complex ones. But "language models have a perfect setup: the training data is words, and the output is also words." In robotics, "you want actions, but the training data lacks actions in the 3D world." This fundamental misalignment between training objectives and data form is the core challenge of robot learning.

World Labs employs a hybrid data strategy: internet-scale text, images, and video, plus simulation data, plus real-world captured data. Li admits, "We are still in the relatively early stages of exploring model architectures," but she expects "the next few years will be very exciting."

Right after, in February 2026, World Labs completed a $1 billion funding round, with participation from NVIDIA, AMD, a16z, valuing the company at around $5 billion, up from $1 billion a year earlier. In April, the team open-sourced the 3D Gaussian splatting rendering engine Spark 2.0, capable of real-time rendering of hundred-million-polygon 3D scenes in web browsers, shifting from a closed-source product to a dual-track strategy of "product + open-source ecosystem." The technical barrier for spatial intelligence is being rapidly lowered.

In Lenny's Podcast, Li also rarely revealed the hardships of entrepreneurship: "If I could whisper one thing to myself 18 months ago: 'The intensity of competition in this field, both technologically and for talent, far exceeds your imagination.'"

Infinite Universes and Multiverses

What really made that a16z interview go viral repeatedly on X was Li's statement about "infinite universes":

"In the entire history of human civilization, we have all lived together in one 3D world. Only a handful of people have been to the moon, but very few. And this technology makes digital virtual worlds incredibly rich. Suddenly, we can actually create infinite universes, some for robots, some for creativity, some for social interaction, some for travel, some for storytelling. Suddenly, we are able to live in a multiverse; the space for imagination is infinite."

Casado provided a more concrete technical explanation: from a single two-dimensional photo, the model can generate a complete 360-degree 3D representation, including the back of a table. You can manipulate, measure, stack—anything you can do in space can be achieved.

This is not science fiction. In the two interviews, Li listed applications where Marble is already being used:

• Game developers used early versions to create games

• A virtual production team collaborating with Sony reduced film production cycles by 40 times

• NVIDIA and multiple academic labs used Marble to train robots

• Architects and designers used it for interior design

• Clinical researchers created personalized immersive trigger environments for patients with OCD, acrophobia

• Someone used it to generate personalized yoga training spaces

The last application was particularly surprising. Li mentioned at the summit that OCD patients are triggered by very specific scenes, "for example, personally I am troubled by piles of dirty laundry, but everyone's trigger points are different." In Lenny's Podcast she added that after release, a friend called her overnight asking if Marble could be used to treat acrophobia. Building physical environments is extremely costly, while Marble only needs a prompt to generate various environments in minutes.

Plato's allegory of the cave is also the best entry point for understanding the 2D vs. 3D divergence.

Li used this allegory to explain: Prisoners tied to chairs can only see two-dimensional shadows projected on the wall. Current language models and video models are essentially those shadows, guessing 3D from 2D. The ambition of spatial intelligence is to create, reason about, and interact with the real world behind those shadows.

In terms of technical roadmap, she drew a clear boundary with a concise comparison:

"A car can be seen as a square robot moving on a two-dimensional plane, its goal is not to hit anything. A robot is a three-dimensional entity operating in a three-dimensional world; the goal of a general-purpose robot is to touch objects without breaking them. This is a higher-dimensional problem."

She also provided a timeline from personal experience: In 2006, she helped create the first self-driving car to travel 138 miles in the desert, predicting autonomous vehicles in 20 years. It wasn't until 2025 that Waymo began operating on city streets at scale.

"Seeing the North Star doesn't mean the journey will be short."

Casado added a more business-savvy observation in the a16z conversation: In the autonomous driving sector alone, the industry invested about $100 billion over 20 years to get where it is today. "Our original roadmap was to solve the world navigation problem first, but it turned out to be extremely difficult."

Li even shared a personal experience in the a16z interview to strengthen the point: About five years ago, she lost stereoscopic vision for several months due to a corneal injury. "Even though I knew very well how big my car was, roughly knew the size of my neighbor's parked car, and I had driven this road many years, I could not judge the distance between my car and the parked car very well. I could only drive at ten miles per hour to avoid scratching other cars."

A lifelong researcher of visual intelligence used her own firsthand struggle after losing depth perception to answer the question "why 3D is irreplaceable."

The Double-Edged Sword of Technology and the Measure of Civilization

Between technological optimism and doomsday rhetoric, Li chose a more restrained and actionable stance. She clearly expressed concern about polarized discourse at the Cisco AI Summit:

"The discussion online often tends to be black and white: either full-blown technological utopianism, ignoring that technology is a double-edged sword; or doomsday talk, as if human survival is at risk at any moment. For a technology so profound for human civilization, this way of discussion is irresponsible."

She didn't stop at criticism but offered a quantifiable anchor for value: electricity.

"If we rewind more than a hundred years, imagine how people then defined the success of electricity. I hope the vision then was: schools lit up, homes warm, machines empowered for industrialization, thereby extending human lifespans, allowing more children to be educated."

Then she applied this anchor to AI: "The definition of success should be that civilization becomes more beautiful, and civilization is composed of every individual pursuing happiness, prosperity, and dignity. That is the definition of success for AI and every technology."

At the end of Lenny's Podcast, she brought this concern down to specific people. She said wherever she goes, she is asked the same question: If I am a farmer, nurse, musician, will AI replace me? Her answer: "Ultimately, AI is about people. No technology should strip away human dignity. Human dignity and autonomy should be at the core of the development, deployment, and governance of every technology."

Looking back at the three interviews, a clear thread emerges.

Fei-Fei Li's thinking on spatial intelligence is not a rebellion against the wave of large models, but an extension built upon it. She saw the limits of language models earlier than most – what a lossy information compression format can do is ultimately limited. The problem spatial intelligence aims to solve is: evolving AI from "talking about the world" to "understanding the world," and ultimately to "acting in the world."

The World Labs team has about 30 people and has raised over $1 billion. Marble is the first-generation product, far smaller in scale than top language models. The scarcity of 3D data and the early state of model architectures determine this will not be a path achieved overnight. But Li said another thing in Lenny's Podcast, perhaps the best annotation for this patience:

"Our brains consume only about 20 watts, dimmer than any light bulb in the room, yet can do so much. The more I work in AI, the more I respect humans."

540 million years of evolution gave carbon-based life this 20-watt spatial intelligence. AI's evolution is being compressed to a few years.

Li did not give a timeline in the three interviews. She just repeatedly returned to that judgment extracted from evolution: perception precedes language, space precedes symbols. What is happening in Silicon Valley labs, Stanford labs, and World Labs offices is not a technological iteration, but an accelerated replay of evolution. (This article was first published on Titanium Media APP, author | Silicon Valley Tech News, editor | Zhao Hongyu)

Appendix: The text transcripts of the above three interviews are archived at 【ima Knowledge Base】 Fei-Fei Li Interviews https://ima.qq.com/wiki/?shareId=3f1d4b4c0d6cb2aeca250e2c5d068390e2d45895816ad607309820e25cb2e9c5

İlgili Sorular

QAccording to the article, what is the fundamental limitation of current large language models that Li Fei-Fei emphasizes?

AThey are built on a 'lossy' information compression format (language) that inherently fails to capture the full richness of the physical, 3D world. Language is a very recent evolutionary development and a poor representation of spatial understanding, which is foundational to intelligence.

QWhat is the core capability of World Labs' Marble model, and how does it fundamentally differ from video generation models like Sora?

AMarble takes text, images, video, or simple 3D inputs and generates a fully navigable, interactive, and persistent 3D world with geometric structure. It creates a true 3D environment, not just a 'video-like' sequence of pixels that looks 3D, as Sora does. Marble aims to create and reason about the real world behind the 'shadows' (2D projections).

QWhat major challenge in robotics learning does Li Fei-Fei highlight, contrasting it with the success of language models?

ARobotics faces a 'fundamental mismatch' between its training objective (actions in the 3D world) and its available data. Unlike language models where training data (words) perfectly matches the output (text), robotics lacks sufficient 'action' data from the real 3D world to effectively train models to perform physical actions.

QBeyond technological applications, what is the 'civilizational yardstick' or definition of success that Li Fei-Fei proposes for AI technology?

AShe defines success by the broader impact on civilization: AI should make civilization better, where civilization is composed of individuals pursuing happiness, prosperity, and dignity. The ultimate goal is that any technology should not deprive humans of their dignity, and human dignity and autonomy should be central to AI development, deployment, and governance.

QWhat personal experience did Li Fei-Fei share to illustrate the irreplaceable importance of 3D spatial perception?

AShe shared that about five years ago, she temporarily lost her stereoscopic vision (3D depth perception) due to a corneal injury. Even with her full knowledge of her car's size and the familiar road, she could not accurately judge distances and had to drive very slowly (around 10 mph) to avoid hitting parked cars, demonstrating the critical role of innate 3D spatial understanding for basic tasks.

İlgili Okumalar

Who Will Make Money in the Age of Agents?

In the Agents era of blockchain, traditional value capture theories face challenges. The "Fat Protocol" theory, dominant since 2016, suggested protocols capture most value as their tokens are essential for network use. However, the proliferation of interchangeable L1s, L2s, and modular layers has eroded protocol scarcity and pricing power. Conversely, the "Fat App" theory posits that applications capturing user relationships (like wallets and exchanges) become the primary value layer by controlling distribution and transaction flows. This aligns with the current "Great Repricing" cycle. Agents disrupt this logic. As software users, they lack brand loyalty, prioritize cost and efficiency, and switch between platforms seamlessly. This undermines the front-end UX moats that "Fat Apps" rely on. The article explores several potential futures: 1. **Headless Applications:** Current leading apps could strip their front-ends and become backend API infrastructure for Agents, preserving their role. 2. **Protocol Resurgence:** If integration becomes trivial, Agents might bypass aggregators and interact directly with protocols, reviving "Fat Protocol" dynamics. 3. **Pricing Power Collapse:** Agents' rational, frictionless routing could commoditize the entire stack, compressing margins toward cost and leaving little profit for intermediaries. 4. **Unprecedented Activity:** Agents may enable new, high-frequency, machine-to-machine economic activities, expanding the total value pie even if margins are thin. 5. **A New, Unnamed Model:** Historically, major tech shifts (like the internet's attention economy) create unforeseen business models. The Agents era may spawn entirely new ways to capture value. The most likely outcome is a coexistence where "Fat Apps" continue to serve human users valuing UX, while a separate, Agent-driven economy emerges governed by different rules—where loyalty is based on factors like liquidity, latency, and settlement guarantees rather than brand.

marsbit46 dk önce

Who Will Make Money in the Age of Agents?

marsbit46 dk önce

Who Will Make Money in the Age of Agents?

Who will capture value in an era where AI Agents become the primary blockchain users? Existing crypto value capture theories assume human users. "Fat Protocols" (2016) posited that protocols capture the most value as applications commoditize on open data, but this weakened as blockchain infrastructure proliferated and became interchangeable. The emerging "Fat Apps" theory argues applications capturing user relationships (like wallets and aggregators) win by controlling distribution and monetizing user flows. Agents fundamentally disrupt this logic. They don't value UX, brand, or convenience, bypassing the front-end moats of fat apps. This leads to several possible futures: 1. **"Headless" Apps**: Current app leaders (e.g., wallets) strip their front ends and become API infrastructure for Agents, preserving their value capture. 2. **Protocol Renaissance**: If integration is easy, Agents skip aggregators and interact directly with protocols, reviving the fat protocol thesis. 3. **Pricing Power Collapse**: Agents' rational, frictionless price shopping could commoditize the entire stack, compressing margins toward cost. Value flows to Agent owners or end-users. 4. **Unprecedented Activity**: Agents could enable entirely new, high-frequency economic activity (e.g., machine-to-machine commerce), expanding the total value pie. 5. **A New, Unnamed Model**: As with the internet's attention economy, a novel, unforeseen business model may emerge. Likely, human and Agent ecosystems will coexist with distinct value capture dynamics. For builders in the Agent realm, the key question shifts from UX to competitive advantages like liquidity, latency, or settlement guarantees that retain automated users.

链捕手1 saat önce

Who Will Make Money in the Age of Agents?

链捕手1 saat önce

İşlemler

Spot
Futures

Popüler Makaleler

$S$ Nedir

SPERO'yu Anlamak: Kapsamlı Bir Genel Bakış SPERO'ya Giriş İnovasyonun manzarası gelişmeye devam ederken, web3 teknolojilerinin ve kripto para projelerinin ortaya çıkışı dijital geleceği şekillendirmede önemli bir rol oynamaktadır. Bu dinamik alanda dikkat çeken projelerden biri SPERO, $$s$$ olarak adlandırılmaktadır. Bu makale, SPERO hakkında ayrıntılı bilgi toplamak ve sunmak amacıyla, meraklılar ve yatırımcıların web3 ve kripto alanlarındaki temellerini, hedeflerini ve yeniliklerini anlamalarına yardımcı olmayı amaçlamaktadır. SPERO,$$s$$ Nedir? SPERO,$$s$$, kripto alanında merkeziyetsizlik ve blok zinciri teknolojisi ilkelerini kullanarak etkileşimi, faydayı ve finansal kapsayıcılığı teşvik eden bir ekosistem yaratmayı amaçlayan benzersiz bir projedir. Proje, kullanıcıların yenilikçi finansal çözümler ve hizmetler sunarak eşler arası etkileşimleri yeni yollarla kolaylaştırmayı hedeflemektedir. SPERO,$$s$$'nin temel amacı, bireyleri güçlendirmek ve kripto para alanındaki kullanıcı deneyimini artıran araçlar ve platformlar sağlamaktır. Bu, daha esnek işlem yöntemlerini mümkün kılmayı, topluluk odaklı girişimleri teşvik etmeyi ve merkeziyetsiz uygulamalar (dApp'ler) aracılığıyla finansal fırsatlar yaratmayı içermektedir. SPERO,$$s$$'nin temel vizyonu kapsayıcılık etrafında dönmekte olup, geleneksel finansal sistemlerdeki boşlukları kapatmayı ve blok zinciri teknolojisinin faydalarından yararlanmayı hedeflemektedir. SPERO,$$s$$'nin Yaratıcısı Kimdir? SPERO,$$s$$'nin yaratıcısının kimliği bir miktar belirsizdir, çünkü kurucusu(ları) hakkında ayrıntılı arka plan bilgisi sağlayan sınırlı kamuya açık kaynaklar bulunmaktadır. Bu şeffaflık eksikliği, projenin merkeziyetsizlik taahhüdünden kaynaklanabilir—birçok web3 projesinin paylaştığı bir etik anlayışı, bireysel tanınmanın yerine kolektif katkıları önceliklendirmektedir. Topluluk ve onun kolektif hedefleri etrafında tartışmaları merkezileştirerek, SPERO,$$s$$, belirli bireyleri öne çıkarmadan güçlendirme özünü taşımaktadır. Bu nedenle, SPERO'nun etik anlayışını ve misyonunu anlamak, tek bir yaratıcının kimliğini belirlemekten daha önemlidir. SPERO,$$s$$'nin Yatırımcıları Kimlerdir? SPERO,$$s$$, kripto sektöründe yeniliği teşvik etmeye adanmış girişim sermayedarlarından melek yatırımcılara kadar çeşitli yatırımcılar tarafından desteklenmektedir. Bu yatırımcıların odak noktası genellikle SPERO'nun misyonuyla uyumlu olup, toplumsal teknolojik ilerlemeyi, finansal kapsayıcılığı ve merkeziyetsiz yönetimi vaat eden projeleri önceliklendirmektedir. Bu yatırımcı temelleri, yalnızca yenilikçi ürünler sunan projelere değil, aynı zamanda blok zinciri topluluğuna ve ekosistemlerine olumlu katkılarda bulunan projelere de ilgi duymaktadır. Bu yatırımcıların desteği, SPERO,$$s$$'yi hızla gelişen kripto projeleri alanında dikkate değer bir rakip haline getirmektedir. SPERO,$$s$$ Nasıl Çalışır? SPERO,$$s$$, onu geleneksel kripto para projelerinden ayıran çok yönlü bir çerçeve kullanmaktadır. İşte benzersizliğini ve yeniliğini vurgulayan bazı temel özellikler: Merkeziyetsiz Yönetim: SPERO,$$s$$, kullanıcıların projenin geleceğiyle ilgili karar alma süreçlerine aktif olarak katılmalarını sağlayan merkeziyetsiz yönetim modellerini entegre etmektedir. Bu yaklaşım, topluluk üyeleri arasında sahiplik ve hesap verebilirlik duygusunu teşvik etmektedir. Token Kullanımı: SPERO,$$s$$, ekosistem içinde çeşitli işlevler sunmak üzere tasarlanmış kendi kripto para token'ını kullanmaktadır. Bu token'lar, işlemleri, ödülleri ve platformda sunulan hizmetlerin kolaylaştırılmasını sağlayarak genel etkileşimi ve faydayı artırmaktadır. Katmanlı Mimari: SPERO,$$s$$'nin teknik mimarisi, modülerlik ve ölçeklenebilirliği destekleyerek projenin evrimi sırasında ek özelliklerin ve uygulamaların sorunsuz bir şekilde entegrasyonuna olanak tanımaktadır. Bu uyum sağlama yeteneği, sürekli değişen kripto manzarasında geçerliliği sürdürmek için hayati öneme sahiptir. Topluluk Katılımı: Proje, işbirliği ve geri bildirim teşvik eden mekanizmalar kullanarak topluluk odaklı girişimlere vurgu yapmaktadır. Güçlü bir topluluk oluşturarak, SPERO,$$s$$, kullanıcı ihtiyaçlarını daha iyi karşılayabilir ve piyasa trendlerine uyum sağlayabilir. Kapsayıcılığa Odaklanma: Düşük işlem ücretleri ve kullanıcı dostu arayüzler sunarak, SPERO,$$s$$, daha önce kripto alanında yer almamış bireyler de dahil olmak üzere çeşitli bir kullanıcı tabanını çekmeyi hedeflemektedir. Bu kapsayıcılık taahhüdü, erişilebilirlik yoluyla güçlendirme misyonuyla uyumludur. SPERO,$$s$$ Zaman Çizelgesi Bir projenin tarihini anlamak, gelişim yolculuğu ve kilometre taşları hakkında kritik bilgiler sağlar. Aşağıda, SPERO,$$s$$'nin evriminde önemli olayları haritalayan önerilen bir zaman çizelgesi bulunmaktadır: Kavram Geliştirme ve Fikir Aşaması: SPERO,$$s$$'nin temelini oluşturan ilk fikirler, blok zinciri endüstrisindeki merkeziyetsizlik ve topluluk odaklılık ilkeleriyle yakından uyumlu olarak geliştirildi. Proje Beyaz Kağıdının Yayınlanması: Kavramsal aşamayı takiben, SPERO,$$s$$'nin vizyonunu, hedeflerini ve teknolojik altyapısını ayrıntılı bir şekilde açıklayan kapsamlı bir beyaz kağıt yayımlandı ve topluluk ilgisini ve geri bildirimini toplamak amacıyla sunuldu. Topluluk Oluşturma ve Erken Katılımlar: Projenin hedefleri etrafında tartışmalar yürüterek destek toplamak ve erken benimseyenler ile potansiyel yatırımcılar için bir topluluk oluşturmak amacıyla aktif iletişim çabaları gerçekleştirildi. Token Üretim Etkinliği: SPERO,$$s$$, yerel token'larını erken destekçilere dağıtmak ve ekosistem içinde başlangıç likiditesini sağlamak amacıyla bir token üretim etkinliği (TGE) gerçekleştirdi. İlk dApp'in Yayınlanması: SPERO,$$s$$ ile ilişkili ilk merkeziyetsiz uygulama (dApp) faaliyete geçti ve kullanıcıların platformun temel işlevleriyle etkileşimde bulunmalarını sağladı. Sürekli Gelişim ve Ortaklıklar: Projenin tekliflerine sürekli güncellemeler ve iyileştirmeler yapılmakta olup, blok zinciri alanındaki diğer oyuncularla stratejik ortaklıklar, SPERO,$$s$$'yi rekabetçi ve gelişen bir oyuncu haline getirmiştir. Sonuç SPERO,$$s$$, web3 ve kripto paranın finansal sistemleri devrim niteliğinde dönüştürme ve bireyleri güçlendirme potansiyelinin bir kanıtıdır. Merkeziyetsiz yönetime, topluluk katılımına ve yenilikçi tasarlanmış işlevselliğe olan bağlılığıyla, daha kapsayıcı bir finansal manzaraya doğru bir yol açmaktadır. Hızla gelişen kripto alanındaki herhangi bir yatırımda olduğu gibi, potansiyel yatırımcılar ve kullanıcılar, SPERO,$$s$$ içindeki devam eden gelişmelerle ilgili olarak kapsamlı bir araştırma yapmaları ve düşünceli bir şekilde katılmaları teşvik edilmektedir. Proje, kripto endüstrisinin yenilikçi ruhunu sergileyerek, sayısız olasılığını keşfetmeye davet etmektedir. SPERO,$$s$$'nin yolculuğu hala devam ederken, temel ilkeleri, teknoloji, finans ve birbirimizle etkileşim biçimimizi etkileyebilir.

89 Toplam GörüntülenmeYayınlanma 2024.12.17Güncellenme 2024.12.17

$S$ Nedir

AGENT S Nedir

Agent S: Web3'te Otonom Etkileşimin Geleceği Giriş Web3 ve kripto para dünyasında sürekli gelişen manzarada, yenilikler bireylerin dijital platformlarla etkileşim biçimlerini sürekli olarak yeniden tanımlıyor. Bu tür öncü projelerden biri olan Agent S, açık ajans çerçevesi aracılığıyla insan-bilgisayar etkileşimini devrim niteliğinde değiştirmeyi vaat ediyor. Otonom etkileşimlerin yolunu açarak, Agent S karmaşık görevleri basitleştirmeyi ve yapay zeka (AI) alanında dönüştürücü uygulamalar sunmayı hedefliyor. Bu detaylı inceleme, projenin karmaşıklıklarına, benzersiz özelliklerine ve kripto para alanındaki etkilerine dalacaktır. Agent S Nedir? Agent S, bilgisayar görevlerinin otomasyonunda üç temel zorluğu ele almak üzere özel olarak tasarlanmış çığır açıcı bir açık ajans çerçevesidir: Alan Spesifik Bilgi Edinimi: Çerçeve, çeşitli dış bilgi kaynaklarından ve iç deneyimlerden akıllıca öğrenir. Bu çift yönlü yaklaşım, alan spesifik bilgi açısından zengin bir veri havuzu oluşturmasını sağlar ve görev yürütmedeki performansını artırır. Uzun Görev Ufukları Üzerinde Planlama: Agent S, karmaşık görevlerin verimli bir şekilde parçalanmasını ve yürütülmesini kolaylaştıran deneyim artırımlı hiyerarşik planlama kullanır. Bu özellik, çoklu alt görevleri etkili ve verimli bir şekilde yönetme yeteneğini önemli ölçüde artırır. Dinamik, Homojen Olmayan Arayüzlerle Başlama: Proje, ajanlar ve kullanıcılar arasındaki etkileşimi geliştiren yenilikçi bir çözüm olan Ajan-Bilgisayar Arayüzü'ni (ACI) tanıtmaktadır. Çok Modlu Büyük Dil Modellerini (MLLM'ler) kullanarak, Agent S çeşitli grafik kullanıcı arayüzlerini sorunsuz bir şekilde gezinebilir ve manipüle edebilir. Bu öncü özellikler aracılığıyla, Agent S, makinelerle insan etkileşimini otomatikleştirmede karşılaşılan karmaşıklıkları ele alan sağlam bir çerçeve sunarak, AI ve ötesinde birçok uygulama için zemin hazırlıyor. Agent S'nin Yaratıcısı Kimdir? Agent S'nin kavramı temelde yenilikçi olsa da, yaratıcısı hakkında spesifik bilgiler belirsizliğini koruyor. Yaratıcı şu anda bilinmiyor, bu da projenin yeni aşamasını veya kurucu üyeleri gizli tutma stratejik tercihini vurguluyor. Anonimlikten bağımsız olarak, odak çerçevenin yetenekleri ve potansiyeli üzerinde kalıyor. Agent S'nin Yatırımcıları Kimlerdir? Agent S, kriptografik ekosistemde oldukça yeni olduğundan, yatırımcıları ve finansal destekçileri hakkında ayrıntılı bilgiler açıkça belgelenmemiştir. Projeyi destekleyen yatırım temelleri veya organizasyonları hakkında kamuya açık bilgilerdeki eksiklik, finansman yapısı ve gelişim yol haritası hakkında sorular doğuruyor. Destekleyicilerin anlaşılması, projenin sürdürülebilirliğini ve potansiyel pazar etkisini değerlendirmek için kritik öneme sahiptir. Agent S Nasıl Çalışır? Agent S'nin temelinde, çeşitli ortamlarda etkili bir şekilde çalışmasını sağlayan son teknoloji bir sistem yatmaktadır. İşleyiş modeli birkaç ana özellik etrafında inşa edilmiştir: İnsan Benzeri Bilgisayar Etkileşimi: Çerçeve, bilgisayarlarla etkileşimleri daha sezgisel hale getirmeyi amaçlayan gelişmiş AI planlaması sunar. Görev yürütmedeki insan davranışını taklit ederek, kullanıcı deneyimlerini yükseltmeyi vaat eder. Anlatı Belleği: Yüksek düzeyde deneyimlerden yararlanmak için kullanılan Agent S, görev geçmişlerini takip etmek amacıyla anlatı belleğini kullanarak karar verme süreçlerini geliştirir. Episodik Bellek: Bu özellik, kullanıcılara adım adım rehberlik sağlayarak, çerçevenin görevler gelişirken bağlamsal destek sunmasına olanak tanır. OpenACI Desteği: Yerel olarak çalışabilme yeteneği ile Agent S, kullanıcıların etkileşimleri ve iş akışları üzerinde kontrol sağlamasına olanak tanır ve Web3'ün merkeziyetsiz felsefesiyle uyumlu hale gelir. Dış API'lerle Kolay Entegrasyon: Çeşitli AI platformlarıyla uyumluluğu ve çok yönlülüğü, Agent S'nin mevcut teknolojik ekosistemlere sorunsuz bir şekilde entegre olmasını sağlar ve geliştiriciler ile organizasyonlar için cazip bir seçenek haline getirir. Bu işlevsellikler, Agent S'nin kripto alanındaki benzersiz konumuna katkıda bulunarak, karmaşık, çok aşamalı görevleri minimum insan müdahalesi ile otomatikleştirir. Proje geliştikçe, Web3'teki potansiyel uygulamaları dijital etkileşimlerin nasıl gelişeceğini yeniden tanımlayabilir. Agent S'nin Zaman Çizelgesi Agent S'nin gelişimi ve kilometre taşları, önemli olaylarını vurgulayan bir zaman çizelgesinde özetlenebilir: 27 Eylül 2024: Agent S'nin kavramı, “Bilgisayarları İnsan Gibi Kullanan Açık Bir Ajans Çerçevesi” başlıklı kapsamlı bir araştırma makalesi ile tanıtıldı ve projenin temelini sergiledi. 10 Ekim 2024: Araştırma makalesi arXiv'de kamuya açık olarak yayınlandı ve çerçevenin derinlemesine bir incelemesini ve OSWorld benchmark'ına dayalı performans değerlendirmesini sundu. 12 Ekim 2024: Agent S'nin yetenekleri ve özellikleri hakkında görsel bir içgörü sağlayan bir video sunumu yayımlandı ve potansiyel kullanıcılar ve yatırımcılarla daha fazla etkileşim sağlandı. Bu zaman çizelgesindeki işaretler, sadece Agent S'nin ilerlemesini değil, aynı zamanda şeffaflık ve topluluk katılımına olan bağlılığını da göstermektedir. Agent S Hakkında Ana Noktalar Agent S çerçevesi gelişmeye devam ederken, birkaç ana özellik öne çıkmakta ve yenilikçi doğasını ve potansiyelini vurgulamaktadır: Yenilikçi Çerçeve: İnsan etkileşimine benzer bir bilgisayar kullanımı sağlamak üzere tasarlanan Agent S, görev otomasyonuna yeni bir yaklaşım getiriyor. Otonom Etkileşim: GUI aracılığıyla bilgisayarlarla otonom olarak etkileşim kurabilme yeteneği, daha akıllı ve verimli hesaplama çözümlerine doğru bir sıçrama anlamına geliyor. Karmaşık Görev Otomasyonu: Sağlam metodolojisi ile karmaşık, çok aşamalı görevleri otomatikleştirerek süreçleri daha hızlı ve daha az hata payı ile gerçekleştirebilir. Sürekli İyileştirme: Öğrenme mekanizmaları, Agent S'nin geçmiş deneyimlerden öğrenmesini sağlar ve sürekli olarak performansını ve etkinliğini artırır. Çok Yönlülük: OSWorld ve WindowsAgentArena gibi farklı işletim ortamlarında uyumlu olması, geniş bir uygulama yelpazesine hizmet edebilmesini sağlar. Agent S, Web3 ve kripto alanında kendini konumlandırırken, etkileşim yeteneklerini artırma ve süreçleri otomatikleştirme potansiyeli, AI teknolojilerinde önemli bir ilerlemeyi temsil etmektedir. Yenilikçi çerçevesi aracılığıyla, Agent S dijital etkileşimlerin geleceğini örneklemekte ve çeşitli sektörlerde kullanıcılar için daha sorunsuz ve verimli bir deneyim vaat etmektedir. Sonuç Agent S, AI ve Web3'ün birleşiminde cesur bir sıçramayı temsil ediyor ve teknoloji ile etkileşim biçimimizi yeniden tanımlama kapasitesine sahip. Henüz erken aşamalarında olmasına rağmen, uygulama olanakları geniş ve çekici. Kritik zorlukları ele alan kapsamlı çerçevesi ile Agent S, otonom etkileşimleri dijital deneyimin ön plana çıkmasına taşımayı hedefliyor. Kripto para ve merkeziyetsizlik alanlarına daha derinlemesine girdikçe, Agent S gibi projelerin teknoloji ve insan-bilgisayar işbirliğinin geleceğini şekillendirmede önemli bir rol oynayacağı kesin.

510 Toplam GörüntülenmeYayınlanma 2025.01.14Güncellenme 2025.01.14

AGENT S Nedir

S Nasıl Satın Alınır

HTX.com’a hoş geldiniz! Sonic (S) satın alma işlemlerini basit ve kullanışlı bir hâle getirdik. Adım adım açıkladığımız rehberimizi takip ederek kripto yolculuğunuza başlayın. 1. Adım: HTX Hesabınızı OluşturunHTX'te ücretsiz bir hesap açmak için e-posta adresinizi veya telefon numaranızı kullanın. Sorunsuzca kaydolun ve tüm özelliklerin kilidini açın. Hesabımı Aç2. Adım: Kripto Satın Al Bölümüne Gidin ve Ödeme Yönteminizi SeçinKredi/Banka Kartı: Visa veya Mastercard'ınızı kullanarak anında Sonic (S) satın alın.Bakiye: Sorunsuz bir şekilde işlem yapmak için HTX hesap bakiyenizdeki fonları kullanın.Üçüncü Taraflar: Kullanımı kolaylaştırmak için Google Pay ve Apple Pay gibi popüler ödeme yöntemlerini ekledik.P2P: HTX'teki diğer kullanıcılarla doğrudan işlem yapın.Borsa Dışı (OTC): Yatırımcılar için kişiye özel hizmetler ve rekabetçi döviz kurları sunuyoruz.3. Adım: Sonic (S) Varlıklarınızı SaklayınSonic (S) satın aldıktan sonra HTX hesabınızda saklayın. Alternatif olarak, blok zinciri transferi yoluyla başka bir yere gönderebilir veya diğer kripto para birimlerini takas etmek için kullanabilirsiniz.4. Adım: Sonic (S) Varlıklarınızla İşlem YapınHTX'in spot piyasasında Sonic (S) ile kolayca işlemler yapın.Hesabınıza erişin, işlem çiftinizi seçin, işlemlerinizi gerçekleştirin ve gerçek zamanlı olarak izleyin. Hem yeni başlayanlar hem de deneyimli yatırımcılar için kullanıcı dostu bir deneyim sunuyoruz.

1.4k Toplam GörüntülenmeYayınlanma 2025.01.15Güncellenme 2025.03.21

S Nasıl Satın Alınır

Tartışmalar

HTX Topluluğuna hoş geldiniz. Burada, en son platform gelişmeleri hakkında bilgi sahibi olabilir ve profesyonel piyasa görüşlerine erişebilirsiniz. Kullanıcıların S (S) fiyatı hakkındaki görüşleri aşağıda sunulmaktadır.

活动图片