El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA afirman ser un modelo del mundo, necesitamos una taxonomía

链捕手Publicado a 2026-07-05Actualizado a 2026-07-05

Resumen

En su último artículo, Fei-Fei Li aborda la confusión actual en torno al término "modelo del mundo" en IA. Propone una clasificación funcional basada en el ciclo clásico de POMDP (agente → acción → estado → observación → agente), distinguiendo tres tipos: 1. **Renderizador:** Genera observaciones (píxeles) visualmente fieles para humanos, como los modelos de generación de video (ej. Sora). Su métrica clave es la calidad visual, pero puede carecer de precisión física. 2. **Simulador:** Genera el *estado* subyacente del mundo: representaciones geométricas y físicamente precisas (geometría, dinámica). Sirve tanto para visualización profesional como para entrenar agentes de IA o robots en entornos virtuales. Li argumenta que es el componente crucial y más subestimado, pues es la base para los otros dos. 3. **Planificador:** Genera *acciones*. Dada una observación y un objetivo, decide qué debe hacer un agente (ej., un robot). Es esencial para cerrar el ciclo percepción-acción. Li señala que estos tres tipos comparten un conocimiento subyacente común sobre el mundo. El campo avanza hacia su fusión, como se ve en modelos que combinan renderizado y simulación (ej., Marble de World Labs). El objetivo final es un "modelo del mundo" unificado capaz de alternar entre estas funciones según sea necesario, lo que redefiniría la inteligencia espacial y la interacción de la máquina con el mundo físico.

Autor: Fei-Fei Li

Compilación: Jiayang

“Modelo del mundo” es probablemente el concepto más popular y confuso en el campo de la IA desde 2025. Cuando salió Sora, OpenAI lo llamó un simulador del mundo; Genie, que te permite moverte en las imágenes generadas, también se llama modelo del mundo; las empresas de robótica dicen que están haciendo modelos del mundo, NVIDIA dice que Omniverse es la infraestructura para los modelos del mundo, e incluso los motores de juegos se han sumado a esta narrativa. Todos usan la misma palabra, pero cada uno habla de algo completamente diferente.

Hoy, Fei-Fei Li publicó un nuevo artículo en su Substack personal, aclarando este concepto. Primero vuelve al diagrama clásico de los libros de texto de aprendizaje por refuerzo (el ciclo POMDP: agente → acción → estado → observación → agente) y luego señala: las cosas que ahora se llaman “modelo del mundo” son en realidad tres proyecciones diferentes de este ciclo cerrado. El que emite píxeles (observaciones) es el renderizador; el que emite estados es el simulador; el que emite acciones es el planificador. El criterio de clasificación es muy sencillo: depende de qué parte del ciclo cierra.

(Fuente: MIT Technology Review)

Ella concluye que, de los tres, el renderizador es el más maduro comercialmente pero tiene un límite (que algo se vea bien no significa que sea físicamente correcto), el planificador es el más emocionante pero el más alejado de un despliegue real (la brecha entre una demostración de laboratorio y la usabilidad real sigue siendo enorme), y el simulador es el eslabón clave infravalorado. Porque el simulador trabaja a nivel de geometría, física y dinámica, pudiendo proyectarse hacia arriba como píxeles para consumo humano, o hacia abajo para deducir las consecuencias de las acciones para uso de robots. Dominar la simulación significa tener al mismo tiempo la base para la renderización y la planificación; lo contrario no es cierto.

Este artículo es también el manifiesto del producto de World Labs. Su Marble ya está emitiendo al mismo tiempo splats gaussianos y mallas de colisión, intentando unificar el renderizador y el simulador en un solo modelo. Al final del artículo se describe una meta final: un modelo base unificado del mundo, capaz de cambiar libremente entre renderización, simulación y planificación según las necesidades posteriores. Que esta visión se haga realidad o no es otra cuestión, pero como marco analítico, la triple división de renderizador/simulador/planificador quizás sí ayude a atravesar parte del ruido actual en torno al concepto de “modelo del mundo”.

Traducción completa a continuación.

“El mundo es la totalidad de los hechos.” — Wittgenstein, *Tractatus Logico-Philosophicus*, 1921

El mundo no está hecho de palabras.

En un artículo anterior, propusimos que la inteligencia espacial es la próxima frontera de la IA, y que los modelos del mundo son el camino hacia ella. Aquí, el equipo de World Labs y yo queremos profundizar un paso más: de las muchas cosas hoy denominadas “modelos del mundo”, ¿qué módulos funcionales constituyen realmente esta capacidad? ¿Y para qué sirve cada uno?

Los modelos de lenguaje han dotado a las máquinas de un poderoso control sobre conceptos, vocabulario y razonamiento, pero el mundo físico, ya sea virtual o real, funciona sobre una base completamente diferente. Los modelos de lenguaje aprenden la estructura estadística del texto; los modelos del mundo aprenden la estructura estadística del espacio y el tiempo: cómo cae la luz sobre una superficie, cómo se ve un jardín desde un ángulo nunca captado por una cámara, cómo responden los objetos a las fuerzas y siguen las leyes de la física.

Esto convierte a “modelo del mundo” en uno de los términos más importantes y, a la vez, más abusados en el campo actual de la IA. La visión por computadora, la robótica, el aprendizaje por refuerzo y la IA generativa afirman estar construyendo modelos del mundo, pero cada uno se refiere a algo radicalmente distinto. Un modelo de vídeo que genera llamas espléndidas pero físicamente imposibles, un modelo de lenguaje que improvisa un juego jugable, un motor físico que simula fielmente el proceso de combustión, todos reciben el mismo nombre.

Los antiguos griegos nunca pudieron ponerse de acuerdo sobre de qué estaba hecho el mundo, ya fuera fuego, agua o átomos indivisibles, porque “el mundo” nunca fue una sola cosa. Siempre fue un sustituto que un pensador usaba para razonar sobre cierta totalidad. La IA hereda el mismo problema, y justo cuando el campo más necesita precisión.

El ciclo detrás de la taxonomía

Para aclarar este caos, se puede empezar con un diagrama más antiguo que todas las tecnologías anteriores. Todos los libros de texto de aprendizaje por refuerzo, incluido el clásico de Sutton y Barto, han utilizado durante décadas variantes del mismo gráfico para describir cómo un agente interactúa con el mundo. El nombre formal es Proceso de Decisión de Markov Parcialmente Observable (POMDP), y la definición original del término “modelo del mundo” pertenece a esta tradición.

Un agente (puede ser una persona, un robot o un sistema de software) ejecuta una acción. Esa acción cambia el estado del mundo. Pero el agente nunca ve el estado directamente; lo que recibe es una observación: los fotones que llegan a la retina, las lecturas de los sensores, los píxeles en un fotograma de vídeo. La nueva observación guía una nueva acción, y así sucesivamente.

La palabra “estado” necesita desglosarse, porque su significado cambia en diferentes campos. Aquí no hablamos del estado del químico, ni de la diferencia entre sólido, líquido y gaseoso. Aquí hablamos del estado del físico y el robótico: la descripción completa de todo lo que ocurre en el mundo en un momento dado, incluyendo cada objeto, cada posición, cada velocidad, cada propiedad. El estado es la realidad subyacente del mundo, en principio completa, pero siempre inobservable directamente para cualquier agente dentro de él. La observación es la perspectiva parcial de ese agente sobre esa realidad. La acción es la respuesta del agente en consecuencia.

Este ciclo (agente → acción → estado → observación → agente) es precisamente la estructura que da su significado técnico al término “modelo del mundo”. La frase en sí es más antigua, remontándose a la propuesta de Kenneth Craik en 1943 de que la mente razona ejecutando “modelos a pequeña escala” de la realidad, y a finales de los 80 y principios de los 90, el concepto se introdujo en el campo de las redes neuronales. Este ciclo también explica lo que la gente quiere decir hoy cuando usa el término. Las diversas cosas ahora llamadas modelos del mundo son, en realidad, diferentes proyecciones del mismo ciclo, cada una emitiendo una parte diferente de él.

Tres funciones de los modelos del mundo

El primer tipo de modelo del mundo es el **renderizador**. El renderizador emite **observaciones**, concretamente píxeles destinados al ojo humano, y la métrica de calidad más importante es la fidelidad visual. Un modelo de vídeo que convierte un prompt de texto en tomas aéreas de calidad cinematográfica es un renderizador; sistemas interactivos como Genie 3 de Google o el propio RTFM de World Labs también son renderizadores, generan imágenes en tiempo real basándose en la entrada del usuario. Este tipo de modelo no tiene una comprensión explícita de la estructura tridimensional. Genera lo que un observador vería, no cómo son las cosas en sí. Un edificio en una toma aérea puede parecer perfecto desde el aire, pero intente caminar por la ciudad debajo y se derrumbará.

El segundo tipo es el **simulador**. El simulador emite **estados**: una representación del mundo fiel en términos de geometría, física o dinámica, sobre la que tanto humanos como programas informáticos pueden calcular e interactuar. El contrato del renderizador es puramente visual; el del simulador es estructural, exige que la geometría se sostenga, que la física siga las leyes de Newton, que la dinámica se comporte como dictan las leyes físicas. El simulador sirve a dos tipos de usuarios. Profesionales como arquitectos, diseñadores, cineastas y desarrolladores de videojuegos necesitan precisión más allá de la credibilidad visual. Programas informáticos como agentes de aprendizaje por refuerzo, controladores robóticos o vehículos autónomos usan el simulador como campo de entrenamiento, interactuando con el mundo a gran escala, probando escenarios que en la realidad serían peligrosos, caros o directamente imposibles de ejecutar.

El tercer tipo es el **planificador**. El planificador emite **acciones**. Dada una observación y un objetivo, el planificador responde a la pregunta: ¿qué debe hacer el agente a continuación? En muchos sentidos, el planificador es el proceso inverso del renderizador. El renderizador toma acciones como entrada y produce observaciones; el planificador toma observaciones como entrada y produce acciones, cerrando así el ciclo percepción-acción. Los modelos visual-lenguaje-acción (VLA), los sistemas basados en modelos y la nueva ola de Modelos de Acción del Mundo (World Action Models) son diferentes intentos de planificación: permitir que un sistema decida qué debe hacer un robot en un mundo no estructurado.

Estas tres categorías cubren la mayor parte del trabajo que actualmente se está implementando, y su distinción es útil en la práctica. Pero no están fundamentalmente separadas. Comparten el mismo conocimiento subyacente sobre cómo funciona el mundo: geometría, física, dinámica. Un modelo que puede renderizar una taza desde cualquier ángulo debería, en principio, poder también simular qué pasa si la taza es empujada y planificar que una mano la recoja. Cada vez más investigaciones interesantes están difuminando intencionadamente los límites entre estas tres.

Diagrama | Tres tipos de modelos del mundo (Fuente: Substack)

Por qué la simulación es el eslabón clave

De las tres categorías, el simulador recibe la menor atención pública, pero es la más importante de las tres. Este artículo quiere corregir esa asimetría.

El **renderizador** es actualmente el más maduro comercialmente. Numerosos productos de imagen-a-vídeo o texto-a-vídeo se están expandiendo rápidamente en los mercados de consumo y empresarial. El modelo Nano Banana de Google lleva capacidades de generación de imágenes a nivel de renderizador a cientos de millones de usuarios potenciales. La tecnología es real, y el mercado también. Sin embargo, el objetivo de optimización del renderizador es la credibilidad visual, no la precisión física, y este límite es importante. Su salida es hermosa, pero no se puede usar para diseñar un edificio o entrenar un robot.

El **planificador** es el más emocionante y menos maduro, y está estrechamente ligado al campo del aprendizaje robótico en rápida evolución. En los últimos dos años, este campo ha producido varias demostraciones robóticas impresionantes en vídeo, pero debemos ser honestos sobre lo que realmente muestran estas demostraciones. Casi todas están limitadas a entornos de laboratorio altamente restringidos, con un conjunto limitado de objetos y tareas de corta duración. Ninguna ha sido probada frente a la complejidad, diversidad y duración que exige un despliegue en el mundo real. La brecha entre un vídeo de demostración impresionante y un robot que funcione de manera fiable en una cocina, un almacén o un quirófano sigue siendo enorme.

Aun así, la apuesta comercial es considerable. Una ola de nuevos participantes bien financiados compite por lanzar sistemas de planificación general, mientras que los grandes actores de infraestructura están construyendo capacidades de planificación sobre pilas de simulación más amplias.

La **simulación** es el puente que los conecta. Si el lenguaje es una abstracción del mundo y los píxeles una proyección del mundo, entonces la geometría, la física y la dinámica son **el mundo mismo**. El simulador debe funcionar a este nivel: es el esqueleto estructural a partir del cual se pueden deducir tanto la apariencia visual (para el renderizador) como las consecuencias de las acciones (para el planificador).

Un modelo que domina la simulación puede proyectar su comprensión en píxeles para consumo humano o en predicciones de acciones para un agente encarnado. Un modelo que solo domina la renderización o solo la planificación no puede hacer ninguna de las dos cosas. El espacio comercial aquí es inmenso. Solo Omniverse de NVIDIA, según estimaciones de la empresa, tiene un mercado objetivo de más de un billón de dólares, abarcando fábricas, almacenes, cadenas de suministro y gemelos digitales. El entrenamiento de robots, las pruebas de conducción autónoma, la visualización arquitectónica, la ingeniería de diseño, el descubrimiento de fármacos, todos dependen de alguna forma de simulación.

Las preguntas abiertas más difíciles del campo también se concentran aquí. Los datos 3D con geometría explícita, atributos de material y anotaciones físicas son varios órdenes de magnitud más escasos que los vídeos de Internet usados para entrenar renderizadores. La brecha simulación-realidad (sim-to-real gap) (la diferencia entre el comportamiento de los objetos en simulación y en el mundo real) persiste. Los simuladores generativos introducen además nuevos riesgos: una geometría generada por IA puede parecer correcta, pero contener autointersecciones o proporciones erróneas, causando resultados absurdos en la simulación física. El coste computacional de la simulación multifísica a gran escala (cuerpos rígidos, deformables, fluidos, tela interactuando simultáneamente) sigue siendo órdenes de magnitud mayor que la simulación de un solo dominio.

En World Labs, **Marble** es nuestro primer paso en esta dirección. Acepta entradas multimodales (texto, imagen, vídeo o boceto espacial), genera entornos 3D explorables y emite simultáneamente splats gaussianos (Gaussian splats) para exploración visual y mallas de colisión para operación por motores físicos. Pero Marble es solo el primer capítulo de un largo arco. A medida que los límites entre renderización, simulación y planificación comienzan a desdibujarse, todo el campo está escribiendo esta historia.

Los límites se difuminan, y lo que viene después

La tendencia más importante en este campo actualmente es que las tres categorías están empezando a fusionarse. El consenso subyacente es: el conocimiento necesario para renderizar un mundo, simularlo y actuar en él es en gran medida el mismo. Siguiendo el ejemplo anterior, un modelo que realmente comprenda cómo se coloca una taza sobre una mesa (su geometría, propiedades del material, respuesta a fuerzas, etc.) debería poder renderizar esa taza desde cualquier ángulo, simular qué pasa si se empuja y planificar que una mano la recoja. Las tres categorías son tres proyecciones de una misma comprensión subyacente.

Por ejemplo, recientemente ha habido una cantidad pequeña pero creciente de trabajos de diferentes laboratorios de robótica que muestran una posibilidad al menos conceptual: un renderizador de vídeo preentrenado puede servir como red troncal para la predicción conjunta del mundo y de las acciones, permitiendo que un solo modelo imagine tanto “qué pasará” como “qué hacer”, tendiendo así un puente entre renderizador y planificador. Marble de World Labs ya puede emitir simultáneamente splats gaussianos y mallas de colisión desde un solo modelo, disolviendo el límite entre renderizador y simulador. En todos los niveles se está pasando de la salida pasiva a sistemas interactivos: los renderizadores responden a condiciones de acción, los mundos generados por simuladores se vuelven más controlables y editables, los planificadores comienzan a razonar deliberativamente en lugar de solo reaccionar.

El punto final lógico es un **modelo unificado del mundo**: un modelo base capaz de renderizar vistas fotorrealistas, generar estructuras físicamente precisas, planificar secuencias de acciones y cambiar entre diferentes modalidades de salida según las necesidades del usuario final. Seguiremos enfrentándonos a una serie de desafíos formidables. El panorama de datos está muy desequilibrado: los renderizadores tienen abundantes vídeos de Internet, mientras que los simuladores y planificadores sufren una grave escasez de activos 3D y datos de demostración robótica. La optimización para el atractivo visual puede sacrificar la precisión requerida por la robótica o la simulación de alta fidelidad. Conciliar estas tensiones dentro de una única arquitectura es el problema abierto central de la investigación actual sobre modelos del mundo, y en lo que World Labs se centra a medida que evoluciona Marble.

(Fuente: Substack)

Pero la dirección general ya está clara. Desde finales de los años 80 hasta hoy, el campo ha apostado siempre por lo mismo: si el modelo del mundo es lo suficientemente rico, contendrá todo lo que un agente necesita para ver el mundo, construirlo y actuar en él. Esta apuesta está impulsando ahora toda una generación de investigación. Y lo que realmente le da peso es la fusión que ya está ocurriendo: las tres líneas de renderización, simulación y planificación, cada una ya sostiene industrias de miles de millones de dólares, comenzaron como direcciones de investigación independientes y ahora están convergiendo. Cuando los límites desaparecen, la confluencia de las tres redefinirá algo mayor: la relación entre la inteligencia de la máquina y el mundo físico en el que habita, es decir, el camino a largo plazo de la inteligencia espacial.

El lenguaje le dio a la máquina una forma de hablar sobre el mundo. Los modelos del mundo son el camino por el que la máquina finalmente puede llegar a comprender, imaginar, razonar e interactuar con él.

Referencias:1.https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models

Criptos en tendencia

Preguntas relacionadas

QSegún el artículo de Fei-Fei Li, ¿qué es un 'renderizador' en el contexto de los modelos de mundo y qué limita su utilidad?

AUn 'renderizador' es un tipo de modelo de mundo que genera observaciones, específicamente píxeles visuales para el ojo humano. Su principal métrica de calidad es la fidelidad visual, y se usa en modelos que crean videos o imágenes a partir de texto. Su limitación principal es que optimiza la credibilidad visual, no la precisión física, por lo que sus resultados, aunque estéticos, no pueden usarse para diseñar estructuras o entrenar robots, ya que carecen de una comprensión estructural y física correcta del mundo.

Q¿Qué es un 'simulador' según la taxonomía presentada por Li Fei-Fei y por qué se considera un 'centro de conexión' clave?

AUn 'simulador' es un modelo de mundo que genera estados del mundo, es decir, representaciones fieles en términos de geometría, física y dinámica. Se considera un 'centro de conexión' clave porque funciona en el nivel estructural fundamental del mundo (geometría, física). Desde esta comprensión estructural, puede proyectarse hacia arriba para generar píxeles para humanos (renderizado) y hacia abajo para predecir consecuencias de acciones para agentes físicos o robots (planificación). Por tanto, un modelo que domina la simulación tiene la base para la renderización y la planificación, pero lo inverso no es cierto.

Q¿Cómo define el artículo a un 'planificador' dentro de los tres tipos de modelos de mundo?

AUn 'planificador' es un modelo de mundo que genera acciones. Dada una observación y un objetivo, el planificador responde a la pregunta de qué debe hacer el agente a continuación. En cierto sentido, es el proceso inverso a un renderizador. Los modelos visual-lenguaje-acción (VLA), los sistemas basados en modelos y los nuevos modelos de acción de mundo (World Action Models) son ejemplos de intentos de crear planificadores que permitan a los sistemas decidir acciones en entornos no estructurados.

QSegún el artículo, ¿cuál es la tendencia más importante actualmente en el campo de los modelos de mundo y cuál es el 'punto final lógico'?

ALa tendencia más importante es la fusión de las tres categorías (renderizador, simulador, planificador). El consenso es que el conocimiento necesario para renderizar un mundo, simularlo y actuar en él es en gran medida el mismo. El 'punto final lógico' es un modelo de mundo unificado: un modelo base capaz de renderizar vistas fotorrealistas, generar estructuras físicamente precisas y planificar secuencias de acciones, cambiando entre estas modalidades de salida según las necesidades del usuario final.

Q¿Qué desafíos importantes enfrenta el desarrollo de modelos de mundo unificados, según se menciona en el artículo?

ALos desafíos clave son: 1) Desequilibrio en los datos: los renderizadores tienen abundancia de videos de Internet, pero los simuladores y planificadores sufren una grave escasez de datos 3D anotados y demostraciones robóticas. 2) Conflicto de optimización: la optimización para la estética visual puede sacrificar la precisión requerida para la robótica o simulaciones de alta fidelidad. 3) La brecha 'sim-to-real': las diferencias entre el comportamiento en la simulación y en el mundo real. 4) El alto costo computacional de las simulaciones multiphysics a gran escala.

Lecturas Relacionadas

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA se autodenominan modelos del mundo, necesitamos una taxonomía

El artículo de Fei-Fei Li clarifica el término "modelo del mundo", utilizado de manera confusa en IA, proponiendo una taxonomía basada en el ciclo POMDP (Proceso de Decisión de Markov Parcialmente Observable). Identifica tres categorías funcionales: 1) **Renderizador**: genera observaciones (píxeles) visualmente fieles para humanos, como los modelos de video Sora o Genie, pero sin comprensión física precisa. 2) **Simulador**: produce estados del mundo con precisión geométrica, física y dinámica, sirviendo tanto para visualización profesional como para entrenamiento de agentes (robots, vehículos autónomos). 3) **Planificador**: deduce acciones a partir de observaciones y objetivos, cerrando el ciclo percepción-acción, como los modelos de lenguaje-visión-acción (VLA). El artículo argumenta que el simulador es el componente clave y subestimado, pues proporciona la base estructural para la renderización y la planificación. Mientras los renderizadores tienen madurez comercial pero limitaciones físicas, y los planificadores son prometedores pero inmaduros para despliegues reales, los simuladores abarcan aplicaciones cruciales en robótica, diseño y digitalización. La tendencia actual es la fusión de estas categorías, impulsada por la idea de que comparten conocimiento subyacente. Modelos como Marble de World Labs ejemplifican esta convergencia, generando tanto representaciones visuales (splats gaussianos) como mallas para simulación física. La visión final es un **modelo del mundo unificado** capaz de alternar entre renderizar, simular y planificar según la necesidad, avanzando hacia una inteligencia espacial que permita a las máquinas entender e interactuar con el mundo físico.

marsbitHace 1 hora(s)

El último artículo de Fei-Fei Li: Cuando la generación de vídeo, la robótica y NVIDIA se autodenominan modelos del mundo, necesitamos una taxonomía

marsbitHace 1 hora(s)

Especial de Forbes: Las remesas transfronterizas con stablecoins son más rápidas, pero aún no más baratas

**Los pagos transfronterizos con stablecoins son más rápidos, pero aún no más baratos** El sector de pagos transfronterizos con stablecoins está creciendo rápidamente, con tecnología disponible, mejoras regulatorias y mayor volumen de transacciones. Sin embargo, aunque estas transacciones son más rápidas, accesibles y fiables, aún no han cumplido su promesa de ser más baratas. La diferencia de costos es clara: los corredores de divisas tradicionales suelen cobrar entre 60 y 70 puntos básicos por pagos a proveedores internacionales, mientras que las stablecoins prometen reducirlos a solo 2-5 puntos básicos. El problema actual es la falta de pools de liquidez suficientemente profundos y escalados para materializar este ahorro. Según Imran Ahmad de Bitso Business, hasta que los bancos e instituciones inyecten liquidez masiva en estos canales, la ventaja de coste seguirá siendo teórica. Un obstáculo clave para la adopción en pagos B2B es la confianza. Los importadores establecidos suelen confiar en sus agentes de divisas de larga data, una relación personal que las soluciones tecnológicas aún deben superar. Como explica Ezra Kebrab de Caliza, no se trata solo de ser más rápido y barato, sino de garantizar fiabilidad y cumplimiento en cada transacción. Las empresas exitosas en este espacio no buscan reemplazar la infraestructura existente como SWIFT, sino complementarla. Caliza, por ejemplo, utiliza stablecoins pero aún canaliza muchas transacciones a través de SWIFT para garantizar la precisión en datos críticos como números de identificación fiscal, evitando retrasos en aduanas. Este enfoque híbrido ha impulsado un crecimiento mensual sostenido superior al 40%. El futuro del sector dependerá de quién logre consolidar tres pilares fundamentales: licencias regulatorias, acceso sólido a canales de moneda fiduciaria y liquidez profunda. Sin ellos, las empresas corren el riesgo de ser meros intermediarios. Ahmad prevé una inevitable consolidación en el sector, donde solo las empresas con estas bases sólidas sobrevivirán y prosperarán.

marsbitHace 2 hora(s)

Especial de Forbes: Las remesas transfronterizas con stablecoins son más rápidas, pero aún no más baratas

marsbitHace 2 hora(s)

Especial de Forbes: los pagos transfronterizos con stablecoins son más rápidos, pero aún no más baratos

Los pagos transfronterizos con stablecoins están creciendo rápidamente, ofreciendo velocidad, accesibilidad y disponibilidad 24/7, pero aún no cumplen la promesa de ser más baratos. Aunque las stablecoins prometen reducir las comisiones de 60-70 puntos básicos que cobran los agentes de divisas tradicionales a solo 2-5, la ventaja de coste sigue siendo teórica. Según Imran Ahmad de Bitso Business, se necesitan grupos de liquidez más profundos y la entrada de instituciones para que los precios bajen realmente. La adopción en pagos B2B enfrenta el gran obstáculo de la confianza en relaciones comerciales tradicionales de larga data. Ezra Kebrab, CEO de Caliza, enfatiza que no solo se trata de ser rápido y barato, sino de garantizar que los pagos a proveedores se realicen correctamente para evitar problemas como retenciones aduaneras. Empresas exitosas como Caliza, que trabaja con clientes desde agentes aduaneros hasta procesadores de pago globales, ven las stablecoins como un complemento, no un reemplazo, de sistemas como SWIFT, valorando los estándares establecidos para pagos a proveedores. Caliza ha experimentado un crecimiento mensual superior al 40%. Ahmad prevé una consolidación en el sector, donde la clave para sobrevivir será poseer licencias, acceso a canales fiduciarios y liquidez. Sin estos elementos fundamentales, una empresa sería meramente un intermediario.

链捕手Hace 2 hora(s)

Especial de Forbes: los pagos transfronterizos con stablecoins son más rápidos, pero aún no más baratos

链捕手Hace 2 hora(s)

Trading

Spot

Artículos destacados

Qué es $S$

Entendiendo SPERO: Una Visión General Completa Introducción a SPERO A medida que el panorama de la innovación sigue evolucionando, la aparición de tecnologías web3 y proyectos de criptomonedas juega un papel fundamental en la configuración del futuro digital. Un proyecto que ha llamado la atención en este campo dinámico es SPERO, denotado como SPERO,$$s$. Este artículo tiene como objetivo recopilar y presentar información detallada sobre SPERO, para ayudar a entusiastas e inversores a comprender sus fundamentos, objetivos e innovaciones dentro de los dominios web3 y cripto. ¿Qué es SPERO,$$s$? SPERO,$$s$ es un proyecto único dentro del espacio cripto que busca aprovechar los principios de descentralización y tecnología blockchain para crear un ecosistema que promueva la participación, la utilidad y la inclusión financiera. El proyecto está diseñado para facilitar interacciones entre pares de nuevas maneras, proporcionando a los usuarios soluciones y servicios financieros innovadores. En su esencia, SPERO,$$s$ tiene como objetivo empoderar a los individuos al proporcionar herramientas y plataformas que mejoren la experiencia del usuario en el espacio de las criptomonedas. Esto incluye habilitar métodos de transacción más flexibles, fomentar iniciativas impulsadas por la comunidad y crear caminos para oportunidades financieras a través de aplicaciones descentralizadas (dApps). La visión subyacente de SPERO,$$s$ gira en torno a la inclusividad, buscando cerrar brechas dentro de las finanzas tradicionales mientras aprovecha los beneficios de la tecnología blockchain. ¿Quién es el Creador de SPERO,$$s$? La identidad del creador de SPERO,$$s$ sigue siendo algo oscura, ya que hay recursos públicos limitados que proporcionan información de fondo detallada sobre su(s) fundador(es). Esta falta de transparencia puede derivarse del compromiso del proyecto con la descentralización, una ética que muchos proyectos web3 comparten, priorizando las contribuciones colectivas sobre el reconocimiento individual. Al centrar las discusiones en torno a la comunidad y sus objetivos colectivos, SPERO,$$s$ encarna la esencia del empoderamiento sin señalar a individuos específicos. Como tal, entender la ética y la misión de SPERO es más importante que identificar a un creador singular. ¿Quiénes son los Inversores de SPERO,$$s$? SPERO,$$s$ cuenta con el apoyo de una diversa gama de inversores que van desde capitalistas de riesgo hasta inversores ángeles dedicados a fomentar la innovación en el sector cripto. El enfoque de estos inversores generalmente se alinea con la misión de SPERO, priorizando proyectos que prometen avances tecnológicos sociales, inclusividad financiera y gobernanza descentralizada. Estas fundaciones de inversores suelen estar interesadas en proyectos que no solo ofrecen productos innovadores, sino que también contribuyen positivamente a la comunidad blockchain y sus ecosistemas. El respaldo de estos inversores refuerza a SPERO,$$s$ como un contendiente notable en el rápidamente evolutivo dominio de los proyectos cripto. ¿Cómo Funciona SPERO,$$s$? SPERO,$$s$ emplea un marco multifacético que lo distingue de los proyectos de criptomonedas convencionales. Aquí hay algunas de las características clave que subrayan su singularidad e innovación: Gobernanza Descentralizada: SPERO,$$s$ integra modelos de gobernanza descentralizada, empoderando a los usuarios para participar activamente en los procesos de toma de decisiones sobre el futuro del proyecto. Este enfoque fomenta un sentido de propiedad y responsabilidad entre los miembros de la comunidad. Utilidad del Token: SPERO,$$s$ utiliza su propio token de criptomoneda, diseñado para servir a diversas funciones dentro del ecosistema. Estos tokens permiten transacciones, recompensas y la facilitación de servicios ofrecidos en la plataforma, mejorando la participación y utilidad general. Arquitectura en Capas: La arquitectura técnica de SPERO,$$s$ soporta la modularidad y escalabilidad, permitiendo la integración fluida de características y aplicaciones adicionales a medida que el proyecto evoluciona. Esta adaptabilidad es fundamental para mantener la relevancia en el siempre cambiante paisaje cripto. Participación de la Comunidad: El proyecto enfatiza iniciativas impulsadas por la comunidad, empleando mecanismos que incentivan la colaboración y la retroalimentación. Al nutrir una comunidad sólida, SPERO,$$s$ puede abordar mejor las necesidades de los usuarios y adaptarse a las tendencias del mercado. Enfoque en la Inclusión: Al ofrecer tarifas de transacción bajas y interfaces amigables para el usuario, SPERO,$$s$ busca atraer a una base de usuarios diversa, incluyendo a individuos que anteriormente pueden no haber participado en el espacio cripto. Este compromiso con la inclusión se alinea con su misión general de empoderamiento a través de la accesibilidad. Cronología de SPERO,$$s$ Entender la historia de un proyecto proporciona información crucial sobre su trayectoria de desarrollo y hitos. A continuación, se presenta una cronología sugerida que mapea eventos significativos en la evolución de SPERO,$$s$: Fase de Conceptualización e Ideación: Las ideas iniciales que forman la base de SPERO,$$s$ fueron concebidas, alineándose estrechamente con los principios de descentralización y enfoque comunitario dentro de la industria blockchain. Lanzamiento del Whitepaper del Proyecto: Tras la fase conceptual, se publicó un whitepaper completo que detalla la visión, objetivos e infraestructura tecnológica de SPERO,$$s$ para generar interés y retroalimentación de la comunidad. Construcción de Comunidad y Primeras Interacciones: Se realizaron esfuerzos de divulgación activa para construir una comunidad de primeros adoptantes e inversores potenciales, facilitando discusiones en torno a los objetivos del proyecto y obteniendo apoyo. Evento de Generación de Tokens: SPERO,$$s$ llevó a cabo un evento de generación de tokens (TGE) para distribuir sus tokens nativos a los primeros seguidores y establecer liquidez inicial dentro del ecosistema. Lanzamiento de la dApp Inicial: La primera aplicación descentralizada (dApp) asociada con SPERO,$$s$ se puso en marcha, permitiendo a los usuarios interactuar con las funcionalidades centrales de la plataforma. Desarrollo Continuo y Alianzas: Actualizaciones y mejoras continuas en las ofertas del proyecto, incluyendo alianzas estratégicas con otros actores en el espacio blockchain, han moldeado a SPERO,$$s$ en un jugador competitivo y en evolución en el mercado cripto. Conclusión SPERO,$$s$ se erige como un testimonio del potencial de web3 y las criptomonedas para revolucionar los sistemas financieros y empoderar a los individuos. Con un compromiso con la gobernanza descentralizada, la participación comunitaria y funcionalidades diseñadas de manera innovadora, allana el camino hacia un paisaje financiero más inclusivo. Como con cualquier inversión en el rápidamente evolutivo espacio cripto, se anima a los potenciales inversores y usuarios a investigar a fondo y participar de manera reflexiva con los desarrollos en curso dentro de SPERO,$$s$. El proyecto muestra el espíritu innovador de la industria cripto, invitando a una exploración más profunda de sus innumerables posibilidades. Aunque el viaje de SPERO,$$s$ aún se está desarrollando, sus principios fundamentales pueden, de hecho, influir en el futuro de cómo interactuamos con la tecnología, las finanzas y entre nosotros en ecosistemas digitales interconectados.

133 Vistas totalesPublicado en 2024.12.17Actualizado en 2024.12.17

Qué es $S$

Qué es AGENT S

Agent S: El Futuro de la Interacción Autónoma en Web3 Introducción En el paisaje en constante evolución de Web3 y las criptomonedas, las innovaciones están redefiniendo continuamente cómo los individuos interactúan con las plataformas digitales. Uno de estos proyectos pioneros, Agent S, promete revolucionar la interacción humano-computadora a través de su marco agente abierto. Al allanar el camino para interacciones autónomas, Agent S tiene como objetivo simplificar tareas complejas, ofreciendo aplicaciones transformadoras en inteligencia artificial (IA). Esta exploración detallada se adentrará en las complejidades del proyecto, sus características únicas y las implicaciones para el dominio de las criptomonedas. ¿Qué es Agent S? Agent S se presenta como un marco agente abierto revolucionario, diseñado específicamente para abordar tres desafíos fundamentales en la automatización de tareas informáticas: Adquisición de Conocimiento Específico del Dominio: El marco aprende de manera inteligente a partir de diversas fuentes de conocimiento externas y experiencias internas. Este enfoque dual le permite construir un rico repositorio de conocimiento específico del dominio, mejorando su rendimiento en la ejecución de tareas. Planificación a Largo Plazo de Tareas: Agent S emplea planificación jerárquica aumentada por la experiencia, un enfoque estratégico que facilita la descomposición y ejecución eficiente de tareas intrincadas. Esta característica mejora significativamente su capacidad para gestionar múltiples subtareas de manera eficiente y efectiva. Manejo de Interfaces Dinámicas y No Uniformes: El proyecto introduce la Interfaz Agente-Computadora (ACI), una solución innovadora que mejora la interacción entre agentes y usuarios. Utilizando Modelos de Lenguaje Multimodal Grandes (MLLMs), Agent S puede navegar y manipular diversas interfaces gráficas de usuario sin problemas. A través de estas características pioneras, Agent S proporciona un marco robusto que aborda las complejidades involucradas en la automatización de la interacción humana con las máquinas, preparando el terreno para innumerables aplicaciones en IA y más allá. ¿Quién es el Creador de Agent S? Aunque el concepto de Agent S es fundamentalmente innovador, la información específica sobre su creador sigue siendo elusiva. El creador es actualmente desconocido, lo que resalta ya sea la etapa incipiente del proyecto o la elección estratégica de mantener a los miembros fundadores en el anonimato. Independientemente de la anonimidad, el enfoque sigue siendo las capacidades y el potencial del marco. ¿Quiénes son los Inversores de Agent S? Dado que Agent S es relativamente nuevo en el ecosistema criptográfico, la información detallada sobre sus inversores y patrocinadores financieros no está documentada explícitamente. La falta de información disponible públicamente sobre las bases de inversión u organizaciones que apoyan el proyecto plantea preguntas sobre su estructura de financiamiento y hoja de ruta de desarrollo. Comprender el respaldo es crucial para evaluar la sostenibilidad del proyecto y su posible impacto en el mercado. ¿Cómo Funciona Agent S? En el núcleo de Agent S se encuentra tecnología de vanguardia que le permite funcionar de manera efectiva en diversos entornos. Su modelo operativo se basa en varias características clave: Interacción Humano-Computadora: El marco ofrece planificación avanzada de IA, esforzándose por hacer que las interacciones con las computadoras sean más intuitivas. Al imitar el comportamiento humano en la ejecución de tareas, promete elevar las experiencias de los usuarios. Memoria Narrativa: Empleada para aprovechar experiencias de alto nivel, Agent S utiliza memoria narrativa para hacer un seguimiento de las historias de tareas, mejorando así sus procesos de toma de decisiones. Memoria Episódica: Esta característica proporciona a los usuarios orientación paso a paso, permitiendo que el marco ofrezca apoyo contextual a medida que se desarrollan las tareas. Soporte para OpenACI: Con la capacidad de funcionar localmente, Agent S permite a los usuarios mantener el control sobre sus interacciones y flujos de trabajo, alineándose con la ética descentralizada de Web3. Fácil Integración con APIs Externas: Su versatilidad y compatibilidad con diversas plataformas de IA aseguran que Agent S pueda integrarse sin problemas en ecosistemas tecnológicos existentes, convirtiéndolo en una opción atractiva para desarrolladores y organizaciones. Estas funcionalidades contribuyen colectivamente a la posición única de Agent S dentro del espacio cripto, ya que automatiza tareas complejas y de múltiples pasos con una intervención humana mínima. A medida que el proyecto evoluciona, sus aplicaciones potenciales en Web3 podrían redefinir cómo se desarrollan las interacciones digitales. Cronología de Agent S El desarrollo y los hitos de Agent S pueden encapsularse en una cronología que destaca sus eventos significativos: 27 de septiembre de 2024: Se lanzó el concepto de Agent S en un documento de investigación integral titulado “Un Marco Agente Abierto que Utiliza Computadoras como un Humano”, mostrando las bases del proyecto. 10 de octubre de 2024: El documento de investigación se hizo disponible públicamente en arXiv, ofreciendo una exploración en profundidad del marco y su evaluación de rendimiento basada en el benchmark OSWorld. 12 de octubre de 2024: Se publicó una presentación en video, proporcionando una visión visual de las capacidades y características de Agent S, involucrando aún más a posibles usuarios e inversores. Estos hitos en la cronología no solo ilustran el progreso de Agent S, sino que también indican su compromiso con la transparencia y el compromiso comunitario. Puntos Clave Sobre Agent S A medida que el marco Agent S continúa evolucionando, varios atributos clave destacan, subrayando su naturaleza innovadora y potencial: Marco Innovador: Diseñado para proporcionar un uso intuitivo de las computadoras similar a la interacción humana, Agent S aporta un enfoque novedoso a la automatización de tareas. Interacción Autónoma: La capacidad de interactuar de manera autónoma con las computadoras a través de GUI significa un avance hacia soluciones informáticas más inteligentes y eficientes. Automatización de Tareas Complejas: Con su metodología robusta, puede automatizar tareas complejas y de múltiples pasos, haciendo que los procesos sean más rápidos y menos propensos a errores. Mejora Continua: Los mecanismos de aprendizaje permiten a Agent S mejorar a partir de experiencias pasadas, mejorando continuamente su rendimiento y eficacia. Versatilidad: Su adaptabilidad en diferentes entornos operativos como OSWorld y WindowsAgentArena asegura que pueda servir a una amplia gama de aplicaciones. A medida que Agent S se posiciona en el paisaje de Web3 y criptomonedas, su potencial para mejorar las capacidades de interacción y automatizar procesos significa un avance significativo en las tecnologías de IA. A través de su marco innovador, Agent S ejemplifica el futuro de las interacciones digitales, prometiendo una experiencia más fluida y eficiente para los usuarios en diversas industrias. Conclusión Agent S representa un audaz avance en la unión de la IA y Web3, con la capacidad de redefinir cómo interactuamos con la tecnología. Aunque aún se encuentra en sus primeras etapas, las posibilidades para su aplicación son vastas y atractivas. A través de su marco integral que aborda desafíos críticos, Agent S tiene como objetivo llevar las interacciones autónomas al primer plano de la experiencia digital. A medida que nos adentramos más en los reinos de las criptomonedas y la descentralización, proyectos como Agent S sin duda desempeñarán un papel crucial en la configuración del futuro de la tecnología y la colaboración humano-computadora.

920 Vistas totalesPublicado en 2025.01.14Actualizado en 2025.01.14

Qué es AGENT S

Cómo comprar S

¡Bienvenido a HTX.com! Hemos hecho que comprar Sonic (S) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Sonic (S) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Sonic (S)Después de comprar tu Sonic (S), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Sonic (S)Tradear fácilmente con Sonic (S) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

1.5k Vistas totalesPublicado en 2025.01.15Actualizado en 2026.06.02

Cómo comprar S

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de S (S).

活动图片