El que creó Kling, regresó a Alibaba y creó otro caballo negro

marsbitPublicado a 2026-04-13Actualizado a 2026-04-13

Resumen

El desarrollador Zhang Di, creador del modelo de IA Kling en Kuaishou, regresó a Alibaba en noviembre de 2025 y en solo cinco meses lanzó HappyHorse-1.0, un modelo de generación de video de código abierto que lideró los rankings de Artificial Analysis en abril de 2026 en generación de video a partir de texto e imágenes. Con 15 mil millones de parámetros y arquitectura multimodal nativa, HappyHorse resuelve problemas de sincronización labial multilingüe y reduce costos de generación (38 segundos para 5 segundos de video 1080p en una GPU H100). Su enfoque no es solo en calidad técnica, sino en aplicaciones comerciales reales, especialmente en el ecosistema de comercio electrónico de Alibaba. Integrado en el Laboratorio de Vida Futura de Taotian Group, HappyHorse puede transformar la producción de contenido para comerciantes: generar videos promocionales contextualizados, escenas de productos y material de marketing de manera eficiente, utilizando datos de transacciones y comportamientos de usuarios para mejorar la conversión. Esto podría reducir la barrera de entrada para pequeños comerciantes y aumentar el suministro de contenido en la plataforma, aunque con desafíos regulatorios y de derechos de autor que OpenAI y ByteDance ya enfrentan con Sora y Seedance.

Por | Letra AI

El campo de los videos de IA ha estado un poco frío recientemente. Seedance 2.0 se enfrentó a controversias de derechos de autor y OpenAI cerró Sora, lo que llenó de nubes este sector.

Fue en ese momento cuando Alibaba presentó un caballo negro.

En abril de 2026, HappyHorse-1.0 llegó a la cima del ranking de Artificial Analysis, superando a rivales como ByteDance y Kuaishou en las categorías de generación de video a partir de texto y de imagen a video (sin audio).

Zhang Di regresó a Alibaba en noviembre de 2025 para asumir el cargo de director del Laboratorio de Vida Futura del Grupo Taotian, reportando directamente a Zheng Bo, CTO de Alimama.

Es decir, desde su regreso hasta que se dio a conocer, Zhang Di solo tardó unos 5 meses.

La clave es que HappyHorse, al igual que Qwen de Alibaba, tiene una versión open source disponible para uso comercial.

¿Qué posición tiene Qwen ahora en Alibaba? Es la base central del modelo de gran lenguaje universal a nivel grupal de Alibaba, el portador absoluto del núcleo de la estrategia de IA. Todo lo que hace Alibaba actualmente se está organizando en torno a Qwen.

Por lo tanto, el significado de HappyHorse para Alibaba podría ser mucho más que un modelo para presumir tecnología en rankings.

Sin embargo, antes de entender las ideas de Alibaba, deberíamos hablar primero sobre quién es Zhang Di.

01 De Alibaba a Kuaishou y de vuelta a Alibaba

Zhang Di se graduó en Informática de la Universidad de Shanghai Jiao Tong, con un programa continuo de licenciatura y maestría. Se unió a Alibaba en 2010 después de graduarse y durante mucho tiempo se encargó de la arquitectura de ingeniería de big data y aprendizaje automático de Alimama.

Alimama se dedica a la publicidad, recomendación, búsqueda y conversión, respaldadas por datos a gran escala, distribución a gran escala y sistemas de ingeniería complejos. Estas cosas pueden no sonar tan llamativas como los grandes modelos, pero fueron precisamente el lugar donde más tarde las empresas de internet chinas formaron talento en IA.

Muchas de las personas que realmente pueden convertir los modelos en productos no provienen puramente de laboratorios. Ellos ya habían pasado antes por la experiencia de sistemas como búsqueda, recomendación, publicidad y distribución de contenido.

Te lo explico con unos ejemplos. El CEO de Google, Sundar Pichai, comenzó trabajando en la barra de búsqueda y la recomendación de contenido de YouTube. El CEO de Microsoft, Satya Nadella, comenzó en Microsoft desarrollando el motor de búsqueda Bing y el sistema publicitario de Microsoft.

Porque estos sistemas procesan diariamente el comportamiento masivo de usuarios y también exigen que los modelos funcionen de manera estable en negocios reales. No permiten que los ingenieros hagan un demo bonito; te obligan a crear algo realmente útil, y además a sopesar constantemente entre latencia, coste, efecto y retroalimentación.

La década de Zhang Di en Alibaba transcurrió, en general, en un entorno así. En aquel entonces, el exterior aún no llamaba a todo "modelo grande", pero Alibaba ya tenía internamente un campo de entrenamiento centrado en datos, algoritmos e ingeniería.

En 2020, Zhang Di dejó Alibaba y se fue a Kuaishou.

En ese momento, las plataformas de短视频 (vídeos cortos) ya habían pasado de la competencia por el tráfico a la competencia tecnológica. Zhang Di ocupó sucesivamente los cargos de Vicepresidente de Tecnología y responsable del equipo de modelos grandes y tecnología multimedia en Kuaishou, y más tarde dirigió el desarrollo de la arquitectura subyacente y la aplicación práctica del modelo grande Kling.

El significado de Kling para Kuaishou fue muy importante.

Kling permitió a Kuaishou pasar de ser una "plataforma de distribución de contenido" a un "proveedor de infraestructura de producción de contenido", construyendo un ciclo completo de "generación de ideas - producción de video - distribución con un clic - monetización del tráfico - iteración de datos".

En abril de 2025, Kuaishou estableció la División de IA Kling y la ascendió a un departamento de primer nivel de la empresa, reportando directamente al CEO Cheng Yixiao, al mismo nivel que el negocio principal de短视频 (vídeos cortos).

Por eso, cuando se unió brevemente a Bilibili en septiembre de 2025 y regresó a Alibaba dos meses después, este movimiento difícilmente podía verse como un simple flujo de talento ordinario.

Bilibili necesita tecnología de video, Alibaba también necesita tecnología de video, solo que la necesidad de Alibaba es más compleja.

Kuaishou hace generación de video, básicamente es distribución. Pero si Alibaba hace generación de video, detrás hay muchos más eslabones involucrados: comercio electrónico, publicidad, transmisiones en vivo, servicios en la nube y comerciantes en el extranjero.

Como se mencionó anteriormente, después de regresar a Alibaba en noviembre de 2025, Zhang Di asumió el cargo de director del "Laboratorio de Vida Futura" del Grupo Taotian, con nivel P11.

Con este arreglo, el sabor de Alibaba sigue siendo fuerte. No colocó el modelo de video simplemente en un departamento de investigación pura; su posición está, en cambio, más cerca de Taotian, un lugar de transacción real.

En otras palabras, HappyHorse, desde su concepción, es un producto que enfatiza la implementación práctica y está vinculado al ecosistema existente de Alibaba.

Cinco meses después, apareció HappyHorse.

Esta velocidad es realmente rápida. Alibaba le dio a Zhang Di un nuevo escenario comercial y un equipo, y él volvió a abrir la ruta del modelo de video.

No entró en el video de IA desde cero, ni simplemente fue contratado externamente en Alibaba.

Su trayectoria profesional es como una línea que da un rodeo y vuelve. Primero aprendió en Alibaba cómo funcionan los sistemas comerciales a gran escala, luego fue a Kuaishou a convertir la generación de video en un producto, y luego regresó a Alibaba para colocar esta capacidad en una máquina comercial aún mayor.

Muchas empresas compiten por el talento en modelos grandes, pero las personas realmente escasas suelen ser aquellas que pueden entender simultáneamente el modelo, el negocio y la organización.

Hay muchas personas que solo saben entrenar modelos, y muchas que solo saben hablar de estrategia. Lo difícil es que alguien sepa dónde se atascará cada paso, desde la ruta tecnológica inicial de un modelo, pasando por el diseño de la arquitectura, el entrenamiento y inferencia, la salida del producto, hasta que finalmente sea utilizado por comerciantes y usuarios.

HappyHorse volvió a poner a Zhang Di en primer plano, y también le dio a la narrativa de IA relativamente dispersa de Alibaba en los últimos años una entrada de personaje más concreta.

02 Cómo un modelo open source derrotó a los gigantes closed source

El punto que realmente llamó la atención de HappyHorse es que ganó demasiado repentinamente.

En la pista de generación de video, en el extranjero están Runway, Pika, Luma, Veo de Google; en China, Seedance de ByteDance, Kling de Kuaishou. Alibaba no estaba en la lista.

Por eso, cuando HappyHorse encabezó la lista por primera vez, la gente prefería creer que era un modelo desarrollado por una startup, antes que creer que era un modelo de Alibaba.

HappyHorse se encuentra en el primer nivel tanto en la pista de texto a video como en la de imagen a video, con una puntuación Elo de 1333 para texto a video y 1392 para imagen a video.

La lista de Artificial Analysis en sí cambia constantemente con las pruebas ciegas de los usuarios, y las puntuaciones de las páginas también se actualizan posteriormente, pero确实 (ciertamente) superó en las pruebas de preferencia de usuarios a una serie de modelos closed source que se hicieron famosos antes.

Esto es bastante anormal. Generalmente, la generación de video es una de las direcciones que más consume dinero, datos y potencia de cálculo.

Los grandes fabricantes closed source pueden ocultar los datos, los detalles del modelo, los sistemas de inferencia y la experiencia del producto dentro de su propia plataforma, haciendo iteraciones internas continuas.

Los modelos open source, en cambio, enfrentan más limitaciones现实 (reales): sus parámetros deben poder ser públicos, la inferencia debe poder ejecutarse, la comunidad debe poder reproducirlos, y el efecto还必须 (debe además) resistir las comparaciones横向 (horizontales).

Por eso, antes de que apareciera HappyHorse, la mayoría de los modelos de video open source eran juguetes; los videos que generaban no eran lo suficientemente estables y los personajes a menudo sufrían desplazamientos (drift).

HappyHorse tiene 15 mil millones de parámetros, una arquitectura Transformer de 40 capas con autoatención unificada, y modela conjuntamente los tokens de texto, video y audio en una misma secuencia.

Este enfoque es muy similar al de Qwen, lo que explica por qué Zhang Di sacó HappyHorse en solo 5 meses: es muy probable que reutilizara los métodos de entrenamiento multimodal nativo de alta calidad heredados de Qwen.

Modelos de generación de video no nativamente multimodales como Sora, a menudo presentan problemas como la boca del personaje moviéndose y el sonido yendo con retraso. Y a veces la expresión del personaje es muy rica, pero el tono no es el correcto. El personaje también podría actuar antes de que se emita el sonido.

La razón por la que HappyHorse tiene una puntuación alta es que resolvió este problema mediante multimodalidad nativa.

HappyHorse es nativamente compatible con la sincronización de labios en múltiples idiomas como inglés, mandarín, cantonés, japonés, coreano, alemán, francés, etc. La tasa de error de palabras también se comparó con modelos open source similares.

¿Por qué Zhang Di hizo esto? Mi理解 (entendimiento) es que si Alibaba quiere que esta tecnología de generación de video entre en publicidad, comercio electrónico, series cortas, educación y transmisiones en vivo, no puede depender solo de imágenes bonitas.

Tiene que poder hablar, tener配音 (doblaje), hacer que el sonido y la imagen sean simultáneamente coherentes.

Otro punto clave es el coste y la velocidad.

HappyHorse tarda unos 38 segundos en generar un video 1080p de 5 segundos en una sola GPU H100, y utiliza la tecnología de destilación DMD-2 para comprimir los pasos de eliminación de ruido a 8 pasos.

Este es un obstáculo insuperable para la comercialización de la generación de video. No importa lo bueno que sea el modelo, si el coste de generar un video corto es demasiado alto y la espera es demasiado larga, es difícil que entre en el flujo de trabajo diario de los comerciantes.

Los comerciantes no esperarán medio día por cada producto, ni pagarán costes demasiado altos por docenas de materiales de prueba.

Por lo tanto, el significado de HappyHorse no es solo "poder generar", sino que también intenta comprimir la velocidad de generación y el coste de inferencia a un rango utilizable.

Para los desarrolladores, open source significa que pueden alojarlo por sí mismos, hacer fine-tuning, integrarlo en sus propios productos. Para la plataforma, open source también trae más retroalimentación de la comunidad.

El progreso de un modelo closed source depende principalmente del equipo interno de la empresa; un modelo open source será sometido por los desarrolladores a todo tipo de pruebas extrañas, los problemas se exponen rápidamente y las direcciones de mejora también aumentan.

El campo de video de Artificial Analysis utiliza votaciones de preferencia de usuarios; muchas veces no solo se mira un indicador técnico específico, sino también qué video prefieren los usuarios entre dos.

Por supuesto, Zhang Di aún no puede ser demasiado arrogante; llegar a la cima de la lista una vez no equivale a liderar para siempre.

Los competidores no se quedarán quietos. La victoria de HappyHorse ahora es solo una prueba pública, no toda la guerra.

Si HappyHorse es solo un modelo que puede encabezar listas, su significado es limitado. Pero si puede convertirse en la base de generación de video utilizada conjuntamente por los negocios de Alibaba Cloud y Taotian, se convertirá en una entrada.

Por lo tanto, lo más interesante de que HappyHorse derrote a los gigantes closed source no es solo la领先 (liderazgo) en puntuación. Lo que realmente merece atención es que le permitió a Alibaba encontrar una forma de volver a entrar en la mesa de juego de la generación de video.

No hizo primero una APP para usuarios finales (C端), ni solo hizo demostraciones internas, sino que directamente tomó el modelo open source y lo sometió a la检验 (prueba) de toda la industria.

Esta victoria puede que no dure mucho, pero Zhang Di hizo que el exterior cambiara su juicio sobre Alibaba en los modelos de generación de video.

La nueva pregunta se convirtió en: ¿dónde planea Alibaba utilizar esta capacidad?

03 El significado de HappyHorse para Alibaba

El punto de aplicación más directo de HappyHorse es el comercio electrónico.

En el pasado, cuando se hablaba de video de IA, lo más fácil era pensar en cine, series cortas, anuncios espectaculares, herramientas para creadores. Ciertamente, estos son mercados grandes y reales, pero están a cierta distancia del negocio principal de Alibaba.

La ventaja de Alibaba no está en hacer su propia comunidad de video, ni en que los usuarios comunes abran una APP de video de IA todos los días para pasar el tiempo. El lugar donde Alibaba realmente tiene ventaja es que tiene la concentración más densa de China de productos, comerciantes, sistemas de transacción y publicidad.

Por eso mucha gente se preocupa de que HappyHorse naciera en el "Laboratorio de Vida Futura" del Grupo Taotian.

Taotian se enfrenta diariamente a cómo venden los comerciantes, cómo se ven los productos, por qué hacen clic los usuarios y por qué realizan pedidos. Al colocar HappyHorse aquí, naturalmente la gente piensa: ¿puede mejorar la eficiencia de producción de contenido de productos? ¿Puede mejorar la conversión? ¿Puede ayudar a la plataforma a hacer más negocios?

Para un comerciante普通 (ordinario), el contenido de video siempre ha sido un problema.

Para grabar un video de producto de 30 segundos, necesitas encontrar un escenario, un modelo, iluminación, edición,配音 (doblaje). Las grandes marcas pueden contratar un equipo; los pequeños y medianos comerciantes la mayoría de las veces tienen que arreglárselas solos.

Muchos puntos de venta de productos no son complejos; el problema es que nadie los graba. Parecen muy普通 (ordinarios) sobre un fondo blanco; una vez que entran en un escenario concreto, los usuarios se dan cuenta de para qué pueden usarse.

Hace un tiempo en el extranjero, la bomba de fuentes solar se vendió como loco. Originalmente era solo un accesorio pequeño para jardines, y su efecto era más o menos así. Pero después de ser empaquetada en videos de IA como baños para pájaros, estanques de peces y juguetes de agua con fuentes geniales en bañeras infantiles, todos se volvieron locos por comprarla.

La IA no cambió el producto en sí, pero sí la forma en que los usuarios lo entienden. Transformó la "descripción de funciones" en "escenario de uso".

Esto正好 (justo) golpea el punto doloroso del contenido de comercio electrónico.

Si la página del producto está llena de parámetros, es posible que el usuario no tenga paciencia para leerla; si el presentador habla durante mucho tiempo, es posible que el usuario no lo crea. Pero un video de十几秒 (diez y pocos segundos), si puede aclarar el escenario, la eficiencia de conversión puede ser mucho mayor.

Lo más importante es que el video de IA se puede generar por lotes. Los comerciantes pueden generar versiones infantiles, familiares, festivas, al aire libre para un mismo producto, o也可以 (también pueden) generar不同 (diferentes) idiomas,不同 (diferentes) personajes,不同 (diferentes) escenarios para不同 (diferentes) países.

Esto tiene un significado para Alibaba mayor que simplemente hacer una herramienta de generación de video. Tanto Taobao como Tmall tienen una gran cantidad de comerciantes, y también una gran cantidad de datos de productos y retroalimentación de transacciones.

Si una herramienta de video de IA solo sabe generar imágenes bonitas, pronto se convertirá en un software de material; si puede saber en qué escenario es más probable que se haga clic en este producto, qué copywriting es más likely que带来 (traiga) añadir al carrito, qué primeros segundos del video son más likely que retengan al usuario, se acercará a ser parte de un sistema operativo de comercio electrónico.

Lo que Alibaba tiene de más compared con otras empresas de modelos de generación de video es precisamente este ciclo de retroalimentación cerrado.

Imágenes de productos, páginas de detalles, evaluaciones, preguntas y respuestas, palabras de búsqueda, tasa de clics, tasa de añadido al carrito, motivos de devolución, tiempo de permanencia en la transmisión en vivo... estas cosas parecen fragmentadas, pero son todo combustible para entrenar la capacidad de contenido de comercio electrónico.

Si HappyHorse se conecta a esta retroalimentación, puede evolucionar de "ayudar a los comerciantes a generar un video" a "ayudar a los comerciantes a generar un video con más probabilidades de vender".

Para Taotian, puede hacer videos de imagen principal, cortometrajes de escenarios de productos, fragmentos de transmisiones en vivo, presentadores virtuales y material de marketing.

En el pasado, cuando un comerciante lanzaba un nuevo producto,可能 (posiblemente) solo subía unas pocas imágenes, como mucho grababa un video corto tosco. En el futuro, puede entregar al sistema la imagen del producto, los puntos de venta, las evaluaciones y las etiquetas de audiencia, dejar que el sistema genere múltiples versiones de videos, y luego usar datos reales de投放 (colocación/publicidad) y成交 (transacción) para筛选 (filtrar) y seleccionar el más efectivo.

Si este proceso funciona sin problemas, la oferta de contenido de la plataforma aumentará significativamente, y el umbral de contenido para los pequeños y medianos comerciantes también disminuirá.

Sin embargo, la venta de videos de IA también conlleva riesgos. Puede放大 (amplificar) los puntos de venta, pero también puede放大 (amplificar) las ilusiones. Una bomba de fuentes en un video de IA喷 (chorrea) muy alto, pero en la realidad no alcanza ese efecto.

La oportunidad de Alibaba no debería ser permitir que los comerciantes sueñen con la IA; el enfoque debe estar en los parámetros del producto, el material fotografiado en实拍 (situación real), las evaluaciones de compradores y la审核 (revisión) de la plataforma, para que el contenido generado tenga límites.

A finales de marzo, OpenAI anunció el cierre de la aplicación independiente Sora y sus API的相关 (relacionadas). La razón es现实 (real): la generación de video consume demasiado dinero, la retención de usuarios no puede sostener el coste, OpenAI debe devolver la potencia de cálculo a la codificación, servicios empresariales y robótica.

Sora cayó en la cuenta comercial.

ByteDance también se encontró con problemas en otro frente. Aunque Seedance 2.0 también tiene un efecto impresionante, debido a problemas de derechos de autor, ByteDance suspendió el lanzamiento global de Seedance 2.0.

Cuanto más fuerte se entrena el modelo, más容易 (fácil) es caer en el pantano de los derechos de autor, derechos de imagen y datos de entrenamiento.

Al ver ahora a HappyHorse, creado por el equipo de Zhang Di, tiene un escenario comercial. Y el material del que dispone Alibaba – imágenes de productos, material de comerciantes, videos reales y retroalimentación de transacciones – es天然 (naturalmente) más suitable para una generación controlada que la propiedad intelectual cinematográfica.

Por lo tanto, el valor de HappyHorse no está solo en la lista. Le encontró un punto de aterrizaje más estable al video de IA.

Criptos en tendencia

Preguntas relacionadas

Q¿Quién es Zhang Di y cuál es su trayectoria profesional?

AZhang Di es un experto en IA que se graduó en la Universidad de Shanghai Jiao Tong. Trabajó en Alibaba durante una década, luego se unió a Kuaishou donde lideró el desarrollo del modelo de IA Kling, y finalmente regresó a Alibaba en noviembre de 2025 para dirigir el Laboratorio de Vida Futura de Taotian Group.

Q¿Qué es HappyHorse-1.0 y qué logró en el ranking de Artificial Analysis?

AHappyHorse-1.0 es un modelo de generación de video de IA de código abierto desarrollado por Alibaba. En abril de 2026, alcanzó el primer puesto en el ranking de Artificial Analysis en las categorías de generación de video a partir de texto y de imagen, superando a competidores como ByteDance y Kuaishou.

Q¿Cuáles son las características técnicas clave del modelo HappyHorse?

AHappyHorse tiene 15 mil millones de parámetros, una arquitectura Transformer de 40 capas con atención autounificada, y modela conjuntamente tokens de texto, video y audio en una secuencia. Es nativamente multimodal, soporta sincronización de labios en múltiples idiomas y utiliza tecnología de destilación DMD-2 para reducir los pasos de generación, logrando generar 5 segundos de video 1080p en 38 segundos en una sola GPU H100.

Q¿Cómo planea Alibaba utilizar HappyHorse en su negocio principal de comercio electrónico?

AAlibaba planea integrar HappyHorse en su ecosistema de comercio electrónico para ayudar a los vendedores a generar videos promocionales de productos de manera eficiente. Esto incluye la creación de videos de escenarios de uso, materiales de marketing, segmentos de transmisiones en vivo y avatares virtuales, todo ello aprovechando los datos de transacciones y retroalimentación de la plataforma para mejorar las tasas de conversión.

Q¿Qué ventajas tiene el enfoque de código abierto de HappyHorse frente a los modelos cerrados?

AEl enfoque de código abierto permite la autohospedaje, la personalización y la integración en productos externos. Fomenta la retroalimentación de la comunidad, acelera la identificación y resolución de problemas, y reduce costos, lo que lo hace más accesible para los desarrolladores y las empresas en comparación con los modelos cerrados y costosos.

Lecturas Relacionadas

Sin equipo de ventas y con ingresos de 20 millones de dólares, ¿cómo conquistó Viktor, el empleado de IA, a 30.000 empresas?

El asistente de IA Viktor, creado por un equipo con experiencia en DeepMind, ha logrado ingresos anuales de 20 millones de dólares sirviendo a 30,000 empresas, sin un equipo de ventas. Funciona como un "compañero de trabajo de IA de Nivel 3" que ejecuta tareas de principio a fin directamente en herramientas como Slack o Microsoft Teams mediante simples menciones (@). Permite a los usuarios realizar solicitudes en lenguaje natural, eliminando la necesidad de conocimientos en ingeniería de prompts. Su modelo de crecimiento impulsado por el producto (PLG) y facturación basada en créditos o consumo de tareas, en lugar de por usuario, facilita la adopción. Ofrece 100 dólares en créditos gratuitos para demostrar su valor rápidamente, como en procesos automatizados de conciliación nocturna o creación de presentaciones PPT. Viktor se integra con más de 3,200 aplicaciones y puede activarse automáticamente según horarios o eventos. También posee memoria organizacional, aprendiendo de correcciones para mejorar su ejecución. Al expandirse a Microsoft Teams, Viktor enfrenta nuevos desafíos de cumplimiento normativo y seguridad en grandes organizaciones. Su enfoque de ejecución autónoma, aunque eficiente, introduce riesgos de "caja negra" y posibles errores operativos. El éxito a gran escala dependerá de encontrar un equilibrio entre la automatización total, la gestión de riesgos y la construcción de confianza mediante un marco sólido de gobernanza, permisos y auditoría.

marsbitHace 1 hora(s)

Sin equipo de ventas y con ingresos de 20 millones de dólares, ¿cómo conquistó Viktor, el empleado de IA, a 30.000 empresas?

marsbitHace 1 hora(s)

Entrevista a los cofundadores de CoreWeave, acción relacionada con Nvidia: La demanda de IA parece 'intensificarse' cada día

CoreWeave, líder en neocloud, analiza la evolución de la demanda de IA con sus ejecutivos Brannin McBee y Nick Robbins. La necesidad de capacidad de computación para IA no se está enfriando, sino que se intensifica cada día, impulsada por las aplicaciones de agentes inteligentes, inferencia y IA empresarial. La entrevista destaca un cambio estructural: el cuello de botella ya no son solo las GPU, sino problemas de infraestructura más complejos como la disponibilidad de centros de datos con energía ("powered shells"), CPU, almacenamiento, cadena de suministro y costos. CoreWeave, que sirve a clientes como OpenAI, Anthropic y grandes tecnológicas, observa un aumento relativo en la necesidad de CPU (como las futuras Vera de Nvidia) y almacenamiento junto a las GPU, lo que ha llevado a rediseñar sus centros de datos. La competencia en infraestructura de IA ya no se centra solo en adquirir chips, sino en la capacidad de ejecución: desplegar rápida y eficientemente sistemas complejos. CoreWeave atribuye su éxito a su historial de ejecución, su rendimiento superior y su plataforma madura para llevar la IA a producción. Actualmente, la principal limitación es la disponibilidad de instalaciones de centros de datos listas, aunque la escasez y el costo de componentes como la memoria HBM son factores gestionados mediante contratos que trasladan los costos a los clientes. Se espera que el despliegue masivo de la próxima generación de servidores, como Vera Rubin, gane fuerza a lo largo de 2027.

marsbitHace 2 hora(s)

Entrevista a los cofundadores de CoreWeave, acción relacionada con Nvidia: La demanda de IA parece 'intensificarse' cada día

marsbitHace 2 hora(s)

Trading

Spot
Futuros

Artículos destacados

Qué es GROK AI

Grok AI: Revolucionando la Tecnología Conversacional en la Era Web3 Introducción En el paisaje de la inteligencia artificial en rápida evolución, Grok AI se destaca como un proyecto notable que une los dominios de la tecnología avanzada y la interacción con el usuario. Desarrollado por xAI, una empresa liderada por el renombrado emprendedor Elon Musk, Grok AI busca redefinir cómo interactuamos con la inteligencia artificial. A medida que el movimiento Web3 continúa floreciendo, Grok AI tiene como objetivo aprovechar el poder de la IA conversacional para responder a consultas complejas, proporcionando a los usuarios una experiencia que no solo es informativa, sino también entretenida. ¿Qué es Grok AI? Grok AI es un sofisticado chatbot de IA conversacional diseñado para interactuar con los usuarios de manera dinámica. A diferencia de muchos sistemas de IA tradicionales, Grok AI abraza una gama más amplia de consultas, incluidas aquellas que normalmente se consideran inapropiadas o fuera de las respuestas estándar. Los objetivos centrales del proyecto incluyen: Razonamiento Fiable: Grok AI enfatiza el razonamiento de sentido común para proporcionar respuestas lógicas basadas en la comprensión contextual. Supervisión Escalable: La integración de asistencia de herramientas asegura que las interacciones de los usuarios sean tanto monitoreadas como optimizadas para la calidad. Verificación Formal: La seguridad es primordial; Grok AI incorpora métodos de verificación formal para mejorar la fiabilidad de sus resultados. Comprensión de Largo Contexto: El modelo de IA sobresale en retener y recordar un extenso historial de conversaciones, facilitando discusiones significativas y contextualizadas. Robustez Adversarial: Al centrarse en mejorar sus defensas contra entradas manipuladas o maliciosas, Grok AI busca mantener la integridad de las interacciones de los usuarios. En esencia, Grok AI no es solo un dispositivo de recuperación de información; es un compañero conversacional inmersivo que fomenta un diálogo dinámico. Creador de Grok AI La mente detrás de Grok AI no es otra que Elon Musk, una persona sinónimo de innovación en varios campos, incluidos el automotriz, los viajes espaciales y la tecnología. Bajo el paraguas de xAI, una empresa centrada en avanzar la tecnología de IA de maneras beneficiosas, la visión de Musk busca remodelar la comprensión de las interacciones de IA. El liderazgo y la ética fundacional están profundamente influenciados por el compromiso de Musk de empujar los límites tecnológicos. Inversores de Grok AI Si bien los detalles específicos sobre los inversores que respaldan Grok AI son limitados, se reconoce públicamente que xAI, el incubador del proyecto, está fundado y apoyado principalmente por el propio Elon Musk. Las empresas y participaciones anteriores de Musk proporcionan un respaldo robusto, reforzando aún más la credibilidad y el potencial de crecimiento de Grok AI. Sin embargo, hasta ahora, la información sobre fundaciones de inversión adicionales u organizaciones que apoyan a Grok AI no está fácilmente accesible, marcando un área para una posible exploración futura. ¿Cómo Funciona Grok AI? La mecánica operativa de Grok AI es tan innovadora como su marco conceptual. El proyecto integra varias tecnologías de vanguardia que facilitan sus funcionalidades únicas: Infraestructura Robusta: Grok AI está construido utilizando Kubernetes para la orquestación de contenedores, Rust para rendimiento y seguridad, y JAX para computación numérica de alto rendimiento. Este trío asegura que el chatbot opere de manera eficiente, escale efectivamente y sirva a los usuarios de manera oportuna. Acceso a Conocimiento en Tiempo Real: Una de las características distintivas de Grok AI es su capacidad para acceder a datos en tiempo real a través de la plataforma X—anteriormente conocida como Twitter. Esta capacidad otorga a la IA acceso a la información más reciente, permitiéndole proporcionar respuestas y recomendaciones oportunas que otros modelos de IA podrían pasar por alto. Dos Modos de Interacción: Grok AI ofrece a los usuarios la opción entre “Modo Divertido” y “Modo Regular”. El Modo Divertido permite un estilo de interacción más lúdico y humorístico, mientras que el Modo Regular se centra en ofrecer respuestas precisas y exactas. Esta versatilidad asegura una experiencia personalizada que se adapta a diversas preferencias de los usuarios. En esencia, Grok AI une rendimiento con compromiso, creando una experiencia que es tanto enriquecedora como entretenida. Cronología de Grok AI El viaje de Grok AI está marcado por hitos clave que reflejan sus etapas de desarrollo y despliegue: Desarrollo Inicial: La fase fundamental de Grok AI tuvo lugar durante aproximadamente dos meses, durante los cuales se llevó a cabo el entrenamiento y ajuste inicial del modelo. Lanzamiento Beta de Grok-2: En un avance significativo, se anunció la beta de Grok-2. Este lanzamiento introdujo dos versiones del chatbot—Grok-2 y Grok-2 mini—cada una equipada con capacidades para chatear, programar y razonar. Acceso Público: Tras su desarrollo beta, Grok AI se volvió disponible para los usuarios de la plataforma X. Aquellos con cuentas verificadas por un número de teléfono y activas durante al menos siete días pueden acceder a una versión limitada, haciendo la tecnología disponible para una audiencia más amplia. Esta cronología encapsula el crecimiento sistemático de Grok AI desde su inicio hasta el compromiso público, enfatizando su compromiso con la mejora continua y la interacción con los usuarios. Características Clave de Grok AI Grok AI abarca varias características clave que contribuyen a su identidad innovadora: Integración de Conocimiento en Tiempo Real: El acceso a información actual y relevante diferencia a Grok AI de muchos modelos estáticos, permitiendo una experiencia de usuario atractiva y precisa. Estilos de Interacción Versátiles: Al ofrecer modos de interacción distintos, Grok AI se adapta a diversas preferencias de los usuarios, invitando a la creatividad y la personalización en la conversación con la IA. Avanzada Infraestructura Tecnológica: La utilización de Kubernetes, Rust y JAX proporciona al proyecto un marco sólido para garantizar fiabilidad y rendimiento óptimo. Consideración de Discurso Ético: La inclusión de una función generadora de imágenes muestra el espíritu innovador del proyecto. Sin embargo, también plantea consideraciones éticas en torno a los derechos de autor y la representación respetuosa de figuras reconocibles—una discusión en curso dentro de la comunidad de IA. Conclusión Como una entidad pionera en el ámbito de la IA conversacional, Grok AI encapsula el potencial para experiencias transformadoras de usuario en la era digital. Desarrollado por xAI y guiado por el enfoque visionario de Elon Musk, Grok AI integra conocimiento en tiempo real con capacidades avanzadas de interacción. Se esfuerza por empujar los límites de lo que la inteligencia artificial puede lograr mientras mantiene un enfoque en consideraciones éticas y la seguridad del usuario. Grok AI no solo encarna el avance tecnológico, sino que también representa un nuevo paradigma de conversaciones en el paisaje Web3, prometiendo involucrar a los usuarios con tanto conocimiento hábil como interacción lúdica. A medida que el proyecto continúa evolucionando, se erige como un testimonio de lo que la intersección de la tecnología, la creatividad y la interacción similar a la humana puede lograr.

560 Vistas totalesPublicado en 2024.12.26Actualizado en 2024.12.26

Qué es GROK AI

Qué es ERC AI

Euruka Tech: Una Visión General de $erc ai y sus Ambiciones en Web3 Introducción En el panorama en rápida evolución de la tecnología blockchain y las aplicaciones descentralizadas, nuevos proyectos emergen con frecuencia, cada uno con objetivos y metodologías únicas. Uno de estos proyectos es Euruka Tech, que opera en el amplio dominio de las criptomonedas y Web3. El enfoque principal de Euruka Tech, particularmente su token $erc ai, es presentar soluciones innovadoras diseñadas para aprovechar las crecientes capacidades de la tecnología descentralizada. Este artículo tiene como objetivo proporcionar una visión general completa de Euruka Tech, una exploración de sus objetivos, funcionalidad, la identidad de su creador, posibles inversores y su importancia dentro del contexto más amplio de Web3. ¿Qué es Euruka Tech, $erc ai? Euruka Tech se caracteriza como un proyecto que aprovecha las herramientas y funcionalidades ofrecidas por el entorno Web3, centrándose en integrar la inteligencia artificial dentro de sus operaciones. Aunque los detalles específicos sobre el marco del proyecto son algo elusivos, está diseñado para mejorar la participación del usuario y automatizar procesos en el espacio cripto. El proyecto tiene como objetivo crear un ecosistema descentralizado que no solo facilite transacciones, sino que también incorpore funcionalidades predictivas a través de la inteligencia artificial, de ahí la designación de su token, $erc ai. La meta es proporcionar una plataforma intuitiva que facilite interacciones más inteligentes y un procesamiento de transacciones eficiente dentro de la creciente esfera de Web3. ¿Quién es el Creador de Euruka Tech, $erc ai? En la actualidad, la información sobre el creador o el equipo fundador detrás de Euruka Tech sigue sin especificarse y es algo opaca. Esta ausencia de datos genera preocupaciones, ya que el conocimiento del trasfondo del equipo es a menudo esencial para establecer credibilidad dentro del sector blockchain. Por lo tanto, hemos categorizado esta información como desconocida hasta que se disponga de detalles concretos en el dominio público. ¿Quiénes son los Inversores de Euruka Tech, $erc ai? De manera similar, la identificación de inversores u organizaciones de respaldo para el proyecto Euruka Tech no se proporciona fácilmente a través de la investigación disponible. Un aspecto crucial para los posibles interesados o usuarios que consideren involucrarse con Euruka Tech es la garantía que proviene de asociaciones financieras establecidas o respaldo de firmas de inversión reputadas. Sin divulgaciones sobre afiliaciones de inversión, es difícil llegar a conclusiones completas sobre la seguridad financiera o la longevidad del proyecto. De acuerdo con la información encontrada, esta sección también se encuentra en estado de desconocido. ¿Cómo Funciona Euruka Tech, $erc ai? A pesar de la falta de especificaciones técnicas detalladas para Euruka Tech, es esencial considerar sus ambiciones innovadoras. El proyecto busca aprovechar la potencia computacional de la inteligencia artificial para automatizar y mejorar la experiencia del usuario dentro del entorno de las criptomonedas. Al integrar la IA con la tecnología blockchain, Euruka Tech aspira a proporcionar características como operaciones automatizadas, evaluaciones de riesgos e interfaces de usuario personalizadas. La esencia innovadora de Euruka Tech radica en su objetivo de crear una conexión fluida entre los usuarios y las vastas posibilidades que presentan las redes descentralizadas. A través de la utilización de algoritmos de aprendizaje automático e IA, busca minimizar los desafíos que enfrentan los usuarios primerizos y agilizar las experiencias transaccionales dentro del marco de Web3. Esta simbiosis entre IA y blockchain subraya la importancia del token $erc ai, que actúa como un puente entre las interfaces de usuario tradicionales y las capacidades avanzadas de las tecnologías descentralizadas. Cronología de Euruka Tech, $erc ai Desafortunadamente, como resultado de la información limitada disponible sobre Euruka Tech, no podemos presentar una cronología detallada de los principales desarrollos o hitos en el viaje del proyecto. Esta cronología, que suele ser invaluable para trazar la evolución de un proyecto y comprender su trayectoria de crecimiento, no está actualmente disponible. A medida que la información sobre eventos notables, asociaciones o adiciones funcionales se haga evidente, las actualizaciones seguramente mejorarán la visibilidad de Euruka Tech en la esfera cripto. Aclaración sobre Otros Proyectos “Eureka” Es importante señalar que múltiples proyectos y empresas comparten una nomenclatura similar con “Eureka”. La investigación ha identificado iniciativas como un agente de IA de NVIDIA Research, que se centra en enseñar a los robots tareas complejas utilizando métodos generativos, así como Eureka Labs y Eureka AI, que mejoran la experiencia del usuario en educación y análisis de servicio al cliente, respectivamente. Sin embargo, estos proyectos son distintos de Euruka Tech y no deben confundirse con sus objetivos o funcionalidades. Conclusión Euruka Tech, junto con su token $erc ai, representa un jugador prometedor pero actualmente oscuro dentro del paisaje de Web3. Si bien los detalles sobre su creador e inversores siguen sin revelarse, la ambición central de combinar inteligencia artificial con tecnología blockchain se erige como un punto focal de interés. Los enfoques únicos del proyecto para fomentar la participación del usuario a través de la automatización avanzada podrían distinguirlo a medida que el ecosistema Web3 progresa. A medida que el mercado de criptomonedas continúa evolucionando, los interesados deben mantener un ojo atento a los avances en torno a Euruka Tech, ya que el desarrollo de innovaciones documentadas, asociaciones o una hoja de ruta definida podría presentar oportunidades significativas en el futuro cercano. Tal como están las cosas, esperamos más información sustancial que podría desvelar el potencial de Euruka Tech y su posición en el competitivo paisaje cripto.

588 Vistas totalesPublicado en 2025.01.02Actualizado en 2025.01.02

Qué es ERC AI

Qué es DUOLINGO AI

DUOLINGO AI: Integrando el Aprendizaje de Idiomas con la Innovación de Web3 y AI En una era donde la tecnología remodela la educación, la integración de la inteligencia artificial (IA) y las redes blockchain anuncia una nueva frontera para el aprendizaje de idiomas. Presentamos DUOLINGO AI y su criptomoneda asociada, $DUOLINGO AI. Este proyecto aspira a fusionar la capacidad educativa de las principales plataformas de aprendizaje de idiomas con los beneficios de la tecnología descentralizada Web3. Este artículo profundiza en los aspectos clave de DUOLINGO AI, explorando sus objetivos, marco tecnológico, desarrollo histórico y potencial futuro, manteniendo la claridad entre el recurso educativo original y esta iniciativa independiente de criptomoneda. Visión General de DUOLINGO AI En su esencia, DUOLINGO AI busca establecer un entorno descentralizado donde los aprendices puedan ganar recompensas criptográficas por alcanzar hitos educativos en la competencia lingüística. Al aplicar contratos inteligentes, el proyecto pretende automatizar los procesos de verificación de habilidades y asignación de tokens, adhiriéndose a los principios de Web3 que enfatizan la transparencia y la propiedad del usuario. El modelo se aparta de los enfoques tradicionales para la adquisición de idiomas al apoyarse en una estructura de gobernanza impulsada por la comunidad, permitiendo a los poseedores de tokens sugerir mejoras al contenido del curso y a la distribución de recompensas. Algunos de los objetivos notables de DUOLINGO AI incluyen: Aprendizaje Gamificado: El proyecto integra logros en blockchain y tokens no fungibles (NFTs) para representar niveles de competencia lingüística, fomentando la motivación a través de recompensas digitales atractivas. Creación de Contenido Descentralizada: Abre caminos para que educadores y entusiastas de los idiomas contribuyan con sus cursos, facilitando un modelo de reparto de ingresos que beneficia a todos los contribuyentes. Personalización Potenciada por IA: Al emplear modelos avanzados de aprendizaje automático, DUOLINGO AI personaliza las lecciones para adaptarse al progreso de aprendizaje individual, similar a las características adaptativas encontradas en plataformas establecidas. Creadores del Proyecto y Gobernanza A partir de abril de 2025, el equipo detrás de $DUOLINGO AI permanece seudónimo, una práctica frecuente en el paisaje descentralizado de criptomonedas. Esta anonimidad está destinada a promover el crecimiento colectivo y la participación de las partes interesadas en lugar de centrarse en desarrolladores individuales. El contrato inteligente desplegado en la blockchain de Solana señala la dirección de la billetera del desarrollador, lo que significa el compromiso con la transparencia en las transacciones a pesar de que la identidad de los creadores sea desconocida. Según su hoja de ruta, DUOLINGO AI tiene como objetivo evolucionar hacia una Organización Autónoma Descentralizada (DAO). Esta estructura de gobernanza permite a los poseedores de tokens votar sobre cuestiones críticas como implementaciones de características y asignaciones de tesorería. Este modelo se alinea con la ética de empoderamiento comunitario que se encuentra en varias aplicaciones descentralizadas, enfatizando la importancia de la toma de decisiones colectiva. Inversores y Alianzas Estratégicas Actualmente, no hay inversores institucionales o capitalistas de riesgo identificables públicamente vinculados a $DUOLINGO AI. En cambio, la liquidez del proyecto proviene principalmente de intercambios descentralizados (DEXs), marcando un contraste marcado con las estrategias de financiación de las empresas tradicionales de tecnología educativa. Este modelo de base indica un enfoque impulsado por la comunidad, reflejando el compromiso del proyecto con la descentralización. En su libro blanco, DUOLINGO AI menciona la formación de colaboraciones con “plataformas de educación blockchain” no especificadas, destinadas a enriquecer su oferta de cursos. Aunque aún no se han divulgado asociaciones específicas, estos esfuerzos colaborativos sugieren una estrategia para combinar la innovación blockchain con iniciativas educativas, ampliando el acceso y la participación de los usuarios en diversas vías de aprendizaje. Arquitectura Tecnológica Integración de IA DUOLINGO AI incorpora dos componentes principales impulsados por IA para mejorar su oferta educativa: Motor de Aprendizaje Adaptativo: Este sofisticado motor aprende de las interacciones del usuario, similar a los modelos propietarios de las principales plataformas educativas. Ajusta dinámicamente la dificultad de las lecciones para abordar desafíos específicos del aprendiz, reforzando áreas débiles a través de ejercicios específicos. Agentes Conversacionales: Al emplear chatbots impulsados por GPT-4, DUOLINGO AI proporciona una plataforma para que los usuarios participen en conversaciones simuladas, fomentando una experiencia de aprendizaje de idiomas más interactiva y práctica. Infraestructura Blockchain Construido sobre la blockchain de Solana, $DUOLINGO AI utiliza un marco tecnológico integral que incluye: Contratos Inteligentes de Verificación de Habilidades: Esta característica otorga automáticamente tokens a los usuarios que superan con éxito las pruebas de competencia, reforzando la estructura de incentivos para resultados de aprendizaje genuinos. Insignias NFT: Estos tokens digitales significan varios hitos que los aprendices logran, como completar una sección de su curso o dominar habilidades específicas, permitiéndoles intercambiar o exhibir sus logros digitalmente. Gobernanza DAO: Los miembros de la comunidad que poseen tokens pueden participar en la gobernanza votando sobre propuestas clave, facilitando una cultura participativa que fomenta la innovación en la oferta de cursos y características de la plataforma. Línea de Tiempo Histórica 2022–2023: Conceptualización Los cimientos de DUOLINGO AI comienzan con la creación de un libro blanco, destacando la sinergia entre los avances de IA en el aprendizaje de idiomas y el potencial descentralizado de la tecnología blockchain. 2024: Lanzamiento Beta Un lanzamiento beta limitado introduce ofertas en idiomas populares, recompensando a los primeros usuarios con incentivos en tokens como parte de la estrategia de participación comunitaria del proyecto. 2025: Transición a DAO En abril, se produce un lanzamiento completo de la mainnet con la circulación de tokens, lo que provoca discusiones comunitarias sobre posibles expansiones a idiomas asiáticos y otros desarrollos de cursos. Desafíos y Direcciones Futuras Obstáculos Técnicos A pesar de sus ambiciosos objetivos, DUOLINGO AI enfrenta desafíos significativos. La escalabilidad sigue siendo una preocupación constante, particularmente en el equilibrio de los costos asociados con el procesamiento de IA y el mantenimiento de una red descentralizada y receptiva. Además, garantizar la creación y moderación de contenido de calidad en medio de una oferta descentralizada plantea complejidades en el mantenimiento de estándares educativos. Oportunidades Estratégicas Mirando hacia adelante, DUOLINGO AI tiene el potencial de aprovechar asociaciones de micro-certificación con instituciones académicas, proporcionando validaciones de habilidades lingüísticas verificadas por blockchain. Además, la expansión entre cadenas podría permitir al proyecto acceder a bases de usuarios más amplias y a ecosistemas blockchain adicionales, mejorando su interoperabilidad y alcance. Conclusión DUOLINGO AI representa una fusión innovadora de inteligencia artificial y tecnología blockchain, presentando una alternativa centrada en la comunidad a los sistemas tradicionales de aprendizaje de idiomas. Aunque su desarrollo seudónimo y su modelo económico emergente traen ciertos riesgos, el compromiso del proyecto con el aprendizaje gamificado, la educación personalizada y la gobernanza descentralizada ilumina un camino hacia adelante para la tecnología educativa en el ámbito de Web3. A medida que la IA continúa avanzando y el ecosistema blockchain evoluciona, iniciativas como DUOLINGO AI podrían redefinir cómo los usuarios se relacionan con la educación lingüística, empoderando a las comunidades y recompensando la participación a través de mecanismos de aprendizaje innovadores.

576 Vistas totalesPublicado en 2025.04.11Actualizado en 2025.04.11

Qué es DUOLINGO AI

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de AI (AI).

活动图片