El camino de DeepSeek hacia los 10 billones de dólares: Utilizar el código abierto para impulsar un ecosistema de hardware de billones

marsbitPublicado a 2026-05-25Actualizado a 2026-05-25

Resumen

DeepSeek está siguiendo una estrategia audaz que trasciende la competencia inmediata por modelos de IA. En lugar de centrarse en monetizar aplicaciones o suscripciones, su objetivo es remodelar fundamentalmente la infraestructura de hardware para IA. A través de innovaciones arquitectónicas como MLA, DSA, CSA, Engram y técnicas de compresión de KV Cache, DeepSeek reduce drásticamente la dependencia de componentes costosos y de difícil acceso como la HBM (High Bandwidth Memory). Esto permite utilizar memoria más abundante y asequible, como NAND/SSD para almacenar cachés y LPDDR para cargar pesos y módulos Engram, intercambiando eficientemente capacidad de memoria por potencia de cálculo. Estos avances no solo hacen que los modelos de DeepSeek sean excepcionalmente eficientes en costos (su DeepSeek V4 requiere solo ~5.5GB de HBM para 1 millón de tokens de contexto, frente a los 60-89GB de competidores), sino que también crean un enorme mercado potencial para fabricantes de hardware alternativos, especialmente en China (como YMTC para NAND y CXMT para LPDDR). Iniciativas como TileLang buscan además debilitar la ventaja del ecosistema CUDA. La visión a largo plazo de DeepSeek es catalizar un ecosistema de hardware de IA valorado en billones, donde su propio valor podría alcanzar el billón de dólares, no mediante la venta directa de modelos, sino facilitando una infraestructura de IA más accesible y eficiente para todos.

Título original: DeepSeek's 10 trillion USD grand strategy

Autor original: @bookwormengr

Traducción original: Peggy, BlockBeats

Nota del editor: En el último año, la discusión en torno a DeepSeek se ha centrado principalmente en el rendimiento del modelo, la estrategia de código abierto y la guerra de precios. Pero si entendemos a DeepSeek solo desde la perspectiva de "vender o no suscripciones", "tener o no multimodalidad", "poder o no hacer de agente de programación", probablemente estemos subestimando lo que realmente quiere cambiar.

Este artículo plantea un juicio más radical: el objetivo de DeepSeek no es necesariamente monetizar a corto plazo en la capa de aplicación, sino remodelar la estructura de costes del entrenamiento y la inferencia de IA a través de una serie de innovaciones en la arquitectura subyacente, e impulsar indirectamente la formación de un nuevo ecosistema de hardware. Desde MoE y MLA, hasta DSA, CSA, mHC y Engram, pasando por Dual Path y TileLang, la ruta tecnológica de DeepSeek siempre se ha centrado en una cuestión central: cómo obtener modelos más potentes utilizando menos capacidad de cálculo de gama alta, en un contexto de limitaciones en HBM, procesos avanzados, empaquetado y el ecosistema CUDA.

Lo más destacado del artículo no es "si DeepSeek puede ganar unos cientos de millones de dólares con su API o suscripciones", sino si está vinculando la capacidad del modelo, el sistema de memoria y el ecosistema de hardware nacional. La compresión de KV Cache reduce la dependencia del HBM, la memoria NAND y los SSD pueden asumir el caché de larga duración, la LPDDR se puede utilizar para la carga en streaming de pesos y el almacenamiento Engram, mientras que TileLang intenta debilitar la ventaja competitiva de CUDA. Si estas innovaciones se difunden continuamente, los beneficiarios no serán solo DeepSeek, sino también el almacenamiento, los ASIC, las GPU, los chips de red y toda la cadena de infraestructura de IA.

Por supuesto, los juicios del artículo sobre un "ecosistema industrial de 10 billones de dólares" y una "valoración de 1 billón de dólares" todavía tienen un fuerte carácter especulativo. Pero proporciona una vía importante para entender a DeepSeek: el código abierto no significa necesariamente renunciar a la comercialización, y los precios bajos no son solo subsidios al mercado. Para DeepSeek, el verdadero negocio puede no estar en la capa de aplicación, sino en ayudar a que más hardware sea utilizable y hacer posible una oferta de IA de menor coste. En otras palabras, lo que vende quizás no sea el modelo en sí, sino la viabilidad de la próxima generación de infraestructura de IA.

A continuación, el texto original:

¿Te has preguntado alguna vez cómo va a ganar dinero DeepSeek, y posiblemente mucho dinero?

No ha lanzado un plan de suscripción competitivo para programación como GLM, MoonShot y MiniMax; tampoco tiene modelos multimodales, de audio o de vídeo. Hasta ahora, ni siquiera tiene su propio "harness", es decir, el marco de ejecución externo para la invocación del modelo, la conexión de herramientas y la ejecución de tareas, aunque recientemente han comenzado a contratar para puestos relacionados, preparándose para construir este sistema.

Mientras tanto, DeepSeek parece mantenerse firme y a largo plazo del lado del código abierto, incluso compartiendo gustosamente sus "secretos". ¿No es esto una locura? ¿No es como quemar dinero? ¿Acaso los inversores que están preparados para invertir 100.000 millones de dólares están tirando el dinero por el desagüe?

Personalmente, creo que la respuesta es todo lo contrario.

A continuación, basándome en lo que DeepSeek ha hecho hasta ahora, presentaré algunas observaciones y analizaré la estrategia que parece estar siguiendo. El objetivo del CEO de DeepSeek, Liang Wenfeng, podría ser mucho más grande que la competencia actual de modelos. Quizás esté apuntando a un premio mayor: DeepSeek tiene la oportunidad de alcanzar una valoración de 1 billón de dólares, impulsando al mismo tiempo la formación de una nueva industria de 10 billones de dólares.

Informe de TechInAsia sobre la última ronda de financiación de DeepSeek

Revisando el "viaje del héroe" de DeepSeek

DeepSeek siempre ha ido contracorriente. No ha optado por lanzar constantemente modelos un poco más potentes y luego empaquetarlos apresuradamente como aplicaciones directamente monetizables, como planes de suscripción para programación. El 27 de enero de 2025, publiqué un tuit muy difundido describiendo el "viaje del héroe" de DeepSeek tal como yo lo veía. Hoy, esta historia se ha vuelto aún más interesante.

Mientras otros intentaban construir modelos densos, DeepSeek eligió los más difíciles de entrenar: Modelos Mixtos de Expertos (Mixture of Experts, MoE).

Adoptaron un enfoque de "primeros principios", inventando un nuevo algoritmo GRPO para reemplazar el entonces dominante y más costoso algoritmo de aprendizaje por refuerzo PPO.

Descubrieron que el Aprendizaje por Refuerzo basado en Recompensas Verificables (Reinforcement Learning from Verified Rewards, RLVR) era una estrategia clave para mejorar la capacidad de razonamiento del modelo.

También propusieron una estrategia simple de decodificación especulativa a través de la "Predicción de Múltiples Tokens" (Multi Token Prediction), al mismo tiempo que hacían que la señal de entrenamiento fuera más densa.

Perfeccionaron el pipeline "burbuja cero" (ZERO bubble) para mejorar la eficiencia del uso de recursos limitados de GPU.

Publicaron un equilibrador de carga de expertos, facilitando que todos pudieran desplegar modelos MoE. Especialmente a través de la estrategia de "Paralelismo de Expertos Amplio" (Wide Expert Parallel), los modelos podían servir con lotes más grandes, reduciendo significativamente los costes de inferencia.

Inventaron mecanismos como MLA, DSA, CSA, HCA para reducir la necesidad de KV Cache, y hacer que la demanda computacional que crece con la longitud del contexto se mantuviera lo más cercana posible a una constante.

Inventaron Engram, intercambiando memoria por eficiencia computacional.

También inventaron mHC, permitiendo un entrenamiento estable incluso cuando se amplía la escala del modelo. Hay muchos ejemplos similares.

En la narrativa más universal del "viaje del héroe", el héroe nunca decide al principio adónde conduce exactamente su viaje. Él va descubriendo su verdadera y gran misión a lo largo del camino, aprendiendo y completándola a pesar de los obstáculos. Encuentra muchos escépticos, pero elige ignorarlos. También se enfrenta a muchos actores malintencionados. Tiene defectos o debilidades evidentes, pero al final los supera y completa su misión. Se enfrenta a desafíos aparentemente insuperables, pero encuentra formas de aliarse y aprende a usar sabiamente recursos limitados y preciosos. Es esto lo que hace que el público quiera animar al héroe. Esta es también la razón por la que DeepSeek gana seguidores, respeto global y opositores.

Como detallaré a continuación, DeepSeek ha estado en este camino durante mucho tiempo y ha ido descubriendo gradualmente su destino final: su objetivo no es vender planes de suscripción para programación, sino impulsar un ecosistema de hardware de IA chino de 10 billones de dólares y lograr una valoración propia de 1 billón de dólares. En el proceso, también creará oportunidades para muchos nuevos participantes en el ecosistema de hardware occidental.

Empecemos con algunos cálculos interesantes sobre KV Cache

Mira este oportuno tuit reciente de @SemiAnalysis_:

¡DeepSeek ha resuelto este problema mejor que nadie!

Hagamos primero algunos cálculos interesantes sobre KV Cache. No te preocupes, incluso si no te gustan las matemáticas. Usaremos la calculadora de KV Cache recientemente publicada para ver cuánto ahorro de KV Cache trae DeepSeek V4 Pro y compararlo con los últimos modelos GLM y Qwen.

Aquí calculo para una longitud de contexto de 1 millón, asumiendo una precisión KV de 8 bits y una precisión del indexador de 16 bits. También puedes probar tú mismo esta calculadora: https://kvcache.ai/tools/kv-cache-calculator/

¡También puedes probar la calculadora tú mismo!

Con una longitud de contexto de 1 millón:

· DeepSeek V4 solo necesita 5.48 GB de HBM;

· GLM-5 necesita 60 GB de HBM;

· Qwen3-235B-A22B necesita hasta 89 GB de HBM.

Es importante tener en cuenta que:

· DeepSeek es un modelo de 1.6 billones de parámetros;

· GLM-5 tiene aproximadamente 700 mil millones de parámetros y ya adopta MLA y DSA de DeepSeek, aunque no utiliza el último mecanismo de atención comprimida;

· Qwen3-235B-A22B tiene aproximadamente 235 mil millones de parámetros y utiliza el mecanismo de atención GQA.

DeepSeek ya ha hecho contribuciones fundamentales para aliviar la presión sobre la memoria. Si este tipo de innovaciones se adoptan ampliamente, reducirán drásticamente el coste de ejecución de agentes de largo ciclo y desbloquearán la siguiente ola de nuevas aplicaciones.

Comparación de la ocupación de KV Cache para un contexto de 1 millón de tokens y diferentes escalas de modelo

La metodología detrás de la "locura"

El hecho de que el volumen de KV Cache pueda ser tan pequeño sin sacrificar la calidad del modelo es precisamente la razón por la que DeepSeek puede ofrecer caché de larga duración a un precio extremadamente bajo: menos del 3% del precio de acierto de caché de Sonnet 4.6, y DeepSeek puede retener el caché durante horas.

Para tareas de largo ciclo, un KV Cache más pequeño significa que puede descargarse económicamente a SSD y recargarse cuando sea necesario. Esto reduce la dependencia del HBM. Desde la perspectiva de la industria de hardware de IA chino, el HBM no solo tiene suministro limitado, sino que también es uno de los tipos de memoria más difíciles de fabricar.

Además, DeepSeek ha desarrollado tecnología para cargar KV Cache desde SSD más rápidamente, como se describe en su artículo sobre Dual Path.

DeepSeek V4 comprime tanto el KV Cache que este paso podría incluso dejar de ser necesario.

Entonces, ¿quién se beneficia más directamente de la compresión de KV Cache?

¿Quién suministra SSD a gran escala? No olvidemos que YMTC (Yangtze Memory Technologies Co.) se está convirtiendo en un gigante en el campo de la NAND 3D. La NAND puede ayudar a DeepSeek a evitar recalcular el KV. A su vez, DeepSeek crea un mercado enorme para la NAND y los SSD, beneficiando no solo a YMTC, sino también a otros fabricantes relacionados.

Sin embargo, no se trata solo de NAND y SSD.

La memoria LPDDR también tiene un gran potencial. Puede servir como lugar para almacenar los pesos del modelo y transmitirlos en streaming al HBM cuando sea necesario, aliviando así la presión sobre la demanda de HBM. El equipo de SGLang publicó una buena entrada de blog al respecto. El siguiente diagrama muestra cómo funciona este esquema.

Aunque DeepSeek no ha diseñado específicamente para este esquema, su arquitectura MoE, su gran cantidad de modelos expertos y sus pesos de 4 bits facilitan la implementación de este enfoque.

Este diagrama esquemático muestra cómo podría usarse la memoria y cómo los pesos del modelo podrían transmitirse en streaming desde LPDDR al HBM. Recomiendo encarecidamente leer la entrada del blog de SGLang.

Si se combina esta innovación con un KV Cache extremadamente compacto y sin pérdidas, se reducirá significativamente la necesidad de HBM.

Entonces, ¿quién produce LPDDR en China? La respuesta es CXMT, es decir, ChangXin Memory Technologies. Solo están aproximadamente medio generación atrás en velocidad de LPDDR y una generación atrás en densidad, la diferencia no es enorme.

Además de un suministro abundante de NAND, el ecosistema de IA chino también tendrá en un futuro próximo un suministro abundante de LPDDR. ¿Esto puede aliviar la presión sobre la capacidad de cálculo? Respuesta: Sí. Sigue leyendo.

El uso inteligente de la memoria también puede aliviar la presión sobre las GPU / ASIC

El uso de NAND para almacenar KV Cache es bastante fácil de entender: permite retener el KV Cache durante más tiempo, reduce la presión sobre el HBM y evita recalcular el KV Cache, aliviando así la carga computacional de las GPU y ASIC.

Entonces, ¿puede la LPDDR funcionar de manera similar? Además de ser una ubicación de almacenamiento desde la cual se pueden transmitir los pesos "bajo demanda" al HBM, ¿puede reducir aún más la presión computacional?

Respuesta: Sí.

La LPDDR se puede utilizar para almacenar grandes cantidades de contenido llamado Engram. En el artículo de Engram de DeepSeek, señalan que MoE puede expandir la capacidad del modelo a través de cálculo condicional, pero el Transformer carece de un mecanismo nativo de "búsqueda de conocimiento". Por lo tanto, los Transformers a menudo tienen que simular de manera ineficiente el proceso de recuperación a través del cálculo.

Para resolver este problema, DeepSeek propuso el módulo Engram. Modernizó el embedding clásico de N-gram, transformándolo en un mecanismo de búsqueda basado en hash O(1), creando así una ruta de esparcimiento complementaria que llaman memoria condicional (conditional memory).

Este enfoque puede ahorrar cálculo, pero también requiere memoria para albergar la tabla de embedding, que en sí misma puede ser muy grande.

Esencialmente, este es un esquema típico de "intercambiar memoria por cálculo". Pero la idea clave es: desde el coste de lectura por bit de datos, el lado de la "memoria" es mucho más barato: una búsqueda en LPDDR es mucho más barata que hacer que los datos pasen completamente por múltiples capas de Transformer para un cálculo hacia adelante. Por lo tanto, a gran escala, este es un intercambio muy rentable.

Así es como DeepSeek intercambia algo de memoria para ahorrar cálculo.

Un intercambio que vale la pena

Dado que no tienen la misma densidad de transistores en chips, ni EUV, es probable que las GPU y ASIC chinas sigan estando por detrás de las GPU occidentales en términos de potencia bruta de FLOPs a largo plazo. También tienen brechas evidentes en empaquetado avanzado. Por lo tanto, este tipo de intercambios valen mucho la pena, especialmente dado que China puede producir grandes cantidades de memoria NAND y LPDDR.

Revisando la estrategia a largo plazo de DeepSeek

A partir de estas innovaciones, el objetivo de DeepSeek parece no ser ganar unos cientos de millones de dólares en beneficios a corto plazo. Muchas de sus elecciones pasadas lo demuestran: hasta ahora no tiene multimodalidad, ni modelos de voz, y mucho menos modelos de vídeo.

En lo que realmente está participando es en un juego a largo plazo, potencialmente de 10 billones de dólares: impulsar la formación de un ecosistema alternativo de hardware de IA.

Esto no es solo para que los fabricantes de memoria chinos se conviertan en actores clave en el mercado de hardware de IA chino y global, sino también para reducir fundamentalmente los requisitos de recursos, haciendo que el entrenamiento y servicio de modelos de IA sean más eficientes en costes. De esta manera, muchos fabricantes de GPU, ASIC y chips de red pueden convertirse en opciones viables.

Al mismo tiempo, estas innovaciones también beneficiarán al ecosistema de código abierto occidental y a los nuevos fabricantes de hardware.

Todos los indicios ya han aparecido. Repasemos en detalle las innovaciones que DeepSeek ha propuesto hasta ahora:

1. Modelo Mixto de Expertos (MoE) y MLA introducidos en DeepSeek V2

DeepSeek introdujo MoE y MLA en V2. MoE redujo la cantidad de cálculo necesario para entrenar modelos de alta inteligencia en aproximadamente un 40% a 50%; MLA redujo el KV Cache en un 90%.

Esto hizo que descargar el KV Cache a SSD fuera bastante eficiente.

Estas ideas aparecieron por primera vez en el artículo de DeepSeek V2 publicado por DeepSeek en mayo de 2024. Más tarde, también sentaron las bases para el entrenamiento de DeepSeek V3. En ese momento, DeepSeek entrenó un sistema con un rendimiento cercano al de los modelos propietarios utilizando solo 2048 GPU H800 con rendimiento reducido.

2. DSA: Introducido en DeepSeek V3.2 Exp para reducir la sobrecarga computacional en escenarios de contexto largo y aliviar la presión del ancho de banda del HBM.

El papel central de DSA es garantizar que la cantidad de cálculo no crezca continuamente con el aumento de la longitud del contexto. Observa el gráfico a continuación: a medida que aumenta la longitud del contexto, el tiempo de procesamiento de DeepSeek-V3.2 se mantiene básicamente estable.

3. mHC: Propuesto por DeepSeek en diciembre de 2025 en el artículo "mHC: Manifold-Constrained Hyper-Connections".

mHC es una innovación arquitectónica a nivel macro de DeepSeek que rediseña cómo fluye la información entre las capas del Transformer.

En el pasado, desde ResNet, los modelos solían usar conexiones residuales estándar, es decir, x + F(x). Lo que hace mHC es expandir el flujo residual en múltiples canales de información paralelos y permitir que el modelo mezcle de manera aprendible entre estos canales. La clave es que restringe la matriz de mezcla para que sea doblemente estocástica, es decir, la limita al politopo de Birkhoff a través de la proyección de Sinkhorn-Knopp. Esto garantiza matemáticamente que la amplitud de la señal pueda mantenerse estable sin importar cuán profundo sea el apilamiento del modelo.

Esto resuelve el problema de inestabilidad catastrófica que enfrentaban las Hyper-Connections sin restricciones. Las Hyper-Connections fueron propuestas inicialmente por ByteDance, pero sin restricciones, la amplificación de la señal explotaba hasta 3000 veces a una escala de 27 mil millones de parámetros, lo que finalmente hacía colapsar el entrenamiento por completo.

El coste computacional de mHC es bajo: solo agrega aproximadamente un 6.7% de sobrecarga real en el tiempo de entrenamiento, porque no cambia los FLOPs de las capas de atención o FFN, solo cambia cómo se enrutan las salidas de estas capas entre las capas.

Pero la mejora de rendimiento es bastante notable: a una escala de 27 mil millones de parámetros, mHC mejora 7.2 puntos en tareas de razonamiento de BIG-Bench Hard, 3.2 puntos en DROP, 2.8 puntos en tareas matemáticas de GSM8K y 1.4 puntos en tareas de conocimiento general de MMLU. Y estas mejoras se logran con la misma escala de modelo y un presupuesto computacional casi idéntico.

Esencialmente, mHC logra una mayor inteligencia por parámetro sin agregar FLOPs adicionales, al proporcionar a la red una topología de enrutamiento de información entre capas más rica y expresiva.

mHC es un diseño arquitectónico complejo, pero permite un proceso de entrenamiento más estable y una mayor inteligencia por parámetro.

4. CSA, HSA: Introducidos por DeepSeek en V4 en abril de 2026.

El objetivo de CSA y HSA es reducir la necesidad de KV Cache en otro 90% mediante la compresión de tokens KV, reduciendo significativamente los FLOPs requeridos y aliviando simultáneamente la presión sobre el HBM y las GPU / ASIC.

5. Engram: Introducido por DeepSeek en el primer trimestre de 2026, esencialmente intercambiando memoria, es decir, memoria LPDDR, por eficiencia computacional en cierta medida.

Como se muestra en el gráfico detallado a continuación, con el mismo presupuesto total de parámetros, Engram aporta una mejora de rendimiento notable.

6. Engram: Introducido por DeepSeek en el primer trimestre de 2026, esencialmente intercambiando memoria, es decir, memoria LPDDR, por eficiencia computacional en cierta medida.

Como se muestra en el gráfico detallado a continuación, con el mismo presupuesto total de parámetros, Engram aporta una mejora de rendimiento notable.

Esta es la recomendación que DeepSeek compartió con los fabricantes de hardware en su artículo de V4. Estoy seguro de que en las conversaciones privadas dan aún más retroalimentación.

7. La inversión en TileLang también apunta en la misma dirección: DeepSeek no solo está resolviendo sus propios cuellos de botella de cálculo, sino que está impulsando la capacidad del ecosistema de hardware chino para competir con el occidental.

Con TileLang, los desarrolladores pueden escribir el kernel solo una vez, es decir, el código subyacente para el cálculo, y luego hacer que se ejecute con éxito en múltiples plataformas de hardware, siempre que estas plataformas tengan un backend de TileLang correspondiente.

Espero que otros laboratorios de IA chinos se unan gradualmente. Esto ayudará a los fabricantes de hardware chinos a abordar la llamada "ventaja competitiva de CUDA" de manera indirecta. Al mismo tiempo, también liberará el potencial de más hardware occidental, como AMD.

Es necesario aclarar que muchas plataformas de hardware de IA chinas ya ofrecen compatibilidad con CUDA o una capa de traducción de CUDA. Por ejemplo, Moore Threads, Metax, Biren y Tianshu Zhixin son fabricantes de chips chinos que logran un alto grado de compatibilidad con CUDA a través de capas de traducción. Por lo tanto, en teoría, no necesariamente necesitan TileLang.

Aprendizaje por refuerzo a gran escala y RSI

A medida que DeepSeek obtenga más fuentes de capacidad de cálculo, es decir, más opciones de hardware, y al mismo tiempo disminuya la demanda de recursos computacionales del propio modelo, podrá avanzar en proyectos de entrenamiento más ambiciosos, especialmente el post-entrenamiento por refuerzo.

El aprendizaje por refuerzo requiere generar muchas trayectorias, es decir, generar billones de tokens. Este proceso rápidamente se vuelve extremadamente costoso. Además, si se quiere entrenar un modelo con una longitud de contexto de 1 millón, se necesitan generar trayectorias de la misma longitud. Solo entrenando el modelo en estas trayectorias ultra largas se puede soportar realmente tareas de largo ciclo.

Además, al aumentar las opciones de hardware, DeepSeek tendrá acceso a más recursos de hardware, lo que impulsará la investigación automatizada, es decir, RSI. RSI se refiere a que la IA diseña y ejecuta sus propios experimentos. Este método implica mucho ensayo y error, y los costes aumentan rápidamente. Pero RSI es crucial para explorar el espacio completo de diseño de modelos. Antes de avanzar hacia AGI, y posteriormente hacia ASI, DeepSeek debe poseer capacidades de RSI.

Lo que DeepSeek hace hoy, toda la industria lo seguirá mañana

Las innovaciones de DeepSeek en torno a Modelos Mixtos de Expertos, MLA, DSA, etc., ya han sido adoptadas gradualmente por otros laboratorios de IA a nivel global y en China.

Por ejemplo, ZAI, el desarrollador de la serie de modelos GLM, utiliza MLA y DSA. Kimi, es decir, Moonshot, también adopta MLA y no evita afirmar que su arquitectura se basa en el diseño de arquitectura de DeepSeek. A su vez, DeepSeek también utiliza el optimizador Muon, que fue adoptado primero por Kimi (Moonshot) para entrenamiento a gran escala.

Es necesario aclarar:

MoE fue propuesto por primera vez por Google en 2017, siendo Noam Shazeer un autor clave. La contribución de DeepSeek radica en aplicar MoE a gran escala e inventar sus propios trucos complementarios.

Muon, es decir, el optimizador MomentUm Orthogonalized by Newton-Schulz, fue propuesto por el investigador de aprendizaje automático Keller Jordan a fines de 2024. El equipo de Kimi (Moonshot) fue el primero en utilizarlo para entrenamiento a gran escala.

¿Y qué hay del problema de ganar dinero?

Podemos mirar el interesante ejemplo de OpenAI.

OpenAI obtuvo warrants / opciones para comprar acciones de AMD y Cerebras a un precio bajo, vinculados a sus hitos de consumo de capacidad de cálculo. Para AMD y Cerebras, este fue un trato muy rentable. Porque una vez que OpenAI se compromete a usar su hardware, su probabilidad de éxito a largo plazo aumenta drásticamente.

El anuncio de AMD incluía este párrafo:

"Como parte del acuerdo, para alinear aún más los intereses estratégicos de ambas partes, AMD emitió a OpenAI warrants para comprar hasta 160 millones de acciones ordinarias de AMD, que se otorgarán gradualmente según el logro de hitos específicos. El primer lote se otorgará al completar el despliegue inicial de 1 gigavatio, y los lotes posteriores se otorgarán gradualmente a medida que la escala de adquisición se expanda a 6 gigavatios. Las condiciones de otorgamiento también están vinculadas a que AMD alcance objetivos de precio de acciones específicos y que OpenAI logre hitos tecnológicos y comerciales necesarios para un despliegue a gran escala por parte de AMD."

Espero que DeepSeek también llegue a acuerdos similares con múltiples fabricantes chinos de memoria, ASIC, CPU y tecnologías de red, colaborando profundamente con ellos para que sus pilas de hardware puedan manejar cargas de trabajo de IA líderes.

Considerando que la capitalización bursátil total de todas las acciones de IA occidentales, incluidos los aliados del este de Asia, supera con creces los 10 billones de dólares, este enfoque de "obtener retorno de capital a través de la cooperación" permitirá a DeepSeek ayudar a China a construir una industria igualmente enorme y obtener su parte del pastel, logrando finalmente su propia valoración de 1 billón de dólares.

Esto no solo hará que DeepSeek gane mucho más dinero que los negocios tradicionales de suscripción de aplicaciones, sino que también logrará su objetivo declarado de "hacer que AGI beneficie a todos". Liang Wenfeng es un gran admirador de Jim Simons y un jugador de capital lo suficientemente inteligente como para no perderse esto.

Si miras hacia atrás a todo lo que DeepSeek ha hecho hasta ahora, esta es la única explicación que tiene más sentido.

Estas son las acciones clave de IA. El gráfico aún no incluye a los hyperscalers, es decir, los grandes proveedores de nube, ni a muchas otras empresas relacionadas.

Enlace al artículo original

Criptos en tendencia

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Preguntas relacionadas

Q¿Cuál es la estrategia fundamental de DeepSeek según el artículo, más allá de la competencia directa en modelos de IA?

ALa estrategia fundamental de DeepSeek, según el artículo, no es competir directamente en la capa de aplicaciones o servicios de suscripción, sino impulsar la formación de un ecosistema alternativo de hardware de IA, valorado en 10 billones de dólares, al tiempo que busca una valoración propia de 1 billón de dólares. Su objetivo es remodelar la estructura de costos del entrenamiento y la inferencia de IA mediante innovaciones en arquitecturas de modelos, memoria y sistemas, reduciendo la dependencia de componentes de alto rendimiento como HBM y el ecosistema CUDA, y fomentando la viabilidad de hardware local (como NAND, SSD, LPDDR) y nuevos actores en ASIC y GPU.

Q¿Cómo contribuyen las innovaciones de DeepSeek en KV Cache (como MLA, DSA, CSA) a su estrategia general?

ALas innovaciones de DeepSeek en KV Cache, como MLA (Multi-head Latent Attention), DSA (Dynamic Sparse Attention) y CSA (Compressed Sparse Attention), reducen drásticamente la necesidad de memoria de alto ancho de banda (HBM) y los requisitos computacionales (FLOPs). Por ejemplo, DeepSeek V4 requiere solo ~5.48 GB de HBM para 1 millón de tokens de contexto, frente a los 60-89 GB de competidores. Esto alivia la presión sobre un componente escaso y difícil de fabricar, permite descargar la caché KV a almacenamiento más económico como SSD, reduce la carga en GPU/ASIC y, en última instancia, hace viable el uso de hardware alternativo, beneficiando a fabricantes de memoria y semiconductores.

Q¿Qué papel juegan la memoria NAND/SSD y LPDDR en la visión de DeepSeek para un ecosistema de hardware de IA?

ALa memoria NAND/SSD y LPDDR son componentes clave en la visión de DeepSeek. La caché KV altamente comprimida puede almacenarse de manera económica en SSD/NAND (fabricados por empresas como YMTC), permitiendo su retención a largo plazo y evitando recálculos costosos. LPDDR (producido por empresas como CXMT) se puede utilizar para el almacenamiento y carga por secuencias de los pesos del modelo hacia la HBM, y también para albergar tablas de búsqueda de 'Engram', un mecanismo que intercambia memoria por eficiencia computacional. Esto reduce la dependencia de HBM y aprovecha las capacidades de fabricación masiva de memoria en China, creando un mercado para estos componentes.

Q¿Qué es TileLang y cómo se relaciona con los esfuerzos de DeepSeek para diversificar el ecosistema de hardware?

ATileLang es un lenguaje/intermedio de computación desarrollado por DeepSeek que permite a los desarrolladores escribir kernels (código de cálculo de bajo nivel) una vez y ejecutarlos en múltiples plataformas de hardware, siempre que exista un backend de TileLang para ellas. Este esfuerzo busca debilitar la 'ventaja competitiva' del ecosistema CUDA de NVIDIA, facilitando que los fabricantes de hardware alternativo (tanto chinos como occidentales, como AMD) ejecuten cargas de trabajo de IA avanzadas. Al promover la portabilidad del código, DeepSeek impulsa la competitividad del ecosistema de hardware chino y amplía las opciones de cálculo disponibles.

Q¿Cómo podría DeepSeek generar valor económico y alcanzar una valoración de 1 billón de dólares, según la hipótesis del artículo?

ASegún el artículo, DeepSeek podría generar un valor económico monumental no principalmente a través de API o suscripciones, sino mediante acuerdos estratégicos de participación en el capital (warrants/opciones sobre acciones) con fabricantes de hardware (memoria, ASIC, GPU, red) cuyo éxito y valoración impulsa. Similar al acuerdo de OpenAI con AMD, si DeepSeek hace viable el hardware de estos socios para cargas de trabajo líderes de IA, podría recibir una parte significativa del valor creado en un ecosistema industrial de 10 billones de dólares. Esto, combinado con su papel central en habilitar una oferta de IA de menor costo, podría llevarlo a una valoración de 1 billón de dólares.

Lecturas Relacionadas

Paquete de software Injective afectado por ataque malicioso en la cadena de suministro – Detalles

El paquete de software de Injective Labs fue comprometido en un ataque a la cadena de suministro, donde un actor malicioso subió una versión infectada (@injectivelabs/sdk-ts v1.20.21) al gestor de paquetes npm. El atacante logró acceso a la cuenta de GitHub de un colaborador legítimo para distribuir commits maliciosos. El código malicioso, disfrazado como telemetría, no se activaba durante la instalación, sino al usar funciones específicas de generación de carteras (fromMnemonic o fromHex), robando así claves privadas y frases semilla. Esto permitía recrear y drenar las carteras de criptomonedas de las víctimas. El paquete comprometido tenía unas 50.000 descargas semanales y afectó a 87 paquetes que dependían directamente de él, además de extenderse a través de dependencias transitivas en otros 17 paquetes de Injective. Aunque luego se publicó una versión limpia (v1.20.23), la versión maliciosa permaneció disponible. Se recomienda a los usuarios afectados rotar todas sus credenciales, crear nuevas carteras y transferir sus fondos. Este incidente coincide con la pérdida de $20 millones por BonkDAO debido a una propuesta de gobernanza maliciosa.

ambcryptoHace 1 hora(s)

Paquete de software Injective afectado por ataque malicioso en la cadena de suministro – Detalles

ambcryptoHace 1 hora(s)

¿Dónde está el anclaje de valoración de MegaETH tras la salida de Aave y la fuerte volatilidad de su TVL?

Según datos de DefiLlama, MegaETH experimentó una fuerte volatilidad en su TVL entre el 9 y el 10 de julio, cayendo brevemente a poco más de 30 millones de dólares, lo que supone una caída del 60% en 24 horas y un descenso del 70% respecto al pico de mayo. El principal protocolo en cadena, Aave V3, retiró alrededor del 80% de su liquidez en un día. El precio del token MEGA cayó a unos 0,048 dólares, con una capitalización de mercado de unos 54 millones de dólares y un FDV de aproximadamente 4.800 millones. MegaETH, una vez una de las nuevas blockchains más esperadas, contó con una fuerte afluencia de capital inicial respaldado por importantes fondos de capital de riesgo y entusiasmo de KOLs. En su punto máximo, su FDV alcanzó los 20.000 millones de dólares y su TVL de DeFi llegó a 245 millones, posicionándose entre las 11 principales blockchains. Sin embargo, su TVL dependía en gran medida de Aave y de estrategias de apalancamiento con stablecoins como USDe. Cuando el rendimiento de USDe cayó por debajo del coste de préstamo en Aave, estas posiciones se desmontaron, provocando una salida masiva de capital. Actualmente, el valor de MegaETH parece desalineado con su actividad real. Con un FDV de 4.700 millones de dólares, los protocolos de la cadena generan menos de 90.000 dólares de ingresos reales en 30 días y tienen solo 2.619 direcciones activas diarias. Además, gran parte de los ingresos provienen de una aplicación de juego de cartas, Monster, y no de protocolos DeFi. Su stablecoin nativa, USDM, también está perdiendo valor. La comunidad critica la falta de comunicación del equipo y la migración de proyectos a otras cadenas. El caso de MegaETH refleja una tendencia más amplia en la que el mercado está dejando de premiar los altos TVL impulsados por incentivos o arbitraje, exigiendo en su lugar fundamentos sólidos, ingresos reales y un ecosistema saludable para respaldar la valoración. A menos que el equipo pueda convertir el capital recaudado en adopción y utilidad real, es difícil ver un pilar sólido para su valoración más allá de posibles rebotes temporales por sentimiento del mercado.

链捕手Hace 1 hora(s)

¿Dónde está el anclaje de valoración de MegaETH tras la salida de Aave y la fuerte volatilidad de su TVL?

链捕手Hace 1 hora(s)

Informe en profundidad de Goldman Sachs: ¿Quiénes serán los ganadores a largo plazo en la industria china de modelos de IA a gran escala?

Informe de Goldman Sachs sobre los posibles ganadores a largo plazo en la industria china de modelos de IA. Los modelos de inteligencia artificial de China se encuentran en un punto de inflexión histórico. Según Goldman Sachs, los modelos de código abierto han alcanzado un rendimiento cercano al de los modelos propietarios globales líderes. Esta evolución ha pasado del enfoque en la eficiencia de costos de DeepSeek el año pasado al momento de la inteligencia del modelo de GLM de Zhipu este año. La adopción por parte de empresas chinas y pymes globales se está expandiendo rápidamente, creando un efecto de vuelo de datos que impulsará nuevas iteraciones. La clave del éxito radica en la innovación arquitectónica y la eficiencia de parámetros, lo que permite a los modelos chinos lograr un rendimiento comparable a un costo significativamente menor. Se está formando una estructura de mercado de dos niveles: un segmento premium (ej. GLM5.2 de Zhipu) y un segmento de bajo costo para tareas de agentes inteligentes y usuarios sensibles al precio. Se proyecta que los ingresos por API y suscripciones de modelos chinos crecerán drásticamente, de 35 mil millones de RMB en 2026 a 879 mil millones en 2030. La estrategia predominante es el código abierto o de pesos abiertos, que favorece la adopción, aunque presenta desafíos para la monetización. La industria podría migrar hacia un modelo de "pesos abiertos + licencia comunitaria" con acuerdos de reparto de ingresos. La expansión internacional, especialmente en mercados no estadounidenses, representa la mayor oportunidad de crecimiento, aprovechando la ventaja de costo-rendimiento. Goldman Sachs identifica a los posibles ganadores utilizando un marco tridimensional que evalúa la capacidad de fijación de precios, la ventaja de costos y la solidez financiera. En modelos de texto básico, Zhipu AI y DeepSeek tienen la posición más sólida. En el ámbito multimodal/generación de video, ByteDance lidera con su modelo Seed. La firma mantiene su calificación de compra para MiniMax, citando su atractiva valoración.

marsbitHace 2 hora(s)

Informe en profundidad de Goldman Sachs: ¿Quiénes serán los ganadores a largo plazo en la industria china de modelos de IA a gran escala?

marsbitHace 2 hora(s)

Informe Profundo de Goldman Sachs: ¿Quién será el ganador a largo plazo en la industria china de modelos de IA grandes?

China se encuentra en un punto de inflexión histórico en cuanto a modelos de IA a gran escala. Según Goldman Sachs, los modelos chinos de código abierto/ponderaciones abiertas han alcanzado un rendimiento cercano al de los mejores modelos propietarios globales, con una rápida adopción por empresas chinas y pymes mundiales, creando un efecto de círculo virtuoso de datos para futuras mejoras. El informe destaca la ventaja de coste-eficiencia de los modelos chinos, lograda mediante innovaciones arquitectónicas (como MoE) que permiten alto rendimiento con menos parámetros activos (3-5%). Modelos como DeepSeek V4 Pro (1,6 billones de parámetros) y GLM5.2 de Zhipu (0,7 billones) son ejemplos clave. El LongCat 2.0 de Meituan, entrenado con chips nacionales, marca un hito en la autosuficiencia. El mercado se está estructurando en dos niveles: modelos premium (como GLM5.2, ~1$/millón de tokens) y modelos económicos para agentes de IA (~0.06-0.2$/millón). Se proyecta que los ingresos por API/suscripción crezcan desde 35.000 millones de RMB en 2026 hasta 879.000 millones en 2030. La estrategia predominante es el código abierto o ponderaciones abiertas (salvo ByteDance), lo que fomenta la adopción pero limita la monetización directa. Se espera una transición hacia licencias comunitarias con acuerdos de reparto de ingresos para mejorar la rentabilidad. La expansión internacional, especialmente en mercados no estadounidenses, es clave. El enfoque empresarial global está cambiando de maximizar tokens a priorizar el ROI. Plataformas como AWS Bedrock y Gemini ya ofrecen modelos chinos. Para identificar a los ganadores a largo plazo, Goldman Sachs aplica un marco basado en capacidad de fijación de precios, ventaja en costes y solidez financiera. En modelos de texto, Zhipu y DeepSeek tienen la posición más fuerte. En multimodal/generación de video, ByteDance lidera con Seed, seguido por Kuaishou y MiniMax. Se mantiene una calificación de compra para MiniMax y Kuaishou.

链捕手Hace 2 hora(s)

Informe Profundo de Goldman Sachs: ¿Quién será el ganador a largo plazo en la industria china de modelos de IA grandes?

链捕手Hace 2 hora(s)

Circle obtiene la aprobación final de la OCC para un banco fiduciario nacional que fortalecerá la infraestructura de USDC

Circle ha recibido la aprobación final de la Oficina del Contralor de la Moneda de EE.UU. (OCC) para establecer Circle National Trust, un banco fiduciario nacional. Este hito regulatorio permitirá a la emisora del stablecoin USDC operar servicios de custodia de activos digitales bajo supervisión bancaria federal directa. La nueva entidad, inicialmente, brindará servicios de custodia para Circle y sus afiliados, con miras a atender también a instituciones financieras. La aprobación sienta las bases para que, en el futuro, la gestión de las reservas de USDC pueda integrarse en este marco regulatorio federal, reforzando la infraestructura del stablecoin con mayor transparencia y gobernanza. Este paso coloca a Circle a la vanguardia de la integración de empresas cripto en el sistema bancario tradicional estadounidense.

ambcryptoHace 2 hora(s)

Circle obtiene la aprobación final de la OCC para un banco fiduciario nacional que fortalecerá la infraestructura de USDC

ambcryptoHace 2 hora(s)

Trading

Spot

Artículos destacados

Qué es $S$

Entendiendo SPERO: Una Visión General Completa Introducción a SPERO A medida que el panorama de la innovación sigue evolucionando, la aparición de tecnologías web3 y proyectos de criptomonedas juega un papel fundamental en la configuración del futuro digital. Un proyecto que ha llamado la atención en este campo dinámico es SPERO, denotado como SPERO,$$s$. Este artículo tiene como objetivo recopilar y presentar información detallada sobre SPERO, para ayudar a entusiastas e inversores a comprender sus fundamentos, objetivos e innovaciones dentro de los dominios web3 y cripto. ¿Qué es SPERO,$$s$? SPERO,$$s$ es un proyecto único dentro del espacio cripto que busca aprovechar los principios de descentralización y tecnología blockchain para crear un ecosistema que promueva la participación, la utilidad y la inclusión financiera. El proyecto está diseñado para facilitar interacciones entre pares de nuevas maneras, proporcionando a los usuarios soluciones y servicios financieros innovadores. En su esencia, SPERO,$$s$ tiene como objetivo empoderar a los individuos al proporcionar herramientas y plataformas que mejoren la experiencia del usuario en el espacio de las criptomonedas. Esto incluye habilitar métodos de transacción más flexibles, fomentar iniciativas impulsadas por la comunidad y crear caminos para oportunidades financieras a través de aplicaciones descentralizadas (dApps). La visión subyacente de SPERO,$$s$ gira en torno a la inclusividad, buscando cerrar brechas dentro de las finanzas tradicionales mientras aprovecha los beneficios de la tecnología blockchain. ¿Quién es el Creador de SPERO,$$s$? La identidad del creador de SPERO,$$s$ sigue siendo algo oscura, ya que hay recursos públicos limitados que proporcionan información de fondo detallada sobre su(s) fundador(es). Esta falta de transparencia puede derivarse del compromiso del proyecto con la descentralización, una ética que muchos proyectos web3 comparten, priorizando las contribuciones colectivas sobre el reconocimiento individual. Al centrar las discusiones en torno a la comunidad y sus objetivos colectivos, SPERO,$$s$ encarna la esencia del empoderamiento sin señalar a individuos específicos. Como tal, entender la ética y la misión de SPERO es más importante que identificar a un creador singular. ¿Quiénes son los Inversores de SPERO,$$s$? SPERO,$$s$ cuenta con el apoyo de una diversa gama de inversores que van desde capitalistas de riesgo hasta inversores ángeles dedicados a fomentar la innovación en el sector cripto. El enfoque de estos inversores generalmente se alinea con la misión de SPERO, priorizando proyectos que prometen avances tecnológicos sociales, inclusividad financiera y gobernanza descentralizada. Estas fundaciones de inversores suelen estar interesadas en proyectos que no solo ofrecen productos innovadores, sino que también contribuyen positivamente a la comunidad blockchain y sus ecosistemas. El respaldo de estos inversores refuerza a SPERO,$$s$ como un contendiente notable en el rápidamente evolutivo dominio de los proyectos cripto. ¿Cómo Funciona SPERO,$$s$? SPERO,$$s$ emplea un marco multifacético que lo distingue de los proyectos de criptomonedas convencionales. Aquí hay algunas de las características clave que subrayan su singularidad e innovación: Gobernanza Descentralizada: SPERO,$$s$ integra modelos de gobernanza descentralizada, empoderando a los usuarios para participar activamente en los procesos de toma de decisiones sobre el futuro del proyecto. Este enfoque fomenta un sentido de propiedad y responsabilidad entre los miembros de la comunidad. Utilidad del Token: SPERO,$$s$ utiliza su propio token de criptomoneda, diseñado para servir a diversas funciones dentro del ecosistema. Estos tokens permiten transacciones, recompensas y la facilitación de servicios ofrecidos en la plataforma, mejorando la participación y utilidad general. Arquitectura en Capas: La arquitectura técnica de SPERO,$$s$ soporta la modularidad y escalabilidad, permitiendo la integración fluida de características y aplicaciones adicionales a medida que el proyecto evoluciona. Esta adaptabilidad es fundamental para mantener la relevancia en el siempre cambiante paisaje cripto. Participación de la Comunidad: El proyecto enfatiza iniciativas impulsadas por la comunidad, empleando mecanismos que incentivan la colaboración y la retroalimentación. Al nutrir una comunidad sólida, SPERO,$$s$ puede abordar mejor las necesidades de los usuarios y adaptarse a las tendencias del mercado. Enfoque en la Inclusión: Al ofrecer tarifas de transacción bajas y interfaces amigables para el usuario, SPERO,$$s$ busca atraer a una base de usuarios diversa, incluyendo a individuos que anteriormente pueden no haber participado en el espacio cripto. Este compromiso con la inclusión se alinea con su misión general de empoderamiento a través de la accesibilidad. Cronología de SPERO,$$s$ Entender la historia de un proyecto proporciona información crucial sobre su trayectoria de desarrollo y hitos. A continuación, se presenta una cronología sugerida que mapea eventos significativos en la evolución de SPERO,$$s$: Fase de Conceptualización e Ideación: Las ideas iniciales que forman la base de SPERO,$$s$ fueron concebidas, alineándose estrechamente con los principios de descentralización y enfoque comunitario dentro de la industria blockchain. Lanzamiento del Whitepaper del Proyecto: Tras la fase conceptual, se publicó un whitepaper completo que detalla la visión, objetivos e infraestructura tecnológica de SPERO,$$s$ para generar interés y retroalimentación de la comunidad. Construcción de Comunidad y Primeras Interacciones: Se realizaron esfuerzos de divulgación activa para construir una comunidad de primeros adoptantes e inversores potenciales, facilitando discusiones en torno a los objetivos del proyecto y obteniendo apoyo. Evento de Generación de Tokens: SPERO,$$s$ llevó a cabo un evento de generación de tokens (TGE) para distribuir sus tokens nativos a los primeros seguidores y establecer liquidez inicial dentro del ecosistema. Lanzamiento de la dApp Inicial: La primera aplicación descentralizada (dApp) asociada con SPERO,$$s$ se puso en marcha, permitiendo a los usuarios interactuar con las funcionalidades centrales de la plataforma. Desarrollo Continuo y Alianzas: Actualizaciones y mejoras continuas en las ofertas del proyecto, incluyendo alianzas estratégicas con otros actores en el espacio blockchain, han moldeado a SPERO,$$s$ en un jugador competitivo y en evolución en el mercado cripto. Conclusión SPERO,$$s$ se erige como un testimonio del potencial de web3 y las criptomonedas para revolucionar los sistemas financieros y empoderar a los individuos. Con un compromiso con la gobernanza descentralizada, la participación comunitaria y funcionalidades diseñadas de manera innovadora, allana el camino hacia un paisaje financiero más inclusivo. Como con cualquier inversión en el rápidamente evolutivo espacio cripto, se anima a los potenciales inversores y usuarios a investigar a fondo y participar de manera reflexiva con los desarrollos en curso dentro de SPERO,$$s$. El proyecto muestra el espíritu innovador de la industria cripto, invitando a una exploración más profunda de sus innumerables posibilidades. Aunque el viaje de SPERO,$$s$ aún se está desarrollando, sus principios fundamentales pueden, de hecho, influir en el futuro de cómo interactuamos con la tecnología, las finanzas y entre nosotros en ecosistemas digitales interconectados.

148 Vistas totalesPublicado en 2024.12.17Actualizado en 2024.12.17

Qué es AGENT S

Agent S: El Futuro de la Interacción Autónoma en Web3 Introducción En el paisaje en constante evolución de Web3 y las criptomonedas, las innovaciones están redefiniendo continuamente cómo los individuos interactúan con las plataformas digitales. Uno de estos proyectos pioneros, Agent S, promete revolucionar la interacción humano-computadora a través de su marco agente abierto. Al allanar el camino para interacciones autónomas, Agent S tiene como objetivo simplificar tareas complejas, ofreciendo aplicaciones transformadoras en inteligencia artificial (IA). Esta exploración detallada se adentrará en las complejidades del proyecto, sus características únicas y las implicaciones para el dominio de las criptomonedas. ¿Qué es Agent S? Agent S se presenta como un marco agente abierto revolucionario, diseñado específicamente para abordar tres desafíos fundamentales en la automatización de tareas informáticas: Adquisición de Conocimiento Específico del Dominio: El marco aprende de manera inteligente a partir de diversas fuentes de conocimiento externas y experiencias internas. Este enfoque dual le permite construir un rico repositorio de conocimiento específico del dominio, mejorando su rendimiento en la ejecución de tareas. Planificación a Largo Plazo de Tareas: Agent S emplea planificación jerárquica aumentada por la experiencia, un enfoque estratégico que facilita la descomposición y ejecución eficiente de tareas intrincadas. Esta característica mejora significativamente su capacidad para gestionar múltiples subtareas de manera eficiente y efectiva. Manejo de Interfaces Dinámicas y No Uniformes: El proyecto introduce la Interfaz Agente-Computadora (ACI), una solución innovadora que mejora la interacción entre agentes y usuarios. Utilizando Modelos de Lenguaje Multimodal Grandes (MLLMs), Agent S puede navegar y manipular diversas interfaces gráficas de usuario sin problemas. A través de estas características pioneras, Agent S proporciona un marco robusto que aborda las complejidades involucradas en la automatización de la interacción humana con las máquinas, preparando el terreno para innumerables aplicaciones en IA y más allá. ¿Quién es el Creador de Agent S? Aunque el concepto de Agent S es fundamentalmente innovador, la información específica sobre su creador sigue siendo elusiva. El creador es actualmente desconocido, lo que resalta ya sea la etapa incipiente del proyecto o la elección estratégica de mantener a los miembros fundadores en el anonimato. Independientemente de la anonimidad, el enfoque sigue siendo las capacidades y el potencial del marco. ¿Quiénes son los Inversores de Agent S? Dado que Agent S es relativamente nuevo en el ecosistema criptográfico, la información detallada sobre sus inversores y patrocinadores financieros no está documentada explícitamente. La falta de información disponible públicamente sobre las bases de inversión u organizaciones que apoyan el proyecto plantea preguntas sobre su estructura de financiamiento y hoja de ruta de desarrollo. Comprender el respaldo es crucial para evaluar la sostenibilidad del proyecto y su posible impacto en el mercado. ¿Cómo Funciona Agent S? En el núcleo de Agent S se encuentra tecnología de vanguardia que le permite funcionar de manera efectiva en diversos entornos. Su modelo operativo se basa en varias características clave: Interacción Humano-Computadora: El marco ofrece planificación avanzada de IA, esforzándose por hacer que las interacciones con las computadoras sean más intuitivas. Al imitar el comportamiento humano en la ejecución de tareas, promete elevar las experiencias de los usuarios. Memoria Narrativa: Empleada para aprovechar experiencias de alto nivel, Agent S utiliza memoria narrativa para hacer un seguimiento de las historias de tareas, mejorando así sus procesos de toma de decisiones. Memoria Episódica: Esta característica proporciona a los usuarios orientación paso a paso, permitiendo que el marco ofrezca apoyo contextual a medida que se desarrollan las tareas. Soporte para OpenACI: Con la capacidad de funcionar localmente, Agent S permite a los usuarios mantener el control sobre sus interacciones y flujos de trabajo, alineándose con la ética descentralizada de Web3. Fácil Integración con APIs Externas: Su versatilidad y compatibilidad con diversas plataformas de IA aseguran que Agent S pueda integrarse sin problemas en ecosistemas tecnológicos existentes, convirtiéndolo en una opción atractiva para desarrolladores y organizaciones. Estas funcionalidades contribuyen colectivamente a la posición única de Agent S dentro del espacio cripto, ya que automatiza tareas complejas y de múltiples pasos con una intervención humana mínima. A medida que el proyecto evoluciona, sus aplicaciones potenciales en Web3 podrían redefinir cómo se desarrollan las interacciones digitales. Cronología de Agent S El desarrollo y los hitos de Agent S pueden encapsularse en una cronología que destaca sus eventos significativos: 27 de septiembre de 2024: Se lanzó el concepto de Agent S en un documento de investigación integral titulado “Un Marco Agente Abierto que Utiliza Computadoras como un Humano”, mostrando las bases del proyecto. 10 de octubre de 2024: El documento de investigación se hizo disponible públicamente en arXiv, ofreciendo una exploración en profundidad del marco y su evaluación de rendimiento basada en el benchmark OSWorld. 12 de octubre de 2024: Se publicó una presentación en video, proporcionando una visión visual de las capacidades y características de Agent S, involucrando aún más a posibles usuarios e inversores. Estos hitos en la cronología no solo ilustran el progreso de Agent S, sino que también indican su compromiso con la transparencia y el compromiso comunitario. Puntos Clave Sobre Agent S A medida que el marco Agent S continúa evolucionando, varios atributos clave destacan, subrayando su naturaleza innovadora y potencial: Marco Innovador: Diseñado para proporcionar un uso intuitivo de las computadoras similar a la interacción humana, Agent S aporta un enfoque novedoso a la automatización de tareas. Interacción Autónoma: La capacidad de interactuar de manera autónoma con las computadoras a través de GUI significa un avance hacia soluciones informáticas más inteligentes y eficientes. Automatización de Tareas Complejas: Con su metodología robusta, puede automatizar tareas complejas y de múltiples pasos, haciendo que los procesos sean más rápidos y menos propensos a errores. Mejora Continua: Los mecanismos de aprendizaje permiten a Agent S mejorar a partir de experiencias pasadas, mejorando continuamente su rendimiento y eficacia. Versatilidad: Su adaptabilidad en diferentes entornos operativos como OSWorld y WindowsAgentArena asegura que pueda servir a una amplia gama de aplicaciones. A medida que Agent S se posiciona en el paisaje de Web3 y criptomonedas, su potencial para mejorar las capacidades de interacción y automatizar procesos significa un avance significativo en las tecnologías de IA. A través de su marco innovador, Agent S ejemplifica el futuro de las interacciones digitales, prometiendo una experiencia más fluida y eficiente para los usuarios en diversas industrias. Conclusión Agent S representa un audaz avance en la unión de la IA y Web3, con la capacidad de redefinir cómo interactuamos con la tecnología. Aunque aún se encuentra en sus primeras etapas, las posibilidades para su aplicación son vastas y atractivas. A través de su marco integral que aborda desafíos críticos, Agent S tiene como objetivo llevar las interacciones autónomas al primer plano de la experiencia digital. A medida que nos adentramos más en los reinos de las criptomonedas y la descentralización, proyectos como Agent S sin duda desempeñarán un papel crucial en la configuración del futuro de la tecnología y la colaboración humano-computadora.

935 Vistas totalesPublicado en 2025.01.14Actualizado en 2025.01.14

Cómo comprar S

¡Bienvenido a HTX.com! Hemos hecho que comprar Sonic (S) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Sonic (S) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Sonic (S)Después de comprar tu Sonic (S), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Sonic (S)Tradear fácilmente con Sonic (S) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

1.6k Vistas totalesPublicado en 2025.01.15Actualizado en 2026.06.02

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de S (S).