¡Llega Gemini 3.5! Esta noche, Google hace que Google quede obsoleto

链捕手Publicado a 2026-05-20Actualizado a 2026-05-20

Resumen

**Google I/O 2026: Geminis Omni, Flash 3.5 y Spark, un salto hacia la superinteligencia** En Google I/O 2026, Sundar Pichai y Demis Hassabis presentaron una avalancha de avances en IA que redefinen el campo. La estrella fue **Gemini Omni**, un modelo “omnimodal” que entiende y genera cualquier combinación de texto, imagen, audio y, lo más destacado, **video de alta calidad**. Omni no solo crea videos realistas; los edita mediante conversación, mantiene la coherencia física y lógica entre escenas, y permite crear avatares personalizados. Ya está disponible en su versión Flash, con una versión Pro en camino. El segundo gran lanzamiento es **Gemini 3.5 Flash**, un modelo que supera ampliamente al anterior flagship, Gemini 3.1 Pro, en benchmarks de código y tareas de agente. Es extremadamente rápido (289 tokens/segundo) y se integra en **Antigravity 2.0**, una plataforma de desarrollo de agentes independiente. Una demostración impactante mostró cómo 93 sub-agentes, dirigidos por 3.5 Flash, escribieron, probaron y auditaron un **sistema operativo funcional desde cero en solo 12 horas**, por menos de 1000 dólares en costos de API. Finalmente, se anunció **Gemini Spark**, un agente personal de IA que funciona 24/7 en la nube. Integrado con las herramientas de Google (Gmail, Docs, Sheets), puede ejecutar tareas complejas como organizar eventos, redactar correos con tu estilo o gestionar información de manera autónoma, incluso mediante comandos de voz. Estará disponible en beta par...

Autor: New Zhiyuan

 

¡Google I/O 2026, a todo gas!

Acaban de salir al escenario Sundar Pichai y Demis Hassabis juntos, mostrando de una vez todas las grandes novedades acumuladas en los últimos seis meses.

Sin la menor duda, el gran protagonista de esta noche, Gemini Omni ¡hace su aparición oficial!

Como un modelo de lenguaje grande verdaderamente "omnicomprensivo", Omni puede recibir cualquier tipo de entrada y generar cualquier contenido. Y soporta, desde su lanzamiento, la salida de vídeo, lo que lo convierte en una versión en vídeo de "Nano Banana".

El otro punto culminante de esta noche, pertenece a Gemini 3.5 Flash.

En casi todas las pruebas de referencia, el 3.5 Flash logró superar ampliamente al anterior modelo insignia de Google, el Gemini 3.1 Pro. Su velocidad de salida también se duplicó, siendo más de 4 veces más rápido en comparación con GPT-5.5 y Opus 4.7. El más potente 3.5 Pro, se lanzará el próximo mes.

Además, han aparecido toda una ola de novedades importantes:

  • Antigravity 2.0: Nueva aplicación de escritorio independiente, que evoluciona desde un IDE a una plataforma de desarrollo de Agentes.

  • Gemini Spark: Tu agente de IA personal, funcionando 24/7 en la nube.

  • Rediseño de la App Gemini: Nombre en clave "Neural Expressive", cambia al pago por potencia de cálculo.

  • Plan de suscripción AI Ultra: Se añade una versión de 100 dólares, el nivel máximo baja de 250 a 200 dólares.

  • La mayor actualización en 25 años de la Búsqueda de Google: Se integra con el 3.5 Flash, añade cuadro de búsqueda inteligente, generación automática de mini-aplicaciones, etc.

    ......

Sin exagerar, la densidad de contenido útil en este I/O es la mayor de todos los años.

Presentación de Gemini Omni: Nace una IA "omnicomprensiva"

Como sugería frenéticamente el vídeo promocional, el tan esperado Gemini Omni finalmente ha llegado. Hassabis subió al escenario para anunciar personalmente, "Estamos dando el siguiente paso importante: Gemini Omni, un nuevo modelo que puede crear contenido a partir de cualquier entrada".

Esta puesta en escena lo dice todo. Google quiere construir esta vez un motor de creación de IA verdaderamente "omnicomprensivo". Fusiona la inteligencia de Gemini con la IA generativa más potente, llevando al máximo tres dimensiones: comprensión del mundo, multimodalidad y edición. En pocas palabras, dale cualquier combinación de imágenes, audio, vídeo y texto, y generará un vídeo de alta calidad. Y además, puedes editar el vídeo de forma conversacional.

Lo más crucial es que Omni no solo "parece" entender, realmente comprende el mundo físico. Las palabras exactas de Hassabis fueron: "Los sistemas anteriores a menudo fallaban al simular conceptos como la gravedad o la energía cinética, pero Omni logra un 'cambio escalonado'". Inyecta el "conocimiento del mundo" y la "capacidad de razonamiento" de Gemini en la generación de vídeo.

  • Con la instrucción "explica el plegamiento de proteínas con animación de arcilla", el vídeo generado muestra cada paso de la cadena de aminoácidos plegándose en hélices alfa y láminas beta con precisión científica, visualmente como una animación stop-motion exquisita.

  • O asignar objetos a las 26 letras del alfabeto inglés. La C es un capibara, la D una bola de discoteca, la L una lámpara de lava. Omni no está pegando recursos, realmente está conectando lenguaje, imágenes y semántica.

Hay que decir que el salto de parecer realista a tener significado es enorme.

En el escenario, Hassabis sacó un vídeo selfie y comenzó a modificarlo en vivo. Un círculo dibujado a mano en su palma se convirtió en un agujero negro, una calle en un paseo al atardecer se transformó en una escena cyberpunk. Una frase reescribe la imagen, una frase cambia el mundo. Cualquier cosa puede convertirse en el lienzo para crear una nueva realidad. También, por ejemplo, selfies jugando con fuego en la palma, un círculo dibujado en un papel se convierte instantáneamente en un agujero negro, se pueden lograr todo tipo de ideas descabelladas.

Y no es una generación de una sola vez. Puedes seguir conversando. El vídeo de salida de Gemini Omni mantiene la coherencia de los personajes, la lógica física es válida y la memoria de la escena es continua.

  • Partiendo de una grabación original de alguien tocando el violín. Segunda ronda: "transfiere al violinista al entorno de esta imagen", adjuntando una imagen de referencia de montañas nevadas y prados. La escena cambia instantáneamente, los movimientos, la iluminación, todo se adapta al nuevo entorno.

  • Tercera ronda: "cambia el ángulo de la cámara a un plano por encima del hombro del violinista". La perspectiva gira, pero la acción de tocar y la música son completamente continuas.

No importa cómo cambie la escena, el sujeto de la imagen no se distorsiona.

Y lo que da más que pensar es la flexibilidad de entrada de Omni. Imágenes, texto, vídeo, audio, cualquier material de referencia se puede mezclar como entrada, generando una salida coherente. Incluso puedes crear tu propio Avatar, haciendo que tu versión de IA aparezca en cualquier escena, con tu voz, haciendo cosas que tú no has hecho.

Actualmente, Omni Flash ya está oficialmente en línea, la versión API se abrirá en las próximas semanas. Y la más potente Omni Pro también está en camino. Gracias a la gran capacidad de integración de Google, Omni se integra desde el primer momento en la App Gemini, Google Flow y YouTube Shorts, e incluso los usuarios de YouTube Shorts pueden usarlo gratis.

Flash supera a Pro: 3.5 redefine el significado de "insignia"

Después de Gemini Omni, la otra gran protagonista de este I/O fue el lanzamiento de la nueva insignia Gemini 3.5 Flash. Google lo define como el modelo más potente hasta la fecha para codificación y agentes inteligentes.

En el escenario, Sundar Pichai anunció personalmente, "¡El 3.5 Flash supera ampliamente al Gemini 3.1 Pro en casi todas las pruebas de referencia!" ¡Impresionante, 3.1 Pro es el modelo insignia que Google lanzó hace solo tres meses! Ahora, un modelo de nivel Flash lo aplasta.

Quién hubiera pensado que Google entregaría un resultado tan brillante en tan poco tiempo:

  • Terminal-Bench 2.1 (codificación): 76.2%

  • GDPval-AA (tareas de agente en el mundo real): 1656 Elo

  • MCP Atlas (uso de herramientas a gran escala): 83.6%

  • CharXiv Reasoning (comprensión multimodal): 84.2%

En estas cuatro grandes pruebas de referencia, comparado con Gemini 3.1 Pro, el 3.5 Flash supone un salto estratosférico. En velocidad, el 3.5 Flash ocupa un cuadrante propio, 289 tokens/segundo, más de 4 veces más rápido que otros modelos de vanguardia. Además, en algunas pruebas de referencia, el rendimiento del 3.5 Flash es comparable, e incluso puede superar ampliamente a GPT-5.5 y Claude Opus 4.7. Hay que admitir que el 3.5 Flash es rápido y potente, casi sin rival.

Los parámetros son demasiado abstractos, veamos demostraciones reales de sus límites. En un instante, el 3.5 Flash puede digerir un artículo académico incomprensible y escribir un sitio web visual con interacciones perfectas. En tareas de agentes inteligentes, a través de Antigravity, puede completar flujos de trabajo de múltiples pasos, clasificar y nombrar automáticamente activos dispersos en pantalla. O, utilizando dos Agentes, reproducir en solo seis horas el artículo de AlphaZero y codificar un juego totalmente funcional.

93 Agentes crean un SO, en solo 12 horas

Se puede ver que la realización de todas estas capacidades del 3.5 Flash se logra gracias al nuevo Antigravity 2.0. Hoy, la plataforma de desarrollo de Agentes de Google, Antigravity, se actualizó a la versión 2.0, pasando de ser un IDE a una aplicación de escritorio independiente, adoptando completamente un diseño centrado en Agentes.

Varun subió al escenario y dio una demostración que dejó sin aliento a toda la audiencia. Hizo que Antigravity, equipado con 3.5 Flash, construyera un sistema operativo desde cero. 93 subagentes trabajando en paralelo, realizando más de 15,000 solicitudes al modelo, procesando 2,6 mil millones de tokens, y 12 horas después, un proyecto completamente en blanco se convirtió en un kernel de SO completamente funcional. Planificador, gestión de memoria, sistema de archivos, cada línea de código fue escrita, probada y auditada por Agentes. El costo de la API fue inferior a 1000 dólares.

Luego, intentó ejecutar DOOM en este sistema operativo escrito por IA. El primer intento falló, faltaban controladores de vídeo y teclado. Entonces, ingresó una instrucción de reparación en Antigravity 2.0, y los Agentes comenzaron a complementar automáticamente el código de los controladores. Después de un rato, la pantalla de DOOM apareció en la pantalla, y toda la sala estalló en aplausos.

En resumen, las principales mejoras que trae Antigravity 2.0 incluyen:

  • Los subagentes pueden generarse dinámicamente; el agente principal divide las tareas en subtareas y las asigna, ejecutándose en paralelo sin interferir entre sí;

  • La gestión asincrónica de tareas evita que las operaciones de larga duración bloqueen el hilo principal;

  • Tareas Programadas (Scheduled Tasks) permiten configurar "tareas programadas" para que los Agentes las ejecuten automáticamente, como verificar el estado de los PR una vez al día, ejecutar un script de verificación de salud cada hora.

  • Nuevos comandos con barra diagonal: /goal para que el Agente se ejecute de una vez, /grill-me para que el Agente primero aclare los requisitos antes de actuar, /browser para controlar explícitamente el uso del navegador.

Sin embargo, estas son capacidades ya probadas internamente. La velocidad a la que Google usa internamente Antigravity para procesar tokens era de 500 mil millones diarios en marzo. Ahora, es de 3 billones diarios. Y esta versión de Flash 12 veces más rápida ya está disponible hoy en Antigravity.

El 3.5 Flash se convierte simultáneamente en el modelo predeterminado para la App Gemini y el Modo AI de la Búsqueda de Google, para todos los usuarios del mundo. Los desarrolladores pueden acceder a través de Antigravity 2.0, la API de Gemini y Google AI Studio. Los usuarios empresariales acceden a través de Gemini Enterprise Agent Platform. Lo más impactante es que el 3.5 Pro ya está en pruebas internas y se lanzará el próximo mes.

Asistente personal 24/7: Finalmente llega Google Spark

El tercer gran lanzamiento de esta noche corresponde a Gemini Spark! La definición de Sundar Pichai para este producto es muy clara: Tu Agente de IA personal. Incluso cuando cierras tu portátil, no se detiene. Funciona en una máquina virtual dedicada en la nube, lo que permite una conexión 24/7.

Gemini Spark está impulsado por Gemini 3.5 + el framework Antigravity, y está profundamente integrado con el "paquete completo" de productividad de Google. El vicepresidente de producto Josh Woodward subió al escenario para demostrar dos escenarios, que llevaron a toda la sala al borde de la locura.

  • El primero es un escenario de trabajo: Introduce una instrucción, "ayúdame a redactar un correo electrónico para el equipo resumiendo toda la información de la semana pasada sobre el lanzamiento de Gemini Live". Spark extrae automáticamente información de Gmail, Docs, registros de chat, y además activa una habilidad (skill) personal llamada "ghostwriter" escrita por Woodward, haciendo que el correo automáticamente coincida con su tono personal. Todo el proceso se completa en segundo plano, el humano solo necesita revisar y enviar. Sí, Spark soporta habilidades personalizadas (skills), que le permiten aprender tu tono, tus preferencias, tu forma de trabajar.

  • El segundo es un escenario de la vida personal: Planificar una fiesta del barrio. Spark, al recibir la tarea, la ejecuta paso a paso. Crea una hoja de cálculo de Google Sheets para rastrear las confirmaciones de asistencia (RSVP), conectada directamente a Gmail, actualizándose automáticamente cuando alguien responde. Para los vecinos que no se han apuntado, Spark redacta automáticamente correos electrónicos de recordatorio, genera borradores y espera confirmación antes de enviarlos. Luego, también genera una presentación en Google Slides para la promoción, incluyendo información sobre poner un castillo inflable en el barrio. Todo esto sin abrir ninguna aplicación.

No solo eso, Spark también posee una potente capacidad de entrada por voz. En el escenario, Woodward sacó su teléfono y simplemente dictó tres tareas: "Encuentra todas las reuniones con Sundar y márcalas en rosa brillante", "Escribe una invitación al nuevo vecino John para unirse a la lista de la fiesta del barrio", "Crea un documento enumerando las cosas que hay que hacer para los niños antes de que termine el año escolar, ordenadas por fecha límite".

La voz se convirtió directamente en instrucciones de texto, y Spark dividió automáticamente un discurso continuo en tres hilos de tareas independientes, ejecutándose en paralelo en segundo plano.

En cuanto a precios, la suscripción AI Ultra de 100 dólares mensuales permite usar la beta de Spark. El plan Ultra máximo bajó de 250 a 200 dólares. Spark estará disponible la próxima semana inicialmente en versión beta para usuarios estadounidenses de AI Ultra.

Esta noche, Google abre la puerta a la ASI

Mirando atrás en este I/O, lo que realmente da escalofríos no es un producto en particular. Es que todas las capacidades estén listas al mismo tiempo.

Comprensión completamente multimodal, generación completamente multimodal, Agente disponible las 24 horas: Google ha encajado las tres piezas del rompecabezas en una sola noche. Omni convierte una frase en un mundo, sin necesidad de que los humanos proporcionen ningún material; 93 Agentes crean un sistema operativo desde cero, sin necesidad de que los humanos escriban una sola línea de código; Spark trabaja por ti 24/7, sin necesidad de que los humanos abran una aplicación.

Cuando la IA ya no necesita que los humanos la "alimenten", sino que entiende, decide, ejecuta e itera por sí misma, el destino de este camino se llama ASI (Superinteligencia Artificial).

Nadie puede dar un cronograma exacto. Pero el Google I/O de esta noche ha hecho que todos se den cuenta de una cosa: en el camino hacia la superinteligencia, ya no existe el obstáculo de "no se puede hacer técnicamente". Lo que queda es solo la velocidad del despliegue de la ingeniería. Hace seis meses todavía debatíamos si la AGI era una burbuja. Medio año después, Google ya está escribiendo sistemas operativos con Agentes. La aceleración de esta industria ya ha superado el rango que la intuición humana puede percibir.

Referencias:

  • https://youtu.be/wYSncx9zLIU

  • https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

  • https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/

  • https://antigravity.google/blog/introducing-google-antigravity-2-0

  • https://antigravity.google/blog/google-io-2026-feature-deep-dive

Editores: Taozi, Moses

 

 

 

 

 

 

 

 

 

 

 

 

 

Preguntas relacionadas

Q¿Qué anunció Google en la I/O 2026 como su principal modelo de IA?

AGoogle anunció Gemini Omni, un modelo de IA verdaderamente 'omnímodo' que puede recibir cualquier tipo de entrada (imágenes, audio, video, texto) y generar contenido, incluyendo video, de alta calidad.

Q¿En qué se diferencia la nueva Gemini 3.5 Flash de la anterior generación de modelos de Google?

AGemini 3.5 Flash superó a su predecesor, Gemini 3.1 Pro, en casi todas las pruebas de referencia. Además, es mucho más rápida, duplicando la velocidad de salida y siendo hasta 4 veces más rápida que los modelos líderes de la competencia como GPT-5.5 y Claude Opus 4.7.

Q¿Qué es Antigravity 2.0 y qué logró demostrar durante la presentación?

AAntigravity 2.0 es una plataforma de desarrollo de agentes de IA independiente. En la demostración, logró crear un sistema operativo completo desde cero utilizando 93 agentes de IA basados en Gemini 3.5 Flash, trabajando en paralelo durante 12 horas sin necesidad de que un humano escribiera código.

Q¿Cuál es la función de Gemini Spark y qué ventajas ofrece a los usuarios?

AGemini Spark es un agente de IA personal que funciona en la nube 24/7. Puede realizar tareas complejas de forma autónoma integrando herramientas de Google como Gmail, Docs, Sheets y Slides, automatizando flujos de trabajo personales y profesionales sin necesidad de que el usuario interactúe directamente con las aplicaciones.

Q¿Qué hito fundamental sugiere el artículo que representó el Google I/O 2026 en el camino hacia la superinteligencia artificial (ASI)?

AEl artículo sugiere que Google I/O 2026 unió tres piezas fundamentales: comprensión y generación 'omnimodal' (Gemini Omni), capacidad de agentes autónomos a gran escala (Antigravity 2.0 + Gemini 3.5), y un agente personal continuo (Gemini Spark). Este conjunto elimina la barrera técnica de la necesidad de supervisión humana constante, abriendo el camino hacia una Inteligencia Artificial Superinteligente (ASI) que puede entender, decidir y actuar por sí misma.

Lecturas Relacionadas

Wang Chuan: Cómo mantener la calma cuando el vecino Lao Wang multiplicó por treinta su inversión en acciones de almacenamiento (6) - La trampa de los productos homogéneos

**Resumen: Las trampas de los productos básicos en la industria del almacenamiento** Este artículo analiza los riesgos cíclicos y las características de los productos básicos en la industria del almacenamiento de datos, utilizando casos históricos y la situación actual para advertir sobre los peligros de invertir en acciones del sector. El autor comienza con el ejemplo de Iomega en los años 90. Su unidad Zip fue un éxito inicial, haciendo que su acción subiera más de 160 veces en año y medio, antes de colapsar un 97% tras la llegada de tecnologías competidoras más baratas (CD-R). Este patrón se repite en toda la industria: productos como la memoria DRAM son altamente homogéneos, sin valor de marca, lo que genera volatilidad extrema en los precios. Empresas como Micron han visto su acción estancada durante 25 años, y son comunes las quiebras (Mostek, Qimonda, etc.). La esencia del problema es la **demanda elástica frente a una oferta rígida, de capital intensivo y largo plazo de ampliación**. Cuando los precios suben (como desde 2025 debido a la demanda de memoria para IA), los fabricantes obtienen márgenes brutos enormes (ej: SanDisk pasó de 22.5% a 78.3%), principalmente por el aumento de precios, no de volumen. Sin embargo, estos altos márgenes destruyen la demanda marginal y atraen nueva capacidad. Para 2027, se espera que una nueva ola de capacidad entre en el mercado. El autor desmonta argumentos alcistas: los acuerdos de suministro a largo plazo (LTA) son frágiles y se pueden romper cuando cambian las condiciones del mercado. Además, la situación es asimétrica: basta un nuevo competidor (como empresas chinas), una recesión, una reducción en la inversión en IA o una innovación que reduzca la necesidad de memoria para desequilibrar el mercado. Una **trampa fatal** es que, en el pico del ciclo, las acciones de almacenamiento a menudo muestran bajos ratios P/E (relación precio-beneficio), atrayendo a inversores incautos que creen que es una "inversión en valor". En realidad, es el momento de mayor riesgo, ya que una caída en los precios de las materias primas puede hacer desaparecer esas ganancias rápidamente. En conclusión, la industria del almacenamiento está sujeta a ciclos brutales donde la alta rentabilidad contiene las semillas de su propia destrucción, lo que la convierte en una arena peligrosa para los inversores desprevenidos.

链捕手Hace 13 min(s)

Wang Chuan: Cómo mantener la calma cuando el vecino Lao Wang multiplicó por treinta su inversión en acciones de almacenamiento (6) - La trampa de los productos homogéneos

链捕手Hace 13 min(s)

Llega el AI PC: ¡Modelos masivos de 120B locales ahora son posibles! NVIDIA redefine la base de la "computadora personal con IA" con RTX Spark

En la conferencia GTC 2026, NVIDIA presentó el chip RTX Spark, redefiniendo el estándar de hardware para los "PCs personales de IA". Integrando una GPU Blackwell, una CPU Grace de 20 núcleos y una arquitectura de memoria unificada de hasta 128GB, el SoC ofrece un rendimiento de 1 petaflop (1000 TOPS) para IA. Esto permite ejecutar localmente modelos de lenguaje de hasta 120B parámetros con ventanas de contexto de hasta un millón de tokens, superando ampliamente las capacidades de los NPU actuales en PCs con IA. Principales fabricantes de equipos originales (OEM) como ASUS, Dell, HP, Lenovo, Microsoft Surface y MSI lanzarán portátiles delgados y equipos de sobremesa compactos con este chip en otoño. NVIDIA y Microsoft colaboran en seguridad, integrando el entorno de ejecución en sandbox OpenShell en Windows para aislar y gestionar de forma segura los agentes de IA locales. Adobe anunció una reestructuración desde el núcleo de Photoshop y Premiere para adaptarse a la arquitectura de memoria unificada, prometiendo mejoras de rendimiento. La llegada de RTX Spark marca un cambio en la industria del PC, donde la GPU se convierte en el componente central del sistema, desafiando el dominio tradicional de las CPU x86. Quedan por ver detalles clave como el precio final, la gestión térmica en portátiles y el rendimiento real en tareas no relacionadas con la IA.

marsbitHace 27 min(s)

Llega el AI PC: ¡Modelos masivos de 120B locales ahora son posibles! NVIDIA redefine la base de la "computadora personal con IA" con RTX Spark

marsbitHace 27 min(s)

Entrevista al gurú macro Raoul Pal: El punto de inflexión económico se acerca, no te bajes fácilmente en los próximos cuatro años

En su última aparición en el podcast "When Shift Happens", el macroinvestidor Raoul Pal analizó la carrera global por la IA y su impacto en los mercados. Pal argumenta que la competencia entre EE.UU. y China por la Inteligencia General Artificial (AGI) es el mayor evento de capital de la historia, impulsando una expansión de liquidez y alzas en bolsa. Introduce el concepto del "Singularidad Económica", un punto donde el crecimiento tecnológico exponencial, especialmente de agentes de IA, superará la capacidad del sistema económico actual. A pesar del auge de la IA, Pal mantiene que las criptomonedas ofrecen uno de los mejores perfiles de riesgo/rendimiento a largo plazo. Destaca el potencial ilimitado del mercado cripto con la llegada de una "economía de agentes" de IA que operarán en cadena. Considera la reciente corrección de Bitcoin como un retroceso saludable dentro de un mercado alcista y aboga por la estrategia de "comprar y mantener" frente al trading activo. Entre sus convicciones clave: * **Layer 1s como inversión principal:** Ethereum, Solana y Sui capturarán la mayor parte del valor al ser la infraestructura base para la futura economía digital y de agentes de IA. * **DeFi para máquinas:** Los sistemas financieros descentralizados serán utilizados masivamente por agentes de IA para transacciones eficientes. * **NFTs como activos "trofeo":** El arte digital de alta gana valor como registro cultural y bien de estatus en una economía en expansión. * **Perspectiva alcista macro:** Factores como la mayor adopción institucional, claridad regulatoria potencial y la necesidad continua de expansión monetaria de los gobiernos crean un entorno favorable. Pal concluye que, con la Singularidad Económica aproximándose en unos 4 años, los inversores deberían acumular y mantener activos criptográficos, que considera el "plan de pensiones de la humanidad" para navegar la mayor transición tecnológica.

链捕手Hace 56 min(s)

Entrevista al gurú macro Raoul Pal: El punto de inflexión económico se acerca, no te bajes fácilmente en los próximos cuatro años

链捕手Hace 56 min(s)

¿Ejecutar MoE en un móvil? Meta propone MobileMoE, acelera hasta 3.8 veces en iPhone 16 Pro

El equipo de Meta presenta MobileMoE, el primer modelo de mezcla de expertos (MoE) optimizado para ejecutarse de manera eficiente en teléfonos inteligentes comerciales. Diseñado como un modelo de lenguaje Transformer decoder-only, MobileMoE reemplaza las capas densas de feed-forward por capas MoE, empleando un router que selecciona los pocos expertos más relevantes por token junto con un experto compartido. El modelo se entrena en cuatro fases: preentrenamiento, entrenamiento intermedio, ajuste fino supervisado y entrenamiento consciente de cuantización (hasta INT4/INT8). Los experimentos determinan una configuración óptima de 8 expertos con granularidad 8, enrutamiento top-4 y un experto compartido. En evaluaciones de referencia, MobileMoE-S/M logra una precisión media comparable o superior a modelos densos, utilizando entre 1/2 y 1/4 del cálculo de inferencia con memoria similar. Especialmente en iPhone 16 Pro, MobileMoE-S acelera la fase de entrada hasta 3.8 veces y la generación token por token hasta 3.4 veces respecto a líneas de base. MobileMoE establece un nuevo límite de Pareto para modelos de lenguaje grandes en dispositivos, mejorando el equilibrio entre precisión y coste computacional. Los desafíos futuros incluyen mejorar la capacidad de seguimiento de instrucciones y la gestión de memoria dinámica, así como explorar el despliegue en NPU móviles.

marsbitHace 1 hora(s)

¿Ejecutar MoE en un móvil? Meta propone MobileMoE, acelera hasta 3.8 veces en iPhone 16 Pro

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片