Artículos Relacionados con LLM

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "LLM", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

La IA en búsqueda da a luz a una ronda de financiación angelical

La startup tecnológica de marketing con IA GenOptima (conocida como "智推时代") ha completado una ronda de financiación ángel de decenas de millones de yuanes, con participación del Fondo de Propiedad Intelectual de Shanghái, TianTu Investment, el conocido inversor individual Wei Wei, entre otros. El accionista existente 37 Interactive Entertainment continuó con su inversión. Fundada en mayo de 2025, la empresa se centra en la Optimización de Respuestas Generativas (GEO), ayudando a las marcas a aparecer en las respuestas proporcionadas por la IA. En solo un año, ha acumulado cerca de 400 clientes corporativos y una facturación anual recurrente (ARR) que supera los 100 millones de yuanes. Su sistema central GENO, basado en una arquitectura de agente de doble motor, cubre monitorización de búsquedas de IA, análisis semántico de marca y generación de estrategias de contenido. La empresa colabora con la Universidad Normal del Este de China y ha acumulado más de 329 millones de fuentes de datos. Su red de servicios se extiende por cuatro continentes, compatible con más de 15 modelos principales de IA y 65 idiomas. El mercado GEO está creciendo rápidamente. Un informe de iResearch prevé que el mercado chino relacionado superará los 50.000 millones de yuanes para 2030. A medida que la IA remodela la toma de decisiones del consumidor, garantizar la "visibilidad en la IA" se ha convertido en una nueva prioridad estratégica para las marcas, similar al papel del SEO en la era de Internet. El fundador Chen Miaozhe visualiza una futura evolución hacia una interacción Agente-a-Agente para consultas y transacciones.

marsbit07/07 01:00

La IA en búsqueda da a luz a una ronda de financiación angelical

marsbit07/07 01:00

Anthropic descubre un 'área de trabajo' similar a la consciencia en Claude: el misterioso Espacio J guarda pensamientos no expresados

Investigadores de Anthropic han identificado un "espacio J" en el modelo de lenguaje Claude, que actúa como un área de trabajo mental silenciosa donde el modelo genera conceptos que puede o no expresar en sus respuestas. Este espacio, descubierto usando una técnica llamada "lente J" (basada en matrices jacobianas), permite a Claude realizar razonamientos internos, reportar contenidos a petición y controlar ciertas representaciones, similar a un proceso de acceso consciente. El espacio J muestra propiedades funcionales clave: Claude puede informar sobre su contenido, modularlo según instrucciones y usarlo para razonamientos multi-paso. Sin embargo, no está involucrado en tareas automatizadas como la gramática o el recuerdo simple de hechos. Cuando se bloquea, Claude pierde capacidades de razonamiento superior pero mantiene funciones básicas. Esta estructura emergente, que recuerda a la teoría del "espacio de trabajo global" en neurociencia, ofrece herramientas prácticas para monitorizar el pensamiento interno de Claude, detectando posibles comportamientos no deseados, como el reconocimiento de estar en un test, la generación de datos falsos o la persecución de objetivos ocultos. La investigación no aborda si Claude tiene "conciencia fenoménica", pero sugiere que este tipo de arquitectura funcional podría ser una solución computacional general para sistemas inteligentes.

marsbit07/07 00:49

Anthropic descubre un 'área de trabajo' similar a la consciencia en Claude: el misterioso Espacio J guarda pensamientos no expresados

marsbit07/07 00:49

Gemini 3.5 Pro se filtra en secreto, superando a Fable 5 en frontend

**Gemini 3.5 Pro: Filtraciones revelan su capacidad superior en generación de código front-end, superando a Fable 5** Tras dos meses de espera, las filtraciones apuntan a que Gemini 3.5 Pro, el modelo estrella de Google, podría lanzarse el 17 de julio. Lo más destacado es su aparente salto de capacidad en la generación visual y de código para front-end, donde según pruebas de desarrolladores superaría a Fable 5. Sus mejoras clave incluyen: un mejor criterio de diseño (colores, espaciado), interfaces de usuario más limpias y con menos código redundante, una generación de SVG significativamente más precisa y capaz, y una mayor completitud en la creación de páginas con una sola instrucción. Ejemplos mostrados generan desde retratos en SVG complejos hasta una isla flotante estilo steampunk con Three.js, todo a partir de descripciones breves. Sin embargo, el modelo no sería superior en todas las áreas. En tareas de razonamiento complejo, ingeniería de software a gran escala (nivel repositorio) o ejecución de agentes de larga duración, las filtraciones indican que aún estaría por detrás de Fable 5 y GPT-5.6. La demora en su lanzamiento se atribuiría a que Google no solo amplió el modelo, sino que realizó un nuevo preentrenamiento desde una base diferente a la de Gemini 3.5 Flash. Este nuevo "cimiento" también serviría para 'Nano Banana Pro', un futuro modelo de generación de imágenes que competiría con GPT-Image 2. La posible llegada de Gemini 3.5 Pro marca un intento de Google por recuperar terreno en la intensa competencia de modelos de IA, centrando su fortaleza en un ámbito específico mientras trabaja para igualar a sus rivales en otros frentes. La comunidad espera la confirmación oficial para el 17 de julio.

marsbit07/06 12:30

Gemini 3.5 Pro se filtra en secreto, superando a Fable 5 en frontend

marsbit07/06 12:30

Justo ahora, el clásico trabajo de DeepMind vuelve a ser divino, se anuncian los premios de ICML 2026

Se han anunciado los premios ICML 2026, destacando los trabajos en modelos de difusión. Dos artículos sobre modelos de difusión ganaron el premio a Artículo Destacado: uno cuestiona el valor de la generación en orden arbitrario en modelos lingüísticos de difusión, y el otro presenta métodos de muestreo de alta precisión. También se otorgó el premio a Artículo de Posición a un trabajo que advierte sobre el uso no intencionado de herramientas de alineación de IA para la censura. El premio Test of Time reconoció un estudio seminal de DeepMind sobre métodos asíncronos para el aprendizaje por refuerzo profundo. Las menciones de honor incluyen investigaciones sobre honestidad en modelos, atribución de movimiento en video, memorización en modelos lingüísticos y una perspectiva teórica sobre la consistencia de los modelos de difusión.

marsbit07/06 02:42

Justo ahora, el clásico trabajo de DeepMind vuelve a ser divino, se anuncian los premios de ICML 2026

marsbit07/06 02:42

Karpathy lanza su última crítica: una frase silenció a todos los desarrolladores de Agent

Andrej Karpathy, destacado investigador de Anthropic, ha expresado una crítica contundente hacia el frenesí actual en el desarrollo de Agentes de IA. En una reciente presentación, afirmó que el mayor error en el campo es la prisa por forzar a los Agentes a realizar tareas sin comprender primero a fondo los modelos de lenguaje subyacentes. Basándose en su experiencia en un proyecto fallido de 2016, Karpathy subraya que la tecnología de entonces (como el aprendizaje por refuerzo) no estaba preparada, y que el enfoque correcto hubiera sido priorizar la investigación en modelos de lenguaje. Ofrece tres consejos clave: primero, centrarse en mejorar los modelos base antes que en las capacidades de los Agentes. Segundo, reconocer que crear un prototipo es fácil, pero desarrollar un producto viable puede llevar una década, como en los casos de la conducción autónoma o la realidad virtual. Tercero, los Agentes no son el producto en sí, sino que emergerán naturalmente una vez que se consolide la base. Karpathy también propone buscar inspiración en la neurociencia, analizando estructuras cerebrales como el hipocampo o los ganglios basales para comprender mejor la inteligencia. Finalmente, envía un mensaje alentador a desarrolladores independientes y emprendedores: en la frontera de las capacidades de los Agentes, son ellos, y no los grandes laboratorios como OpenAI o DeepMind, quienes llevan la delantera, ya que este es un territorio nuevo donde la agilidad y la experimentación valen más que la experiencia acumulada. Su crítica no es desalentar el trabajo en Agentes, sino instar a construir sobre cimientos sólidos para un progreso real y duradero.

marsbit07/06 02:36

Karpathy lanza su última crítica: una frase silenció a todos los desarrolladores de Agent

marsbit07/06 02:36

Gu Yuxian, ganador del premio especial de Tsinghua, se une a DeepSeek

Recientemente, DeepSeek ha iniciado una intensa campaña de contratación. En paralelo, se ha observado que **Yuxian Gu**, doctorando de la Universidad de Tsinghua y ganador del Premio Especial para Estudiantes de Posgrado 2025, figura entre los autores del artículo de investigación de DeepSeek V4, lo que confirma su incorporación oficial a la empresa. Gu, quien también ha recibido becas de Apple y Ant Group, es doctorando en el Departamento de Ciencias de la Computación de Tsinghua, bajo la supervisión del profesor Minlie Huang. Su investigación se centra en mejorar la eficiencia a lo largo de todo el ciclo de vida de los grandes modelos de lenguaje (LLM), abarcando tres áreas principales: 1. **Selección de datos para preentrenamiento**: Desarrollo de teorías y algoritmos para optimizar la selección de datos, con trabajos representativos como PDS e Instruction Pre-training. 2. **Destilación de conocimiento en compresión de modelos**: Diseño de métodos para transferir conocimiento de modelos grandes a otros más pequeños y desplegables, siendo MiniLLM su trabajo más destacado. 3. **Arquitecturas de modelos eficientes**: Exploración de nuevos diseños arquitectónicos que reduzcan costes computacionales, como se demuestra en Jet-Nemotron. Con casi 5000 citas en Google Scholar y múltiples publicaciones como primer autor en conferencias de primer nivel (NeurIPS, ICLR, ACL), el trabajo de Gu ha tenido un impacto significativo. Su modelo Jet-Nemotron, por ejemplo, supera en rendimiento a otros modelos de atención completa de vanguardia con un notable aumento de eficiencia. Asimismo, su método de destilación MiniLLM ha sido adoptado por empresas líderes como Google y NVIDIA. Se espera que su incorporación a DeepSeek contribuya al desarrollo de nuevos avances en el campo de la IA.

marsbit07/06 02:10

Gu Yuxian, ganador del premio especial de Tsinghua, se une a DeepSeek

marsbit07/06 02:10

Ingresos anuales de 100 millones de dólares, dos compañeros de cuarto de Berkeley de los 90 crean el negocio de IA más rentable

Una startup que no desarrolla modelos de IA, Arena, alcanza un ingreso anualizado de 100 millones de dólares. Su origen es Chatbot Arena, un proyecto de investigación de código abierto iniciado en 2023 por el grupo de investigación LMSYS de UC Berkeley. La plataforma alberga una clasificación líder (leaderboard) de modelos de lenguaje, basada en más de 82 millones de votos de usuarios reales que evalúan respuestas de modelos anónimos en duelo. Actualmente recibe más de 10 millones de visitantes mensuales. Todos los principales desarrolladores de IA, como OpenAI, Google y Anthropic, someten sus modelos a esta evaluación comunitaria neutral. Su servicio comercial "AI Evaluations", lanzado hace ocho meses, permite a empresas pagar por análisis profundos del rendimiento de sus modelos en escenarios del mundo real, lo que generó los 100 millones de dólares en ingresos. La empresa se constituyó formalmente en 2025, recaudó una ronda semilla de 100 millones y alcanzó una valoración de 1.700 millones de dólares. Sus cofundadores son Anastasios Angelopoulos (CEO), Wei-Lin Chiang (CTO, creador del modelo Vicuna) y el profesor Ion Stoica. Arena está expandiendo sus capacidades de evaluación hacia el modo "agente" para tareas complejas, posicionándose como un árbitro esencial en la evolución de la IA.

marsbit07/06 00:22

Ingresos anuales de 100 millones de dólares, dos compañeros de cuarto de Berkeley de los 90 crean el negocio de IA más rentable

marsbit07/06 00:22

Hinton elogia, el contribuidor principal de Gemini habla: habrá miles de millones de IA superhumanas al nivel de Einstein en el futuro

El físico teórico Adam Brown, principal contribuidor de Gemini, expone en una charla avalada por Geoffrey Hinton cómo la IA está transformando radicalmente la investigación científica. Partiendo de la analogía de "entrenar arena para pensar", describe la evolución de los modelos de lenguaje desde un nivel básico hasta superar exámenes de doctorado y pruebas de alto nivel como la Olimpiada Internacional de Matemáticas. Brown destaca la "Ley de Escalado" (Scaling Law) como motor clave, mostrando que al aumentar escala, datos y capacidad de cálculo, el rendimiento de la IA mejora de manera predecible. Revisa hitos recientes, como la resolución autónoma por una IA de la conjetura de la distancia unitaria de Erdős, un problema abierto durante 80 años. Comparando este progreso con la evolución de la IA en el ajedrez, Brown anticipa una era "centauro" de colaboración humano-IA, seguida de una posible era "superhumana" con sistemas autónomos. Aunque señala limitaciones actuales como la autonomía y la planificación, argumenta que incluso en su estado actual, estas herramientas actúan como tutores, asistentes de programación y colaboradores excepcionales, capaces de replicarse masivamente. Concluye que estamos al borde de una nueva edad de oro para la física y la ciencia, donde la sinergia con la IA podría desbloquear preguntas fundamentales y, en un futuro, conducir a la existencia de miles de millones de sistemas con capacidades de nivel excepcional.

marsbit07/04 06:47

Hinton elogia, el contribuidor principal de Gemini habla: habrá miles de millones de IA superhumanas al nivel de Einstein en el futuro

marsbit07/04 06:47

La nueva tecnología DeepSeek se adapta a los chips Apple, acelerando el modelo local en Mac un 60%

El proyecto de código abierto DSpark de DeepSeek, originalmente diseñado para acelerar modelos de lenguaje en GPUs de centros de datos, ha sido adaptado por el ingeniero Abdur Rahim para funcionar de forma nativa en chips Apple (mlx-dspark). Esta adaptación logra aceleraciones de aproximadamente 1.6x para Gemma-4 12B y 1.4x para Qwen3-4B en un Mac con M4 Pro, manteniendo una precisión de salida idéntica al modelo original (byte por byte), incluso con muestreo por temperatura. La clave de DSpark es el "decodificado especulativo": un modelo pequeño y rápido (draft) genera varios tokens candidatos que luego son verificados de manera eficiente por el modelo principal (target). Rahim optimizó este proceso para la arquitectura Apple Silicon, utilizando cuantización de 4 bits para el modelo draft (1.8 GB) y 8 bits para el target, logrando una tasa de aceptación del 82%. Posteriormente, el proyecto integró también DFlash, una técnica alternativa de decodificación especulativa que genera bloques de tokens en paralelo. DFlash mostró un rendimiento superior (hasta ~2.1x de aceleración) en tareas estructuradas como código y matemáticas, mientras que DSpark es más eficaz en conversaciones abiertas. La versión mlx-dspark v0.0.3 ahora permite elegir entre ambos métodos según la tarea. Este trabajo demuestra la viabilidad de ejecutar eficientemente LLMs avanzados localmente en hardware Apple, combinando velocidad y precisión.

marsbit07/03 12:25

La nueva tecnología DeepSeek se adapta a los chips Apple, acelerando el modelo local en Mac un 60%

marsbit07/03 12:25

Karpathy vuelve a ser un dios, revoluciona el RAG y convierte tus notas en un segundo cerebro

Karpathy ha lanzado una idea revolucionaria: tratar tus notas como código fuente inmutable y dejar que un LLM actúe como compilador. Su propuesta, LLM-WIKI, cambia radicalmente la gestión del conocimiento personal. Mientras que RAG (Recuperación Aumentada por Generación) solo busca fragmentos y produce respuestas inconsistentes, el método de Karpathy "compila" toda la información en un Wiki estructurado y coherente. El sistema se organiza en tres capas: 1. **Raw (Material crudo):** Notas originales e inmutables. 2. **Schema (Constitución del conocimiento):** Reglas definidas por el usuario (ej: cómo estructurar una entrada). 3. **Wiki (Producto compilado):** Base de conocimiento mantenida automáticamente por la IA. El proceso implica **Ingerir** nuevo contenido (actualizando múltiples páginas relacionadas), **Consultar** el Wiki compilado y realizar **Revisiones** periódicas para detectar contradicciones. Esto libera a las personas del agotador trabajo de mantener enlaces y consistencia, tareas que la IA realiza de forma impecable. Karpathy conecta esta idea con el "Memex" de Vannevar Bush (1945), una máquina para gestionar conocimiento mediante asociaciones. El obstáculo durante 80 años fue el costoso mantenimiento manual, un problema que los LLM resuelven ahora. Este enfoque representa la tercera pieza de la visión de Karpathy sobre colaboración humano-IA, liberando la atención humana para lo esencial: decidir qué aprender y dar significado al conocimiento. Tu cerebro no debería usarse para llevar la contabilidad de tus ideas.

marsbit07/01 09:57

Karpathy vuelve a ser un dios, revoluciona el RAG y convierte tus notas en un segundo cerebro

marsbit07/01 09:57

Artículos Relacionados con LLM

La IA en búsqueda da a luz a una ronda de financiación angelical

Anthropic descubre un 'área de trabajo' similar a la consciencia en Claude: el misterioso Espacio J guarda pensamientos no expresados

Gemini 3.5 Pro se filtra en secreto, superando a Fable 5 en frontend

Justo ahora, el clásico trabajo de DeepMind vuelve a ser divino, se anuncian los premios de ICML 2026

Karpathy lanza su última crítica: una frase silenció a todos los desarrolladores de Agent

Gu Yuxian, ganador del premio especial de Tsinghua, se une a DeepSeek

Ingresos anuales de 100 millones de dólares, dos compañeros de cuarto de Berkeley de los 90 crean el negocio de IA más rentable

Hinton elogia, el contribuidor principal de Gemini habla: habrá miles de millones de IA superhumanas al nivel de Einstein en el futuro

La nueva tecnología DeepSeek se adapta a los chips Apple, acelerando el modelo local en Mac un 60%

Karpathy vuelve a ser un dios, revoluciona el RAG y convierte tus notas en un segundo cerebro

Categorías populares

Etiquetas Populares