Artículos Relacionados con LLM

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "LLM", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Claude Code elimina un 80% de indicaciones, y Opus 5... ¡se las vuelve a añadir!

Claude Code anunció haber reducido más del 80% de su indicación (prompt) del sistema para modelos como Opus 5 y Fable 5, eliminando reglas detalladas y redundantes para dar más autonomía al modelo. Sin embargo, un usuario llamado Chen Cheng descubrió al analizar los prompts reales recibidos por los modelos que, mientras Opus 4.8 tenía 4467 caracteres, Opus 5 tenía 7694, un aumento del 72% respecto a la versión anterior. La explicación es que la reducción masiva del 80% ocurrió principalmente entre Opus 4.7 (15225 caracteres) y Opus 4.8. Luego, para Opus 5, Anthropic añadió alrededor de 3755 caracteres de nuevas directrices específicas. Estas adiciones, agrupadas en "Entregar trabajo" y "Correcciones", buscan controlar los comportamientos más proactivos de Opus 5, como su tendencia a informar progresos con frecuencia, generar respuestas largas o utilizar sub-agentes de manera expansiva. En resumen, Claude Code eliminó las reglas rígidas de los modelos antiguos, pero Opus 5 necesitó nuevas pautas para canalizar adecuadamente sus capacidades mejoradas y más autónomas. El cambio refleja una evolución: menos instrucciones paso a paso, pero más directrices sobre el alcance y los límites de las tareas que el modelo puede emprender por sí mismo.

marsbitHace 2 días 11:41

Claude Code elimina un 80% de indicaciones, y Opus 5... ¡se las vuelve a añadir!

marsbitHace 2 días 11:41

Un tercio de los artículos de arXiv está escrito por IA: El 65% de los artículos de informática detectados con "sabor a IA", solo un 0,7% en matemáticas

Una investigación reciente analizó 12,750 artículos de arXiv y descubrió que el 65% de los nuevos artículos en informática muestran un "sabor a IA" según un detector, en comparación con solo un 0.7% en matemáticas. El estudio, que abarca desde enero de 2023 hasta julio de 2026, señala que el uso de texto generado por IA ha aumentado drásticamente desde el lanzamiento de ChatGPT, con una tasa de detección que alcanzó el 39% a principios de 2026. Sin embargo, los investigadores advierten que el detector no puede distinguir entre contenido completamente generado por IA y texto humano editado por herramientas de IA. Además, es menos efectivo en campos como las matemáticas, donde el lenguaje natural es limitado. El fenómeno ha llevado a lo que algunos llaman la "Era del Gran Desperdicio", donde la escritura académica se ve cada vez más influenciada por la IA, especialmente en áreas altamente competitivas.

marsbitHace 2 días 11:38

Un tercio de los artículos de arXiv está escrito por IA: El 65% de los artículos de informática detectados con "sabor a IA", solo un 0,7% en matemáticas

marsbitHace 2 días 11:38

¡En solo 2 meses su valoración ha pasado de 8.800 millones a 68.000 millones de euros! OpenRouter, la mayor centralita de la IA, podría ser adquirida

Stripe está en conversaciones para adquirir la startup de inteligencia artificial OpenRouter, el mayor mercado de modelos de IA que actúa como intermediario, por un monto cercano a los 100.000 millones de dólares. Esta valoración representa un aumento de casi siete veces respecto a los 13.000 millones de dólares de hace dos meses. La plataforma de OpenRouter permite a los desarrolladores acceder a más de 400 grandes modelos de lenguaje a través de una única API, optimizando automáticamente la selección del modelo según la complejidad de la tarea, el coste y la velocidad, similar a un comparador de precios. Fundada en 2023 por Alex Atallah (cofundador de OpenSea) y Louis Vichy, la empresa tiene un ingreso anualizado de 50 millones de dólares y más de un millón de desarrolladores usuarios. Para Stripe, líder mundial en pagos en línea, esta adquisición es un paso estratégico hacia la consolidación de su infraestructura para la economía de la IA, tras la compra reciente de Metronome, una plataforma de facturación por uso. El objetivo es ofrecer un paquete integral que gestione desde la selección de modelos y la facturación por tokens hasta los pagos, convirtiéndose en el centro de control para las aplicaciones de IA. Aunque la transacción aún podría fracasar, refleja la apuesta por el crecimiento explosivo del sector y el valor de controlar la capa de intermediación que decide cómo se distribuyen las consultas y los costes entre los distintos proveedores de modelos.

链捕手07/24 09:04

¡En solo 2 meses su valoración ha pasado de 8.800 millones a 68.000 millones de euros! OpenRouter, la mayor centralita de la IA, podría ser adquirida

链捕手07/24 09:04

Claude Opus5 se filtra, llegan las primeras pruebas reales de los internautas

Claude Opus 5 ha sido filtrado antes de su lanzamiento oficial y los primeros usuarios ya han comenzado a probarlo. Las demostraciones muestran capacidades significativamente mejoradas en la generación de gráficos 2D y 3D, con un nivel de detalle que supera a su predecesor y, según algunos, incluso rivaliza con Fable 5. Los usuarios han compartido ejemplos impresionantes: una escena 3D detallada de un ataque con catapulta que incluye parámetros físicos, interfaces de usuario con efectos de iluminación dinámicos, una cocina con texturas realistas y una recreación precisa de Minecraft con físicas y sombreado. Una comparación directa con Fable 5 en la misma escena mostró que Opus 5 genera una densidad de detalles muy superior. Las filtraciones comenzaron a aparecer a principios de julio, con menciones del modelo en Cursor y Google Vertex AI. Recientemente, usuarios reportan tener acceso a Opus 5 a través de varios proveedores, aunque la interfaz aún puede mostrar la versión 4.8. Una captura de pantalla filtrada de un posible empleado de Anthropic mostró que el sistema enrutó una solicitud a Opus 5 después de que Fable 5 activara una restricción de seguridad. Surge la pregunta de si Opus 5, con un precio por token que es la mitad del de Fable 5, podría ser un reemplazo más económico. Sin embargo, un tester advierte que Opus 5 consume tokens mucho más rápido, lo que potencialmente anularía la ventaja de precio. A la espera de su lanzamiento oficial y de evaluaciones completas, la comunidad espera ver si Opus 5 cumple con las altas expectativas generadas.

marsbit07/24 07:56

Claude Opus5 se filtra, llegan las primeras pruebas reales de los internautas

marsbit07/24 07:56

¿En qué están apostando los jóvenes inversores cuando el consenso se acelera?

En el ámbito de las inversiones tecnológicas, los inversores más jóvenes están adaptando sus estrategias al rápido cambio de paradigma. Con avances simultáneos en IA, robótica, aeroespacial y computación cuántica, el modelo tradicional de inversión ya no es suficiente. Ahora, comprender el lenguaje técnico y evaluar rutas tecnológicas aún inmaduras antes de que se forme un consenso es crucial. La inversión se está desplazando de la simple especulación con conceptos hacia la identificación de caminos reales de adopción industrial. Se destacan cuatro tendencias principales: Primero, la IA está abandonando las pantallas para integrarse en el mundo físico, impulsando áreas como la inteligencia encarnada, los robots humanoides y los dispositivos inteligentes de borde. El desafío ya no es solo una demostración técnica, sino la capacidad de entrega fiable y rentable a gran escala, como se ve en sectores como la entrega autónoma. Segundo, el enfoque en los modelos de lenguaje grandes (LLM) está cambiando. Más allá de buscar el próximo avance arquitectónico, el foco está en las empresas que pueden integrar estas capacidades en flujos de trabajo reales para crear un "volante de inercia de inteligencia": un ciclo virtuoso donde el uso genera datos que mejoran el modelo, lo que atrae a más usuarios y refuerza su ventaja. La creación de valor sostenible y profundo en la cadena de valor de la IA es clave. Tercero, frente al posible cuello de botella en datos de alta calidad para entrenar LLMs, surgen nuevas direcciones como los modelos de base científica. Estos modelos, entrenados con datos científicos rigurosos y capaces de generar conocimiento o simulaciones, podrían ser la próxima frontera para expandir las capacidades de la IA más allá de los datos disponibles en Internet. Finalmente, en áreas de tecnología profunda como el espacio comercial, la computación cuántica o la energía avanzada, se requiere un "capital paciente". Estos campos tienen ciclos de validación más largos y mayor incertidumbre técnica, pero son fundamentales para la infraestructura futura. La inversión aquí implica apostar por la capacidad de ingeniería, la resiliencia del equipo y la demanda a largo plazo, aceptando horizontes de retorno más extensos. En resumen, los jóvenes inversores están navegando un panorama donde el éxito depende de una comprensión técnica profunda, la identificación temprana de tendencias industriales genuinas y la voluntad de realizar apuestas a largo plazo en tecnologías transformadoras, tanto en el mundo digital como en el físico.

marsbit07/22 03:39

¿En qué están apostando los jóvenes inversores cuando el consenso se acelera?

marsbit07/22 03:39

¿Repitiendo el "momento DeepSeek"? Wall Street coincide: Kimi K3, en cambio, refuerza la demanda de potencia de cómputo

Los analistas de Wall Street de UBS, Nomura, Bank of America Merrill Lynch y Citigroup argumentan que el lanzamiento del modelo de IA Kimi K3, un LLM de código abierto de 2.8 billones de parámetros, no debilita sino que refuerza la demanda de capacidad de cálculo (computación). A diferencia del impacto en eficiencia visto con DeepSeek R1, K3 se centra en la escala, con características como una ventana de contexto de 1M de tokens, inferencia continua y arquitectura MoE. Estas características aumentan la presión sobre los recursos de inferencia, memoria, red y almacenamiento. Los bancos citan la "Paradoja de Jevons": modelos más asequibles impulsan un uso y despliegue más amplios, incrementando finalmente el consumo total de recursos. La competencia entre modelos líderes chinos y estadounidenses probablemente acelere las inversiones en infraestructura de IA. Los sectores beneficiados identificados incluyen el almacenamiento (p.ej., HBM, eSSD), la computación (p.ej., NVIDIA, TSMC), las redes (necesidad de clústeres de "supernodos") y las plataformas en la nube. En resumen, se considera que los modelos de código abierto potentes como K3 no son el final de la demanda de infraestructura de IA, sino un catalizador para su próxima fase de expansión, siempre que el crecimiento del volumen de tokens y las cargas de trabajo complejas continúen.

链捕手07/21 06:21

¿Repitiendo el "momento DeepSeek"? Wall Street coincide: Kimi K3, en cambio, refuerza la demanda de potencia de cómputo

链捕手07/21 06:21

La IA se lleva la recompensa de 100 dólares de Erdős: un problema que una revista top de 44 páginas no resolvió, lo resolvió en una sola hoja

Un AI (GPT-5.6 Sol) y el matemático Korsky han resuelto en una sola página el tercer y último interrogante del problema 119 de Erdős, una cuestión sobre polinomios con raíces en la circunferencia unidad. Este resultado es más fuerte que el que en 1991 demostró József Beck en un artículo de 44 páginas publicado en Annals of Mathematics. Thomas Bloom, creador del sitio erdosproblems.com, señala que la prueba AI-humana utiliza técnicas estándar de análisis armónico de una manera ingeniosa y simple, evitando un camino complejo que antes se creía necesario. Esto sugiere que algunas dificultades matemáticas históricas pueden reflejar límites de la paciencia o intuición humana, no solo la complejidad intrínseca del problema. Este caso se suma a otros logros recientes de modelos de OpenAI, como la prueba de la conjetura del Cycle Double Cover. El debate continúa sobre si la IA ha alcanzado un "muro" en matemáticas, pero sus avances muestran su capacidad para explorar sistemáticamente variantes que un humano podría descartar prematuramente.

marsbit07/20 12:38

La IA se lleva la recompensa de 100 dólares de Erdős: un problema que una revista top de 44 páginas no resolvió, lo resolvió en una sola hoja

marsbit07/20 12:38

La ansiedad de memoria de los grandes modelos, la solución podría estar en la unidad USB

Según un artículo publicado por IEEE, surge una nueva estrategia inesperada para aliviar la ansiedad por la memoria en los modelos de lenguaje grandes (LLM): utilizar la tecnología **NAND Flash**, la misma que se emplea en las memorias USB. Tradicionalmente, la memoria Flash se ha considerado lenta, especialmente para tareas de IA. Sin embargo, empresas como SanDisk y SK Hynix están promoviendo el **High Bandwidth Flash (HBF)**. Esta tecnología aplica métodos avanzados de empaquetado y apilamiento 3D (similares a los usados en la memoria HBM) a los chips NAND Flash. El objetivo es permitir que la memoria Flash, originalmente diseñada para almacenamiento, participe en el suministro de datos de alta velocidad durante la **inferencia de IA**. La clave está en que la Flash es lenta principalmente para **escribir**, pero su velocidad de **lectura** puede ser mucho mayor. Al apilar múltiples chips, el HBF busca alcanzar un gran ancho de banda de lectura (hasta 1.6 TB/s en su primera generación, con objetivos de 3.2 TB/s) y una alta capacidad (hasta 512 GB por pila). La propuesta no pretende reemplazar a la costosa y ultrarrápida HBM, sino **complementarla**. En la fase de inferencia, los pesos del modelo están congelados y se accede a ellos principalmente para lectura. El HBF podría actuar como un **"grupo de memoria de solo lectura de gran capacidad"** para almacenar estos pesos masivos y estáticos, liberando así la valiosa HBM para los datos de cálculo más críticos y frecuentes. Esto podría aliviar los cuellos de botella de capacidad y costo, reducir el número de aceleradores necesarios en los servidores y mejorar la eficiencia energética. Aunque el HBF aún no es un producto maduro (se estima que su despliegue a gran escala llevará años) y su estandarización está en curso dentro del Open Compute Project (OCP), representa una señal importante. Indica que la arquitectura de memoria para la IA está evolucionando hacia un **sistema en capas**, donde cada tipo de dato (ultrarrápido, de lectura intensiva, almacenamiento frío) reside en la tecnología más adecuada en términos de rendimiento, capacidad y coste. La solución a los desafíos de escalabilidad de los LLMs podría venir no solo de memorias más caras, sino de reinventar y reempaquetar tecnologías ya conocidas, como la Flash.

marsbit07/20 00:22

La ansiedad de memoria de los grandes modelos, la solución podría estar en la unidad USB

marsbit07/20 00:22

Se filtra la versión "completa" de DeepSeek V4, su lanzamiento podría ser mañana mismo

Tras casi tres meses de espera, DeepSeek V4 (versión definitiva) podría lanzarse pronto, quizás incluso mañana. Actualmente, algunos usuarios tienen acceso anticipado en pruebas. Se ofrecerán dos versiones: DeepSeek V4 Flash y DeepSeek V4 Pro. Las primeras impresiones de desarrolladores indican que su rendimiento general se acerca al nivel de Opus 4.8, con capacidades de codificación similares a GPT-5.6 Sol. Sus habilidades como agente y la generación de contenido 3D y SVG han mejorado notablemente. Aunque es probable que no supere al recién lanzado Kimi K3 en rendimiento puro, se espera que su precio sea significativamente más bajo, lo que podría crear otro "momento DeepSeek" en cuanto a relación calidad-precio. Se han filtrado demos que muestran sus capacidades, como la generación de juegos funcionales en HTML y SVG. Un cambio importante es la introducción de un nuevo modelo de precios API con tarifas variables ("peak/off-peak"). Por ejemplo, deepseek-v4-pro costará 0,87 USD por millón de tokens de salida en horas normales y 1,74 USD en horas pico. DeepSeek-V4-Flash será aún más económico. Aunque es la primera vez que DeepSeek implementa un sistema de precios por demanda, sus tarifas siguen siendo muy competitivas frente a alternativas como Fable 5. En resumen, DeepSeek V4 no busca ser el modelo más potente en todos los aspectos, sino ofrecer un rendimiento de alto nivel (cercano a Opus) a una fracción del costo de la competencia, manteniendo su papel como "destructor de precios" en el mercado de la IA.

marsbit07/19 05:34

Se filtra la versión "completa" de DeepSeek V4, su lanzamiento podría ser mañana mismo

marsbit07/19 05:34

Desmontar el cerebro de Claude no sirve de nada, la verdadera clave de la caja negra de la IA está en la ingeniería ontológica

El artículo critica el enfoque actual de la investigación en explicabilidad de IA, ejemplificado por el "J-Space" de Anthropic, por su orientación internalista y neurocientífica, que equipara explicar con observar estados internos del modelo. Argumenta que la verdadera clave para la interpretabilidad no reside en diseccionar el "cerebro" de la IA, sino en la **ingeniería ontológica**. Propone cambiar el enfoque de "cómo piensa el modelo" a "qué información procesa y cuál es su estatus ontológico". Al anclar el conocimiento y el razonamiento del modelo en estructuras ontológicas formales y rastreables, la explicabilidad deja de ser una tarea de inspección neuronal imposible y se convierte en un objetivo de gobernanza alcanzable mediante la ingeniería, haciendo que el impacto del modelo en el mundo sea comprensible y responsable.

marsbit07/17 07:44

Desmontar el cerebro de Claude no sirve de nada, la verdadera clave de la caja negra de la IA está en la ingeniería ontológica

marsbit07/17 07:44

Artículos Relacionados con LLM

Claude Code elimina un 80% de indicaciones, y Opus 5... ¡se las vuelve a añadir!

Un tercio de los artículos de arXiv está escrito por IA: El 65% de los artículos de informática detectados con "sabor a IA", solo un 0,7% en matemáticas

¡En solo 2 meses su valoración ha pasado de 8.800 millones a 68.000 millones de euros! OpenRouter, la mayor centralita de la IA, podría ser adquirida

Claude Opus5 se filtra, llegan las primeras pruebas reales de los internautas

¿En qué están apostando los jóvenes inversores cuando el consenso se acelera?

¿Repitiendo el "momento DeepSeek"? Wall Street coincide: Kimi K3, en cambio, refuerza la demanda de potencia de cómputo

La IA se lleva la recompensa de 100 dólares de Erdős: un problema que una revista top de 44 páginas no resolvió, lo resolvió en una sola hoja

La ansiedad de memoria de los grandes modelos, la solución podría estar en la unidad USB

Se filtra la versión "completa" de DeepSeek V4, su lanzamiento podría ser mañana mismo

Desmontar el cerebro de Claude no sirve de nada, la verdadera clave de la caja negra de la IA está en la ingeniería ontológica

Categorías populares

Etiquetas Populares