Artículos Relacionados con Código

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Código", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

El equipo de NVIDIA permite a un agente de programación hacerse cargo de experimentos con robots reales, logrando una tasa de éxito del 99%

La investigación en automatización ha dado un paso significativo al salir del entorno simulado y adentrarse en el mundo físico real. El equipo de NVIDIA GEAR, dirigido por Jim Fan, presentó el proyecto ENPIRE, un marco que permite por primera vez que agentes de programación autónomos realicen investigación en hardware robótico real. El sistema coloca ocho agentes Codex en una flota de robots con recursos de GPU y un presupuesto de tokens, asignándoles el objetivo de resolver tareas de forma eficiente y segura. Estos agentes operan con mínima intervención humana, manejando de forma autónoma un ciclo cerrado que incluye el reinicio automático de escenarios, la búsqueda en literatura, la implementación y entrenamiento de estrategias, la verificación y el análisis de registros para iterar continuamente. Han logrado una tasa de éxito del 99% en tareas de manipulación diestra como atar bridas, organizar clavos en una caja o instalar GPUs. Un hallazgo clave es que para muchas tareas robóticas, restablecer el entorno es más fácil que completar la tarea principal. Por ello, ENPIRE se centra primero en que los agentes creen procedimientos automáticos de reinicio. El sistema consta de cuatro módulos principales que forman el bucle de retroalimentación física: Entorno (EN), Mejora de Políticas (PI), Evaluación (Rollout, R) y Evolución (E). El proyecto también observó una "ley de escala física": aumentar el número de robots en paralelo (por ejemplo, a 8) acelera significativamente la resolución de tareas. Se introdujeron nuevas métricas como la Utilización Media del Robot (MRU) y la Utilización Media de Tokens (MTU) para medir la eficiencia. Actualmente, algunos sistemas pueden iterar durante toda la noche sin supervisión. El objetivo final es lograr una operación completamente autónoma. El proyecto ENPIRE será de código abierto, permitiendo a los desarrolladores replicar sistemas similares.

marsbitAyer 00:37

El equipo de NVIDIA permite a un agente de programación hacerse cargo de experimentos con robots reales, logrando una tasa de éxito del 99%

marsbitAyer 00:37

Claude Opus 4.8 acaba de lanzarse y ya dice ser DeepSeek, Qwen

Acompañando las expectativas de su OPI, Anthropic ha acelerado el ritmo de lanzamiento de modelos. Recientemente, anunció dos noticias importantes: la actualización de su modelo insignia a Claude Opus 4.8 y la finalización de una ronda de financiación Serie H de 650.000 millones de dólares, con una valoración posterior a la inversión de 9,65 billones, acercándose al umbral del billón. Claude Opus 4.8 presenta mejoras en codificación, tareas de agente, razonamiento y trabajo con conocimiento, manteniendo los mismos precios. Los usuarios notaron que, en algunas pruebas sin restricciones estrictas del sistema, el modelo ocasionalmente se identificaba erróneamente como DeepSeek o Qwen, lo que sugiere un posible comportamiento de destilación. Junto con el modelo, se lanzaron nuevas funciones como el control de esfuerzo (effort control) y los flujos de trabajo dinámicos (dynamic workflows). Esta última función, en vista previa de investigación, permite a Claude Code manejar tareas complejas a gran escala mediante la orquestación de múltiples subagentes que trabajan en paralelo, mostrando potencial para migraciones masivas de código. La ronda de financiación de 650.000 millones incluye compromisos de hyperscalers y socios de infraestructura estratégica como Micron y Samsung. Anthropic también ha firmado acuerdos clave para ampliar su capacidad de cálculo con Amazon, Google, Broadcom y SpaceX. En conjunto, estos movimientos reflejan la evolución de Anthropic desde una empresa centrada en modelos hacia un proveedor de un sistema integral de IA empresarial, combinando capacidades de modelo avanzado, flujos de trabajo complejos y una infraestructura de computación escalable.

marsbit05/29 00:00

Claude Opus 4.8 acaba de lanzarse y ya dice ser DeepSeek, Qwen

marsbit05/29 00:00

活动图片