Los agentes de codificación de IA pueden dirigir de manera autónoma la capacitación de robots

¿Qué sucede cuando le das a los agentes de codificación de IA un laboratorio lleno de brazos robóticos, algunos recursos de computación y un "generoso presupuesto de tokens" para enseñar a los robots diversas tareas? Los agentes aparentemente pueden idear un régimen de entrenamiento que enseña a los robots a cortar exitosamente bridas y hasta insertar GPU en zócalos delgados en placas base.
Ese vistazo a cómo la IA puede actuar de manera completamente autónoma para automatizar la capacitación de robots fue posible gracias a un nuevo marco de soporte de agentes: software que envuelve modelos de IA para permitir el uso de diversas herramientas, mientras también proporciona capacidades como memoria, contexto, restricciones y bucles de retroalimentación. Ese arnés agente, llamado ENPIRE, fue desarrollado por investigadores de robótica en el laboratorio NVIDIA GEAR (Investigación de Agentes Embodidos Generalistas) junto con colaboradores de la Universidad Carnegie Mellon en Pittsburgh y la Universidad de California, Berkeley.
“Una parte de nuestro laboratorio NVIDIA GEAR ahora se mejora sin descanso durante la noche”, escribió Jim Fan, director de IA en NVIDIA, en una publicación de LinkedIn. “Solo leemos los informes por la mañana.”
Fan también bromeó sobre el objetivo de tal capacitación de robots dirigida por IA, diciendo: “Todos tomamos unas vacaciones y Jensen ni siquiera lo notaría”, en referencia al fundador y CEO de Nvidia, Jensen Huang. Pero no son solo los investigadores de robótica de Nvidia quienes podrían beneficiarse: Fan dijo que el equipo estará publicando todo como código abierto para que cualquiera pueda tener su propio “laboratorio de robots autoejecutables en casa.”
El arnés ENPIRE tiene cuatro módulos que permiten a los agentes de codificación de IA realizar reinicios automáticos y verificaciones en tareas, refinar políticas que guían el comportamiento robótico, evaluar tales políticas en múltiples robots físicos trabajando en paralelo y abordar fallos analizando registros, ingresando artículos de investigación y mejorando la infraestructura de capacitación y el código de algoritmos. Más detalles técnicos están disponibles en el documento de investigación subido el 16 de junio de 2026.
El arnés fue probado con tres agentes de codificación de IA diferentes, incluidos Codex de OpenAI con GPT-5.5, Claude Code de Anthropic con Opus 4.7 y Kimi Code de Moonshot AI con Kimi K2.6. Equipos de los agentes de codificación desarrollaron independientemente diferentes enfoques algorítmicos para la capacitación de robots, los probaron en experimentos del mundo real y luego retuvieron cualquier cambio que ayudara a elevar la tasa de éxito general en ciclos repetidos de pruebas autodirigidas.



