La recolección de datos de entrenamiento para robots es un trabajo sucio y poco glamuroso. Algunos laboratorios de IA ya están pagando a XDOF para hacerlo.

Hace dos semanas, OpenAI anunció que relanzaría el programa de robótica que cerró en 2021, la señal más reciente de que los laboratorios de IA más grandes están compitiendo para enseñar a las máquinas a operar en el mundo físico. Pero construir robots capaces requiere algo que la industria de IA aún no tiene, que es el conjunto de datos de entrenamiento que corresponde al que se utiliza para los modelos de lenguaje.
Esa brecha está creando un nuevo tipo de negocio de infraestructura. A diferencia de los LLM que se entrenaron en un vasto mar de texto disponible públicamente, los robots necesitan datos que capturen la interacción física, y ese tipo de datos apenas existe. Los videos de YouTube y las grabaciones capturadas por trabajadores temporales son de baja fidelidad y difíciles de reconciliar con el mundo físico.
XDOF (pronunciado 'ecks-doff'), que emerge del sigilo hoy, está apostando a que el próximo gran cuello de botella en IA no son los modelos o los chips, sino el ciclo de retroalimentación de datos necesario para enseñar a los robots cómo interactuar con el mundo físico.
La startup tiene como objetivo construir los canales de datos, herramientas de recolección y sistemas de anotación que los laboratorios fronterizos y las empresas de robótica no pueden construir fácilmente por sí mismos, y ha recaudado 70 millones de dólares de Thrive Capital, Spark Capital, a16z, Lux y WndrCo para hacerlo. El cofundador y CEO Philippe Wu dice que XDOF, que tiene alrededor de 60 empleados, ya está trabajando con 20 clientes, incluidos varios laboratorios de IA fronterizos, pero no puede nombrarlos.
“Todos los principales laboratorios están tratando de perseguir la robótica”, dijo Wu. “Ya hemos visto algunas de las desventajas de quedar un poco atrás en la carrera de modelos de lenguaje... no quieres estar en este tipo de situación donde persigues esta tecnología demasiado tarde, y todos están en este barco donde la IA física es la próxima frontera.”
Wu se encontró con este problema él mismo como estudiante de doctorado en UC Berkeley. Su enfoque estaba en permitir que los robots aprendieran habilidades a partir de conjuntos de datos a gran escala. Solo había un problema.
“No teníamos datos a gran escala con los que trabajar”, le dijo a TechCrunch. “Había este problema del huevo y la gallina: primero necesitábamos recolectar datos antes de poder incluso preguntar cómo entrenar un modelo base para robótica.”
Wu y su futuro cofundador y CTO de XDOF, Fred Shentu, trabajaron en un proyecto llamado GELLO, un sistema de teleoperación de bajo costo que permite a un operador humano controlar un brazo robótico para generar datos de entrenamiento. “Al final se convirtió en un artículo muy influyente en robótica, porque mucha gente tenía necesidades y cuellos de botella similares, y muchos comenzaron a aprovechar este tipo de dispositivo para la recolección de datos”, dijo Wu.
Al detectar la oportunidad, Wu, Shentu y el tercer cofundador y director de operaciones Nemo Jin lanzaron XDOF en octubre de 2024 para proporcionar un ecosistema de datos para empresas que persiguen modelos de robótica. Consciente de que la provisión de datos sola puede ser un negocio sin salida, la empresa también se centra en la limpieza de datos, herramientas y anotación, creando un ciclo de retroalimentación auto-reforzante para los entrenadores de robots.
Como punto de partida, la empresa se está asociando con el laboratorio de investigación de IA de UC Berkeley para publicar lo que creen es la colección más grande de datos de entrenamiento de robots de alta calidad.



