El robot Atlas aprende a caminar y manipular objetos con un solo modelo de IA

Puntos clave
- Atlas ahora utiliza un solo modelo de IA para caminar y manipular objetos
- El modelo integra datos visuales y de sensores internos
- El entrenamiento incluye teleoperación, simulación y demostraciones de video
- Se han observado habilidades emergentes como la recuperación automática
- El enfoque se asemeja a las tendencias en el desarrollo de grandes modelos de lenguaje
- Los expertos elogian la coordinación pero piden una evaluación exhaustiva del rendimiento
- El trabajo señala un cambio hacia robots más adaptables y del mundo real
- Los esfuerzos futuros se centrarán en la transparencia de los datos y la cobertura de tareas más amplia
El robot humanoid Atlas de Boston Dynamics ha demostrado la capacidad de caminar y manipular objetos utilizando un solo modelo de inteligencia artificial. Desarrollado con el Instituto de Investigación de Toyota, el modelo integra datos visuales y proprioceptivos y puede realizar una variedad de tareas sin controladores especializados separados.
Antecedentes
Boston Dynamics ha sido conocida durante mucho tiempo por crear robots humanoides avanzados que pueden realizar proezas físicas impresionantes. El robot Atlas de la empresa ha demostrado anteriormente parkour, rutinas de baile y otros movimientos complejos, generalmente confiando en múltiples sistemas de control especializados para diferentes acciones.
Desarrollo del modelo de IA unificado
En asociación con el Instituto de Investigación de Toyota, Boston Dynamics introdujo un solo modelo de inteligencia artificial que controla tanto las piernas como los brazos de Atlas. El modelo procesa entradas visuales de las cámaras del robot, datos de sensores internos que rastrean su posición y movimiento, y prompts contextuales relacionados con acciones deseadas. Aprende de una mezcla de demostraciones teleoperadas, escenarios simulados y videos grabados, lo que le permite generalizar a través de una variedad de tareas.
Capacidades demostradas
Usando el modelo unificado, Atlas puede caminar mientras alcanza objetos, reubicar sus piernas para mantener el equilibrio y agarrar objetos con movimientos de brazos coordinados. El sistema también exhibe comportamiento emergente, como doblarse automáticamente para recoger un objeto caído sin haber sido entrenado explícitamente para esa acción de recuperación específica. Esto se asemeja a la forma en que los grandes modelos de lenguaje a veces muestran habilidades inesperadas después de un entrenamiento extenso.
Perspectivas de expertos
Los roboticistas involucrados en el proyecto destacan que tratar los pies del robot como manipuladores adicionales simplifica el proceso de aprendizaje y permite un movimiento más natural. Los expertos externos señalan que, si bien el progreso es prometedor, la evaluación rigurosa de las tasas de éxito y los modos de falla sigue siendo esencial para comprender la verdadera extensión de las capacidades del robot.
Implicaciones para la robótica
El éxito de un solo modelo generalista para un robot humanoide sugiere un posible cambio hacia máquinas más adaptables que puedan operar en entornos del mundo real desordenados sin un entrenamiento extenso para cada nueva tarea. Al aprovechar grandes conjuntos de datos y métodos de entrenamiento similares a los utilizados en el procesamiento del lenguaje natural, los investigadores buscan crear robots que puedan adquirir rápidamente nuevas habilidades, desde tareas industriales hasta tareas domésticas cotidianas.
Perspectiva futura
La colaboración entre Boston Dynamics y el Instituto de Investigación de Toyota planea seguir perfeccionando el modelo y publicando más datos de rendimiento. Los debates en curso dentro de la comunidad de robótica enfatizan que tanto la escalabilidad de los datos de entrenamiento como la ingeniería reflexiva desempeñarán papeles cruciales para lograr robots verdaderamente versátiles que puedan realizar una amplia gama de funciones de manera confiable.