OpenAI enseña la mano del robot para resolver el cubo de Rubik

La manipulación en la mano es una habilidad que, hasta donde yo sé, los humanos en general no aprenden activamente. Simplemente lo resolvemos haciendo otras tareas más específicas con nuestros dedos y manos. Esto hace que sea particularmente difícil enseñar a los robots a resolver tareas de manipulación en la mano porque la forma en que lo hacemos es a través de la experimentación y la prueba y error. Los robots también pueden aprender a través de prueba y error, pero como generalmente termina siendo un error, lleva mucho, mucho tiempo.

En junio pasado, escribimos sobre el enfoque de OpenAI para enseñarle a un robot de cinco dedos a manipular un cubo. El método que OpenAI utilizó aprovechó el mismo tipo de experimentación y prueba y error, pero en simulación en lugar de en hardware de robot. Para tareas complejas que requieren mucha delicadeza, la simulación generalmente se traduce pobremente en habilidades del mundo real, pero OpenAI hizo que su sistema fuera muy robusto al introducir un montón de aleatoriedad en la simulación durante el proceso de capacitación. De esa manera, incluso si la simulación no coincidía perfectamente con la realidad (que no era así), el sistema aún podría manejar los tipos de variaciones que experimentó en el hardware del mundo real.

En una preimpresión papel publicado en línea hoy, OpenAI ha logrado enseñarle a su mano robot a resolver una versión mucho más difícil de la manipulación de cubos en la mano: la resolución con una sola mano de un cubo de Rubik 3×3. El nuevo trabajo también se basa en la idea de resolver un problema utilizando simulaciones avanzadas y luego transferir la solución a un sistema del mundo real, o lo que los investigadores llaman “sim2real”. En el documento, OpenAI dice que el nuevo enfoque “mejoró la transferencia sim2real”.

Related Stories