Los investigadores de inteligencia artificial desarrollan un método de adquisición de datos económico para escalar robots de entrenamiento


Un equipo de investigadores de inteligencia artificial creó una forma para que los humanos capaciten a los robots para que utilicen materiales baratos y disponibles de forma gratuita para escalar la recopilación de datos de capacitación y permitir una adopción generalizada. El experimento utiliza dispositivos de agarre y alcance en un poste que las personas con discapacidades, los ancianos y otras personas suelen usar para agarrar algo que está fuera de su alcance. Los autores montaron una cámara GoPro en el dispositivo para grabar los dedos de las pinzas en el trabajo. Utilizaron los datos para manipular o apilar objetos previamente invisibles en entornos previamente invisibles.

Los autores llaman a su enfoque el marco DAT (Demostraciones con herramientas de asistencia) y dicen que es nuevo porque permite la adquisición de datos de entrenamiento prácticamente en cualquier lugar, no solo en un entorno de laboratorio como los métodos previamente existentes. La preimpresión, titulada "Imitación visual hecha fácil", fue publicada el martes por autores de la Universidad Carnegie Mellon, Facebook AI Research, la Universidad de Nueva York y UC Berkeley.

Los investigadores decidieron utilizar el alcanzador-agarrador de baja tecnología en un "robot" barato y ampliamente disponible que no requiere entrenamiento para su uso. Las herramientas de agarre de Reacher cuestan alrededor de $ 10 en línea hoy y se pueden usar para hacer muchas tareas domésticas, como ir de compras. B. desbloquear una puerta, abrir un cajón o agarrar y mover varios objetos. El Handi-Grip-Reacher-Grabber utilizado en el estudio tenía un precio de $ 18.

Investigadores de Google y de la Universidad de Columbia tuvieron la idea de utilizar un poste con un dispositivo de agarre en el extremo, que fue aceptado para su publicación en junio.

Para entrenar al modelo, conectaron una cámara GoPro al mástil del alcance a través de un soporte impreso en 3D y registraron 1,000 intentos de mover objetos o completar tareas. Después de recopilar los videos, los investigadores lo usaron para entrenar una red neuronal convolucional que se aplicó a un brazo robótico equipado con una cámara y el mismo tipo de abrazadera de agarre de dos dedos que una pinza. Finalmente, agregaron una extensión de datos como jitter aleatorio, recolección y rotación a los datos de entrenamiento para mayores tasas de éxito cuando se probaron en un laboratorio. Utilizaron la clonación conductual y el aprendizaje supervisado para entrenar la configuración de políticas del modelo.

“En vista de estas demostraciones visuales, extraemos trayectorias de herramientas con métodos SfM (estructura a partir de movimiento) disponibles comercialmente y la configuración de pinza con un detector de dedos capacitado. Una vez que hemos extraído las trayectorias de herramientas, se pueden aprender las habilidades adecuadas utilizando técnicas de aprendizaje de imitación estándar ”, dice el artículo.

Al final del proceso, el sistema logró tasas de éxito del 87,5% cuando los objetos se empujaron a través de una mesa hasta un punto objetivo y del 62,5% en el rendimiento de apilamiento. En algunos casos, los humanos intervinieron durante los tiempos de prueba para intentar que el robot no hiciera su trabajo.

El aprendizaje visual de imitación busca entrenar a los robots para que hagan cosas basándose en lo que ven basándose en la entrada de una foto o video de una tarea completada. Los métodos existentes incluyen la enseñanza cinestésica, pero esto puede ser lento, difícil y requiere más trabajo humano.

Los autores argumentan que estos enfoques también pueden ser costosos y no tan útiles como la IA, que se entrena con datos en entornos reales. El uso de la forma más barata de robótica disponible generalmente se considera una forma de democratizar el acceso y permitir una adopción más amplia de los sistemas de inteligencia artificial una vez que estén disponibles en producción.

El enfoque del marco DAT podría ser útil para capacitar a los tipos de robots en los hogares de las personas para capturar un conjunto único de objetos, como Hello Robot, una startup que fue fundada el mes pasado por el ex Google El director de robótica Aaron Edsinger y el profesor de tecnología de Georgia, Charlie Kemp, surgieron de las sombras. El primer robot de la compañía, Stretch, también usa una pinza simple, similar a un agarrador de alcance, para agarrar o mover objetos en el mundo real.

Este es el último trabajo de UC Berkeley que usa hardware estándar para mejorar los sistemas robóticos. En junio, los investigadores de IA de UC Berkeley dieron a conocer Dex-Net AR, que usa ARKit de Apple para escanear objetos físicos durante dos minutos para entrenar un brazo robótico con un agarre similar a una mano para recoger objetos únicos. En 2018, los investigadores de UC Berkeley compartieron el trabajo de capacitación de agentes de IA para realizar movimientos únicos como backflips y el baile "Gangnam Style" de los videos de YouTube.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *