Los robots están haciendo que ChatGPT toque el mundo real gracias a Microsoft


Microsoft La semana pasada, los investigadores de Microsoft anunciaron un marco experimental para controlar robots y drones usando las capacidades de voz de ChatGPT, un popular modelo de lenguaje de IA desarrollado por OpenAI. Usando comandos de lenguaje natural, ChatGPT puede escribir un código especial que controla los movimientos del robot. Luego, un humano mira los resultados y los ajusta según sea necesario hasta que la tarea se complete con éxito. La investigación se publicó en un artículo titulado «ChatGPT para robótica: principios de diseño y habilidades de modelo», escrito por Sai Vemprala, Rogerio Bonatti, Arthur Bucker y Ashish Kapoor del Grupo de Robótica y Sistemas Autónomos de Microsoft. En un video de demostración, Microsoft muestra robots, que parecen estar controlados por código escrito por ChatGPT mientras siguen instrucciones humanas, usando un brazo robótico para colocar bloques en un logotipo de Microsoft, volando un dron para inspeccionar el contenido de un estante o encontrar objetos. con un robot con vista. Video de demostración de ChatGPT para robótica de Microsoft. Para conectar ChatGPT a la robótica, los investigadores le enseñaron a ChatGPT una API de robótica personalizada. Dadas instrucciones como «recoge la pelota», ChatGPT puede generar un código de control robótico como si escribiera un poema o completara un ensayo. Después de que un humano revise y edite el código para garantizar su precisión y seguridad, el operador humano puede realizar la tarea y evaluar su desempeño. De esta forma, ChatGPT agiliza la programación de los controladores de los robots, pero no es un sistema autónomo. «Hacemos hincapié en que el uso de ChatGPT para la robótica no es un proceso completamente automatizado», afirma el documento, «sino que sirve como una herramienta para aumentar la capacidad humana».
Agrandar / Un diagrama proporcionado por Microsoft que explica cómo funciona ChatGPT para robótica He tenido cierto éxito al introducir datos visuales en ChatGPT. En un ejemplo, los investigadores encargaron a ChatGPT que ordenara a un robot que atrapara una pelota de baloncesto utilizando los comentarios de una cámara: “ChatGPT puede usar código SVG para estimar la apariencia de la pelota y el cielo en la imagen de la cámara. Este comportamiento sugiere la posibilidad de que el LLM esté buscando un modelo mundial implícito que vaya más allá de las probabilidades basadas en texto». Microsoft dice que una interfaz ChatGPT podría llevar la robótica a una audiencia mucho más amplia en el futuro. «Nuestro objetivo con esta investigación es ver si ChatGPT puede pensar más allá del texto y pensar en el mundo físico para ayudar con las tareas robóticas». una publicación de blog de Microsoft Research, «Queremos ayudar a las personas a interactuar más fácilmente con los robots sin tener que aprender lenguajes de programación complejos o detalles sobre sistemas robóticos».

Deja una respuesta

Tu dirección de correo electrónico no será publicada.