Meta-exploradores desarrollan IA capaz de diplomacia y engañar a los jugadores humanos
Agrandar / Una captura de pantalla de un juego de diplomacia en línea, que incluye un diálogo de chat en curso, proporcionada por un investigador de Cicero. El martes, Meta AI anunció el desarrollo de Cicero, que cree que será la primera IA en lograr un rendimiento a nivel humano en el juego de mesa estratégico Diplomacia. Este es un logro notable, ya que el juego requiere habilidades profundas de negociación interpersonal, lo que implica que Cicero ha adquirido cierto dominio del idioma necesario para ganar el juego. Incluso antes de que Deep Blue derrotara a Garry Kasparov en el ajedrez en 1997, los juegos de mesa eran una medida útil del rendimiento de la IA. Otra barrera cayó en 2015 cuando AlphaGo derrotó a Go Master Lee Sedol. Ambos juegos siguen un conjunto relativamente claro de reglas analíticas (aunque las reglas de inteligencia artificial de la computadora de Go generalmente se simplifican). Pero en la diplomacia, una gran parte del juego tiene que ver con las habilidades sociales. Los jugadores deben mostrar empatía, usar un lenguaje natural y construir relaciones para ganar, una tarea difícil para un jugador de computadora. Con eso en mente, Meta preguntó: «¿Podemos crear agentes más efectivos y flexibles que puedan usar el lenguaje para negociar, persuadir y colaborar con las personas para lograr objetivos estratégicos, como lo hacen los humanos?» Según Meta, la respuesta es sí. Cicero aprendió sus habilidades jugando una versión en línea de Diplomacy en webDiplomacy.net. Con el tiempo, se convirtió en un maestro del juego, según los informes, obtuvo «más del doble del puntaje promedio» de los jugadores humanos y se ubicó en el 10 por ciento superior de los jugadores que jugaron más de un juego. Para crear Cicero, Meta reunió modelos de IA para pensamiento estratégico (similar a AlphaGo) y procesamiento de lenguaje natural (similar a GPT-3) y los combinó en un solo agente. Durante cada juego, Cicero observa el estado del tablero de juego, el curso de la conversación y predice cómo se comportarán los demás jugadores. Crea un plan que ejecuta a través de un modelo de lenguaje que puede generar un diálogo similar al humano que le permite coordinarse con otros jugadores. anuncio publicitario diplomacia reproducciones, proporcionado por Meta.» src=»https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-640×907.jpg» width=»640″ height=»907″ />Agrandar / Un diagrama de bloques de Cicero, el bot que juega a la diplomacia, impulsado por Meta.Meta AI Meta llama a las habilidades de lenguaje natural de Cicero un «modelo de diálogo controlable» donde se encuentra el corazón de la personalidad de Cicero. Al igual que GPT-3, Cicero se basa en un gran corpus de textos de Internet extraídos de la Web. «Para construir un modelo de diálogo controlable, comenzamos con un modelo de lenguaje similar a BART con 2700 millones de parámetros, entrenado previamente con texto de la web y ajustado con más de 40 000 juegos humanos en webDiplomacy.net», escribe Meta. El modelo resultante dominó las complejidades de un juego complejo. «Cicero puede, por ejemplo, deducir que más adelante en el juego necesita el apoyo de un jugador en particular», dice Meta, «y luego desarrollar una estrategia para ganar el favor de esa persona, e incluso reconocer los riesgos y oportunidades que ese jugador ve». desde su perspectiva particular». La investigación Cicero de Meta apareció en la revista Science bajo el título «Juego a nivel humano en el juego de la diplomacia al combinar modelos de lenguaje con pensamiento estratégico». En cuanto a aplicaciones más amplias, Meta sugiere que su investigación Cicero podría » romper las barreras de comunicación» entre los humanos y la IA, como tener una conversación a largo plazo para enseñarle a alguien una nueva habilidad, o podría impulsar un videojuego donde los NPC pueden hablar como humanos, las motivaciones del jugador entienden y se adaptan en el camino. al mismo tiempo, esta tecnología podría usarse para manipular a las personas haciéndolas cambiar de opinión hacerse pasar por humanos y, dependiendo del contexto, engañarlos de maneras potencialmente peligrosas. Con eso en mente, Meta espera que otros investigadores puedan desarrollar su código «de manera responsable» y dice que ha tomado medidas para detectar y eliminar «mensajes tóxicos en este nuevo dominio», probablemente relacionados con el diálogo, que Cicero aprendió de los textos de Internet, incluidos, siempre un riesgo para los grandes modelos lingüísticos. Meta ha proporcionado un sitio web detallado para explicar cómo funciona Cicero y también ha abierto el código de Cicero en GitHub. Los fanáticos de la diplomacia en línea, y tal vez incluso el resto de nosotros, deberían prestar atención.