OpenAI bot aplasta a los campeones de Dota 2, y ahora cualquiera puede jugar contra él

Captura de pantalla de un monstruo de videojuego ardiente.
Agrandar / Shadow Fiend, con un aspecto sombrío y diabólico.

En los últimos años, OpenAI, una startup con la misión de garantizar que «la inteligencia general artificial beneficie a toda la humanidad», ha estado desarrollando un bot impulsado por el aprendizaje automático para jugar a Dota 2, el mejor juego del universo. A partir de una versión muy reducida del juego completo, el bot se ha desarrollado a lo largo de los años jugando millones y millones de partidas contra sí mismo, aprendiendo no solo a jugar el juego de equipo de cinco contra cinco, sino también a ganar, de manera consistente.

Hemos podido ver el desarrollo del bot a lo largo de una serie de partidas, cada una con una versión más completa de un juego y oponentes humanos más hábiles. Esto culminó en lo que se espera que sea el último partido del fin de semana, cuando OpenAI Five se enfrentó al mejor de tres contra OG, el equipo que ganó la competencia más grande de todos los esports el año pasado, La Internacional.

Ver más

OpenAI está sujeto a algunas desventajas en nombre de mantener las cosas interesantes. Cada uno de sus cinco jugadores de IA está ejecutando una versión idéntica del software bot, sin comunicación entre ellos: son cinco jugadores independientes que piensan muy igual, pero no tienen medios directos para coordinar sus acciones. El tiempo de reacción de OpenAI se ralentiza artificialmente para garantizar que el juego no sea simplemente un escaparate de reflejos sobrehumanos. Y el bot todavía no está usando la versión completa del juego: solo hay disponible una selección limitada de héroes, y los objetos que crean esbirros controlables o ilusiones están prohibidos porque se cree que el bot podría microgestionar a sus esbirros de manera más efectiva que cualquier humano.

Los juegos se pueden ver aquí. El primer partido se veía incluso a los 19 minutos. Los humanos tenían una pequeña ventaja de oro, pero los bots tenían un mejor control territorial. Los bots salieron adelante en una pelea de equipo, matando a tres jugadores humanos mientras perdían solo a uno. El juego todavía parecía estar en un filo de navaja, pero los bots no estuvieron de acuerdo: anunciaron que tenían un 95 por ciento de posibilidades de ganar y, al hacer esta declaración, usaron instantáneamente su ventaja numérica para infligir un gran daño a la base humana. Esto mejoró aún más su control territorial y también les dio una importante ventaja de oro.

Esto puso a los humanos en el pie de atrás, y mientras lograron dibujar el juego durante otros 20 minutos, fueron incapaces de superar la ventaja de los bots, dando al OpenAI una ventaja de 1-0.

En el segundo juego, las cosas ni siquiera estaban cerca; los bots tomaron una ventaja temprana y rompieron la base humana en 15 minutos. Se llevaron la victoria cinco minutos después.

Publicidad

En general, fue un rendimiento dominante de OpenAI: una victoria de 2-0 contra un equipo humano establecido acostumbrado a jugar entre sí al más alto nivel que el juego tiene para ofrecer. Esta actuación fue de lejos la más fuerte de OpenAI a lo largo de los años.

La coordinación de los bots es asombrosa: aunque no pueden comunicarse, los cinco jugadores controlados por computadora piensan de la misma manera. Si uno piensa que es una buena oportunidad para atacar a un jugador humano, los otros cuatro pensarán lo mismo y se unirán al ataque. Esto da la apariencia de una gran coordinación en las peleas de equipo, coordinación con una precisión y rigor que los equipos humanos no pueden igualar.

Una habitación china rudimentaria

Pero OpenAI parece derrotable. Tiene debilidades definidas, aunque sorprendentes—no es muy bueno para anotar últimos golpes, los golpes mortales en unidades controladas por computadora que se utilizan para acumular oro en el juego. Esto da a los humanos la oportunidad de obtener una ventaja de oro temprana. Los bots también lucharon para contrarrestar la invisibilidad en el lado humano. También parecían adaptarse mal a ciertos hechizos de algunos de los héroes, en particular la Fisura del Temblor de Tierra, un hechizo que crea temporalmente una barrera infranqueable en el mapa. Los humanos eran eficaces en usar esto para atrapar a los jugadores de bots y restringir su movimiento, y esto parecía confundir a OpenAI.

El comportamiento de los bots también es una lección de objetos en la gran brecha entre este tipo de sistema de aprendizaje automático y una inteligencia artificial general completa. Si bien AI Five es claramente efectivo para ganar juegos, también claramente no sabe cómo jugar a Dota 2. Los jugadores humanos del juego usan una técnica llamada «tirar» para redirigir el flujo de los esbirros controlados por computadora de su lado (conocidos como creeps en Dota 2) como una forma de negar al equipo enemigo tanto oro como experiencia. Los jugadores humanos pueden reconocer que esto ha ocurrido porque los cretinos no aparecen cuando se supone que deben hacerlo. Los jugadores humanos tienen un modelo mental de todo el juego, una comprensión de sus reglas, y por lo tanto pueden reconocer que algo está mal; pueden razonar sobre dónde deben haber ido los creeps e interferir con la atracción. La computadora, por el contrario, simplemente deambula sin rumbo cuando se enfrenta a este escenario.

Sin tirar

En sus millones de juegos jugados contra sí mismo, OpenAI parece nunca haber aprendido la técnica de tirar, por lo que nunca ha aprendido a jugar contra ella. Por lo tanto, cuando un equipo humano comienza a tirar, el bot no reconoce la situación y no sabe realmente qué hacer. No puede razonar sobre cómo debería ser el juego, y no puede especular sobre por qué el juego se está comportando de una manera inesperada. Todo lo que el bot puede hacer es buscar patrones que reconozca y elegir la acción que tenga más probabilidades de producir el mejor resultado; darle un patrón que no pueda reconocer y su rendimiento se deteriora.

Hasta ahora, el OpenAI bot ha sido restringido; a ciertos profesionales y streamers se les ha dado acceso para jugar contra él, y también ha estado disponible para jugar contra él en algunos eventos en vivo. Pero durante unos días, eso está cambiando: los jugadores de Dota 2 pueden inscribirse aquí para jugar contra el bot, o con él, durante un período de tres días. Desafortunadamente, este período público no parece que vaya a resultar en un bot nuevo y mejorado: vencer a un equipo humano de primer nivel fue el objetivo que OpenAI estableció para su bot, y con eso logrado, el experimento parece estar completo.

You might also like

Deja una respuesta

Tu dirección de correo electrónico no será publicada.