Nos últimos anos, OpenAI, uma startup com a missão de garantir que “artificial inteligência geral, beneficia toda a humanidade,” tem vindo a desenvolver um aprendizado de máquina-driven bot para jogar Dota 2, o melhor jogo do universo. A partir de uma versão muito reduzida do jogo completo, o bot foi desenvolvido ao longo dos anos através de jogar milhões e milhões de jogos contra si mesmo, aprendendo não apenas como jogar o jogo de cinco em cinco equipes, mas como ganhar, consistentemente.
temos sido capazes de assistir o desenvolvimento do bot sobre uma série de jogos de show, com cada um usando uma versão mais completa de um jogo e adversários humanos mais qualificados. Isso culminou no que seria esperado para ser o último show match ao longo do fim de semana, quando o OpenAI Five foi colocado em uma melhor de três partida contra OG, a equipe que ganhou a maior competição em todos os esports no ano passado, A Internacional.
OpenAI está sujeito a algumas desvantagens em nome de manter as coisas interessantes. Cada um de seus cinco jogadores de IA está executando uma versão idêntica do software bot, sem comunicação entre eles: eles são cinco jogadores independentes que por acaso pensam da mesma forma, mas não têm meios diretos de coordenar suas ações. O tempo de reação do OpenAI é artificialmente retardado para garantir que o jogo não é simplesmente uma vitrine de reflexos sobre-humanos. E o bot ainda não está usando a versão completa do jogo: apenas uma seleção limitada de heróis está disponível, e os itens que criar controlável asseclas ou ilusões são proibidos porque ele sentiu que o bot seria capaz mantendo uma microgestão seus asseclas mais eficaz do que qualquer humano poderia.Os jogos podem ser assistidos aqui. O primeiro jogo ficou até cerca de 19 minutos depois. Os humanos tinham uma pequena vantagem em ouro, mas os bots tinham melhor controle territorial. Os bots saíram à frente em uma luta de equipes, matando três jogadores humanos enquanto perdiam apenas um. O jogo ainda parecia estar em uma ponta de faca, mas os bots discordaram: eles anunciaram que tinham uma chance de 95 por cento de ganhar e, ao fazer esta declaração, instantaneamente usaram sua vantagem numérica para lidar com danos pesados para a base humana. Isso aumentou ainda mais o seu controle territorial e deu-lhes uma liderança de ouro significativa, também.Isso colocou os humanos no pé de trás, e enquanto eles conseguiram tirar o jogo por mais 20 minutos, eles foram incapazes de superar a liderança dos bots, dando ao OpenAI uma vantagem de 1-0.
no segundo jogo, as coisas nem sequer estavam perto; os bots tomaram uma liderança precoce e invadiram a base humana em 15 minutos. Eles tomaram a vitória cinco minutos depois.
no geral, foi um desempenho dominante pela OpenAI: uma vitória por 2-0 contra uma equipe humana estabelecida acostumada a jogar um com o outro no mais alto nível que o jogo tem para oferecer. Esta performance foi de longe a mais forte do OpenAI ao longo dos anos.
a coordenação dos bots é estranha: embora eles não possam se comunicar, todos os cinco jogadores controlados por computador pensam da mesma maneira. Se um pensa que é uma boa oportunidade para atacar um jogador humano, os outros quatro vão pensar o mesmo e se juntar ao ataque. Isso dá a aparência de grande coordenação em lutas de equipe—coordenação com uma precisão e rigor que as equipes humanas não podem igualar.
uma sala rudimentar Chinesa
mas OpenAI parece batível. Ele tem definitivamente, se surpreendente, fraquezas-não é grande em marcar os últimos hits, os golpes de matança em unidades controladas por computador que são usados para acumular ouro no jogo. Isso dá aos humanos uma oportunidade de obter uma vantagem de ouro precoce. Os bots também lutavam contra a invisibilidade do lado humano. Eles também pareciam adaptar-se mal a certos feitiços de alguns dos heróis, em particular a fissura de Earthshaker, um feitiço que temporariamente cria uma barreira intransponível no mapa. Os humanos foram eficazes em usar isso para prender os jogadores de bot e restringir seu movimento, e isso parecia confundir OpenAI.
o comportamento dos bots é também uma lição de objetos na grande lacuna entre este tipo de Sistema de aprendizagem de máquinas e uma inteligência artificial geral completa. Enquanto AI Five é claramente eficaz em jogos vencedores, ele também claramente não sabe realmente como jogar Dota 2. Os jogadores humanos do jogo usam uma técnica chamada “puxando” para redirecionar o fluxo de seus asseclas controlados por computador (conhecidos como creeps in Dota 2) como uma maneira de negar o ouro e a experiência da equipe inimiga. Os jogadores humanos podem reconhecer que isto ocorreu porque os anormais não aparecem quando é suposto. Jogadores humanos têm um modelo mental de todo o jogo, uma compreensão de suas regras, e, portanto, pode reconhecer que algo está errado; eles podem raciocinar sobre onde o arrasta-deve ter ido e interferir com a recepção. O computador, pelo contrário, vagueia sem rumo quando confrontado com este cenário.
no pulling
In its millions of games played against itself, OpenAI appears to have never picked up the technique of pulling, and so it has never learned to play against it. Então, quando uma equipe humana começa a puxar, o bot não reconhece a situação e não sabe realmente o que fazer. Ele não pode raciocinar sobre como o jogo deve ser, e não pode especular sobre por que o jogo está se comportando de uma forma inesperada. Tudo o que o bot pode fazer é procurar padrões que ele reconhece e escolher a ação mais provável de produzir o melhor resultado; dar-lhe um padrão que ele não pode reconhecer e seu desempenho se deteriora.
até agora, o OpenAI bot tem sido restrito; certos profissionais e corretores têm tido acesso a jogar contra ele, e também tem estado disponível para jogar contra em alguns eventos ao vivo. Mas por alguns dias, isso está mudando: Dota 2 jogadores podem se inscrever aqui para jogar contra o bot—ou com ele-por um período de três dias. Infelizmente, este período público não parece que vai resultar em um novo e melhorado bot: bater uma equipe humana de topo foi o objetivo que o OpenAI estabeleceu para seu bot, e com isso realizado, a experiência parece estar completa.