OpenAI bot knuser Dota 2 champions, og nu kan alle spille imod det

skærmbillede af et brændende videospilmonster.
Forstør / skygge djævel, ser skyggefuld og djævelsk ud.

i løbet af de sidste mange år har OpenAI, en opstart med det formål at sikre, at “kunstig generel intelligens gavner hele menneskeheden”, udviklet en maskinlæringsdrevet bot til at spille Dota 2, det største spil i universet. Fra en meget nedskåret version af det fulde spil, bot er blevet udviklet gennem årene ved at spille millioner på millioner af kampe mod sig selv, lære ikke kun, hvordan man spiller fem-mod-fem holdspil, men hvordan man vinder, konsekvent.

vi har været i stand til at se botens udvikling over en række udstillingskampe, hvor hver enkelt bruger en mere komplet version af et spil og mere dygtige menneskelige modstandere. Dette kulminerede i, hvad der forventes at være den sidste kamp i løbet af helgen, da OpenAI Five blev pitted i en best-of-three kamp mod OG, holdet der vandt den største konkurrence i alle esports sidste år, The International.

se mere

OpenAI er underlagt et par handicap i navnet på at holde tingene interessante. Hver af sine fem AI-spillere kører en identisk version af bot-programmet, uden kommunikation mellem dem: de er fem uafhængige spillere, der tilfældigvis tænker meget ens, men har ingen direkte midler til at koordinere deres handlinger. Openais reaktionstid er kunstigt bremset for at sikre, at spillet ikke blot er et udstillingsvindue af overmenneskelige reflekser. Og bot bruger stadig ikke den fulde version af spillet: kun et begrænset udvalg af helte er tilgængeligt, og genstande, der skaber kontrollerbare minions eller illusioner, er forbudt, fordi det føles, at bot ville være i stand til at mikromanage sine minions mere effektivt end noget menneske kunne.

spillene kan ses her. Det første spil kiggede selv indtil omkring 19 minutter i. Menneskerne havde en lille guldfordel, men bots havde bedre territorial kontrol. Bots kom ud foran i en holdkamp og dræbte tre menneskelige spillere, mens de kun tabte en selv. Spillet så stadig ud som om det var på en knivkant, men bots var uenige: de meddelte, at de havde en 95 procent chance for at vinde, og ved at afgive denne erklæring brugte de øjeblikkeligt deres talfordel til at håndtere store skader på den menneskelige base. Dette forbedrede deres territoriale kontrol yderligere og gav dem også en betydelig guldledning.

dette satte menneskene på bagfoden, og mens de formåede at trække spillet ud i yderligere 20 minutter, var de ikke i stand til at overvinde bots’ føring, hvilket gav OpenAI en 1-0 fordel.

i det andet spil var tingene ikke engang tæt; bots tog en tidlig føring og overtrådte den menneskelige base inden for 15 minutter. De tog sejren fem minutter senere.

annonce

samlet set var det en dominerende forestilling af OpenAI: en 2-0 sejr mod et etableret menneskeligt hold, der er vant til at spille med hinanden på det højeste niveau, Spillet har at tilbyde. Denne præstation var langt Openais stærkeste gennem årene.

bots’ koordinering er uhyggelig: selvom de ikke kan kommunikere, tænker alle fem computerstyrede spillere på samme måde. Hvis man mener, at det er en god mulighed for at angribe en menneskelig spiller, vil de andre fire af dem tænke det samme og vil deltage i angrebet. Dette giver udseendet af stor koordinering i teamfights—koordinering med en præcision og strenghed, som menneskelige hold ikke kan matche.

et rudimentært Kinesisk rum

men OpenAI ser beatable ud. Det har klare, hvis overraskende svagheder-det er ikke godt at score sidste hits, dræbningen blæser på computerstyrede enheder, der bruges til at akkumulere guld i spillet. Dette giver mennesker en mulighed for at få en tidlig guldfordel. Bots kæmpede også for at imødegå usynlighed på den menneskelige side. De syntes også at tilpasse sig dårligt til visse trylleformularer fra nogle af heltene, især Earthshaker ‘ s fissur, en trylleformular, der midlertidigt skaber en ufremkommelig barriere på kortet. Mennesker var effektive til at bruge dette til at fange bot-spillere og begrænse deres bevægelse, og dette syntes at forvirre OpenAI.

botternes opførsel er også en objektundervisning i det store kløft mellem denne form for maskinlæringssystem og en fuld generel kunstig intelligens. Mens AI Five klart er effektiv til at vinde spil, det ved heller ikke klart, hvordan man spiller Dota 2. Menneskelige spillere i spillet bruger en teknik kaldet” trækker ” for at omdirigere strømmen af deres sides computerstyrede håndlangere (kendt som kryber ind Dota 2) som en måde at nægte fjendens hold både guld og erfaring. Menneskelige spillere kan erkende, at dette er sket, fordi kryber ikke dukker op, når de skal. Menneskelige spillere har en mental model af hele spillet, en forståelse af dets regler, og kan derfor erkende, at noget er galt; de kan ræsonnere over, hvor krybene skal være gået og forstyrre træk. Computeren vandrer derimod bare målløst rundt, når den står over for dette scenario.

ingen træk

i sine millioner af spil, der spilles mod sig selv, ser OpenAI ud til aldrig at have hentet teknikken til at trække, og det har derfor aldrig lært at spille imod det. Så når et menneskeligt team begynder at trække, genkender boten ikke situationen og ved ikke rigtig, hvad de skal gøre. Det kan ikke begrunde, hvordan spillet skal være, og det kan ikke spekulere i, hvorfor spillet opfører sig på en uventet måde. Alt, hvad bot kan gøre, er at kigge efter mønstre, den genkender, og vælge den handling, der mest sandsynligt giver det bedste resultat; give det et mønster, som det ikke kan genkende, og dets ydeevne forringes.

indtil nu har OpenAI bot været begrænset; visse fordele og streamere har fået adgang til at spille imod det, og det har også været tilgængeligt at spille imod på nogle live events. Men i et par dage ændrer det sig: Dota 2 spillere kan tilmelde sig her for at spille mod bot—eller med det—i en tre-dages periode. Desværre ser denne offentlige periode ikke ud som om den vil resultere i en ny og forbedret bot: at slå et top menneskeligt hold var det mål, som OpenAI satte for sin bot, og med det opnåede ser eksperimentet ud til at være komplet.

You might also like

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.