in de afgelopen jaren, OpenAI, een startup met de missie om ervoor te zorgen dat “kunstmatige algemene intelligentie ten goede komt aan de hele mensheid,” is het ontwikkelen van een machine-learning-gedreven bot om Dota 2 te spelen, de grootste spel in het universum. Vanaf een zeer cut-down versie van het volledige spel, De bot is ontwikkeld door de jaren heen door het spelen van miljoenen op miljoenen wedstrijden tegen zichzelf, leren niet alleen hoe je de Vijf-op-vijf team spel te spelen, maar hoe om te winnen, consequent.
we hebben de ontwikkeling van de bot kunnen bekijken tijdens een aantal wedstrijden, waarbij elke wedstrijd een completere versie van een spel en meer ervaren menselijke tegenstanders gebruikt. Dit culmineerde in wat naar verwachting de laatste Showmatch in het weekend, toen OpenAI Five werd ontpit in een best-of-three match tegen OG, het team dat vorig jaar de grootste competitie in alle esports won, de International.
OpenAI heeft een aantal handicaps om de zaken interessant te houden. Elk van de vijf AI-spelers draait een identieke versie van de bot-software, zonder communicatie tussen hen: ze zijn vijf onafhankelijke spelers die toevallig denken zeer gelijk, maar hebben geen directe middelen voor het coördineren van hun acties. OpenAI ‘ s reactietijd wordt kunstmatig vertraagd om ervoor te zorgen dat het spel niet alleen een showcase van bovenmenselijke reflexen is. En de bot is nog steeds niet met behulp van de volledige versie van het spel: slechts een beperkte selectie van helden is beschikbaar, en items die controleerbare minions of illusies te creëren zijn verboden, omdat het gevoel dat de bot zou kunnen micromanage zijn minions effectiever dan een mens zou kunnen.
de spellen kunnen hier bekeken worden. De eerste wedstrijd leek zelfs tot ongeveer 19 minuten in. De mensen hadden een klein goudvoordeel, maar de bots hadden een betere territoriale controle. De bots kwamen vooruit in een teamgevecht, waarbij drie menselijke spelers werden gedood terwijl ze er zelf maar één verloren. Het spel zag er nog steeds uit alsof het op een mes-rand, maar de bots oneens: ze aangekondigd dat ze hadden een 95-procent kans om te winnen en, bij het maken van deze verklaring, direct gebruikt hun nummers voordeel om zware schade aan de menselijke basis. Dit versterkte hun territoriale controle verder en gaf hen ook een aanzienlijke gouden voorsprong.
dit zette de mensen op de achterste voet, en terwijl ze erin slaagden om het spel nog 20 minuten uit te trekken, waren ze niet in staat om de voorsprong van de bots te overwinnen, waardoor OpenAI een 1-0 voorsprong kreeg.
In het tweede spel, waren de dingen niet eens in de buurt; De bots namen een vroege voorsprong en doorbraken de menselijke basis binnen 15 minuten. Ze namen de overwinning vijf minuten later.
over het algemeen was het een dominant optreden van OpenAI: een 2-0 overwinning tegen een gevestigd menselijk team dat gewend is om met elkaar te spelen op het hoogste niveau dat het spel te bieden heeft. Deze prestatie was verreweg de sterkste van OpenAI door de jaren heen.
de coördinatie van de bots is griezelig: hoewel ze niet kunnen communiceren, denken alle vijf computergestuurde spelers op dezelfde manier. Als men denkt dat het een goede kans is om een menselijke speler aan te vallen, zullen de andere vier van hen hetzelfde denken en zullen deelnemen aan de aanval. Dit geeft het uiterlijk van grote coördinatie in teamgevechten-coördinatie met een precisie en strengheid die menselijke teams niet kunnen evenaren.
een rudimentaire Chinese kamer
maar OpenAI ziet er niet mis te slaan uit. Het heeft duidelijke, als verrassende, zwakheden-het is niet geweldig in het scoren van de laatste hits, het doden klappen op computergestuurde eenheden die worden gebruikt om te accumuleren in-game goud. Dit geeft mensen een kans om een vroeg goud voordeel te krijgen. De bots hadden ook moeite om onzichtbaarheid aan de menselijke kant tegen te gaan. Ze leken zich ook slecht aan te passen aan bepaalde spreuken van sommige helden, in het bijzonder Earthshaker ‘ s Fissure, een spreuk die tijdelijk een onbegaanbare barrière op de kaart creëert. Mensen waren effectief in het gebruik van dit om bot spelers te vangen en hun beweging te beperken, en dit leek OpenAI te verwarren.
het gedrag van de bots is ook een object les in de grote kloof tussen dit soort machine-learning systeem en een volledige Algemene kunstmatige intelligentie. Terwijl AI vijf is duidelijk effectief in het winnen van games, het is ook duidelijk niet echt weet hoe Dota 2 te spelen. Menselijke spelers van het spel gebruiken een techniek genaamd “pulling” om de stroom van hun kant computergestuurde minions (bekend als creeps in Dota 2) om te leiden als een manier van het ontkennen van de vijand team zowel goud en ervaring. Menselijke spelers kunnen herkennen dat dit is gebeurd omdat engerds niet opdagen wanneer ze moeten. Menselijke spelers hebben een mentaal model van het hele spel, een begrip van de regels, en dus kunnen herkennen dat er iets mis is; ze kunnen redeneren over waar de griezels moeten zijn gegaan en interfereren met de pull. De computer daarentegen dwaalt doelloos rond wanneer hij met dit scenario wordt geconfronteerd.
no pulling
in de miljoenen wedstrijden die tegen zichzelf worden gespeeld, lijkt OpenAI nooit de techniek van pulling te hebben opgepikt en heeft het dus nooit geleerd om tegen zichzelf te spelen. Dus als een menselijk team begint te trekken, herkent de bot de situatie niet en weet hij niet echt wat hij moet doen. Het kan niet redeneren over hoe het spel zou moeten zijn, en het kan niet speculeren over waarom het spel zich gedraagt op een onverwachte manier. Het enige wat de bot kan doen is zoeken naar patronen die het herkent en kies de actie die het meest waarschijnlijk het beste resultaat oplevert; geef het een patroon dat het niet kan herkennen en zijn prestaties verslechteren.
tot nu toe was de OpenAI bot beperkt; bepaalde profs en streamers hebben toegang gekregen om tegen te spelen, en het is ook beschikbaar geweest om tegen te spelen op sommige live evenementen. Maar voor een paar dagen, dat is het veranderen: Dota 2 spelers kunnen zich hier aanmelden om te spelen tegen de bot—of met het—voor een periode van drie dagen. Helaas ziet deze publieke periode er niet uit alsof het gaat resulteren in een nieuwe en verbeterde bot: het verslaan van een top menselijk team was het doel dat OpenAI stelde voor zijn bot, en met dat volbracht, het experiment lijkt te zijn voltooid.