v Průběhu posledních několika let, OpenAI, startup, s posláním zajistit, že „umělé obecné inteligence těží celé lidstvo,“ vyvíjí stroj-learning-řízený robot, aby hrát Dota 2, nejlepší hra ve vesmíru. Počínaje velmi omezenou verzí plné hry, bot byl vyvinut v průběhu let hraním milionů a milionů zápasů proti sobě, naučit se nejen hrát týmovou hru Pět na pět, ale jak vyhrát, důsledně.
byli jsme schopni sledovat vývoj robota v několika výstavních zápasech, přičemž každý z nich používal úplnější verzi hry a zkušenější lidské soupeře. To vyvrcholilo očekávaným finálovým zápasem o víkendu, když byl OpenAI Five postaven v zápase best-of-three proti OG, tým, který loni vyhrál největší soutěž ve všech esportech, mezinárodní.
OpenAI podléhá několika znevýhodněním ve jménu udržování zajímavých věcí. Každý z jeho pěti AI hráčů je spuštěna shodná verze bot software, bez komunikace mezi nimi jsou pět nezávislých hráčů, kteří si náhodou myslím, že velmi podobně, ale nemají žádné přímé prostředky pro koordinaci jejich činnosti. Reakční doba OpenAI je uměle zpomalena, aby se zajistilo, že hra není jen ukázkou nadlidských reflexů. A bot ještě není pomocí plné verze hry: pouze omezený výběr hrdinů je k dispozici, a položky, které vytvářejí kontrolovatelné přisluhovači, nebo iluze jsou zakázány, protože to je pocit, že bot by měl být schopen řídit jeho přisluhovači efektivněji, než jakýkoli člověk mohl.
hry lze sledovat zde. První zápas vypadal vyrovnaně asi do 19 minut. Lidé měli malou výhodu zlata, ale roboti měli lepší územní kontrolu. Boti vyšli dopředu v týmubojovat, zabíjet tři lidské hráče, zatímco sami ztratili pouze jednoho. Hra stále vypadala, jako by to bylo na ostří nože, ale roboty nesouhlasil: oni oznámili, že oni měli 95% šanci na výhru a po provedení tohoto prohlášení, okamžitě použil svou početní převahu zabývat těžké poškození lidské základny. To dále posílilo jejich územní kontrolu a dalo jim významný zlatý náskok, také.
to postavilo lidi na zadní nohu, a zatímco se jim podařilo vytáhnout hru na dalších 20 minut, nebyli schopni překonat náskok robotů, což OpenAI poskytlo výhodu 1-0.
ve druhé hře to nebylo ani blízko; roboti se brzy ujali vedení a během 15 minut prolomili lidskou základnu. O pět minut později zvítězili.
celkově to byl dominantní výkon OpenAI: vítězství 2-0 proti zavedenému lidskému týmu zvyklému hrát spolu na nejvyšší úrovni, kterou hra nabízí. Tento výkon byl zdaleka nejsilnější OpenAI v průběhu let.
koordinace robotů je záhadná: ačkoli nemohou komunikovat, všech pět počítačem řízených hráčů myslí stejným způsobem. Pokud si někdo myslí, že je to dobrá příležitost zaútočit na lidského hráče, ostatní čtyři z nich si budou myslet totéž a připojí se k útoku. To dává vzhled velké koordinace v týmových zápasech-koordinace s přesností a přísností, které lidské týmy nemohou odpovídat.
Základní čínská místnost
ale OpenAI vypadá beatable. Má určité, i když překvapivé slabiny—není to skvělé v bodování posledních zásahů, zabíjení fouká na počítačem řízené jednotky, které se používají k akumulaci herního zlata. To dává lidem příležitost získat časnou výhodu zlata. Roboti se také snažili čelit neviditelnosti na lidské straně. Zdálo se také, že se špatně přizpůsobili určitým kouzlům některých hrdinů, zejména Earthshaker ‚ s Fissure, kouzlo, které dočasně vytváří neprůchodnou bariéru na mapě. Lidé byli efektivní při použití této pasti bot hráče a omezit jejich pohyb, a to se zdálo zmást OpenAI.
chování robotů je také objektovou lekcí ve velké propasti mezi tímto druhem strojového učení a plnou obecnou umělou inteligencí. Zatímco AI Five je jasně efektivní při vyhrávání her, zjevně také neví, jak hrát Dota 2. Lidští hráči hry používají techniku zvanou „tahání“ k přesměrování toku počítačem řízených přisluhovačů jejich strany (známých jako creeps v Dota 2) jako způsob, jak popřít nepřátelskému týmu zlato i zkušenosti. Lidští hráči mohou rozpoznat,že k tomu došlo, protože se husí kůže nezobrazují, když mají. Lidští hráči mají mentální model celé hry, pochopení jejích pravidel,a proto mohou rozpoznat, že něco není v pořádku; mohou uvažovat o tom, kam museli husí kůže jít, a zasahovat do tahu. Počítač naproti tomu jen bezcílně putuje, když čelí tomuto scénáři.
Žádné tahání
V jeho miliony hry hrál proti sobě, OpenAI zdá, že nikdy zvedl techniku tahání, a tak se nikdy nenaučil hrát proti němu. Takže když lidský tým začne tahat, bot nepozná situaci a opravdu neví, co má dělat. Nemůže uvažovat o tom, jak by Hra měla být, a nemůže spekulovat o tom, proč se hra chová nečekaným způsobem. Všechny bota může udělat, je podívat se na vzory, rozpozná a vybrat akci nejvíce pravděpodobné, že získá nejlepší výsledek; to vzor, který nemůže rozpoznat, a jeho výkon se zhoršuje.
až dosud byl OpenAI bot omezen; některým profesionálům a streamerům byl umožněn přístup ke hře proti němu a byl také k dispozici pro hraní na některých živých událostech. Ale na pár dní, to se mění: Dota 2 hráči se zde mohou zaregistrovat a hrát proti botovi—nebo s ním-po dobu tří dnů. Bohužel, tato veřejná období nevypadá jako to bude mít za následek nové a vylepšené bot: bití nejvyšší lidské tým byl cíl, který OpenAI stanovené pro jeho bot, a s tím provést, experiment se zdá být kompletní.