az elmúlt néhány évben, OpenAI, egy startup, amelynek feladata annak biztosítása, hogy “a mesterséges általános intelligencia az egész emberiség számára előnyös legyen,” gépi tanulás által vezérelt botot fejlesztett ki a Dota játékához 2, az univerzum legnagyobb játéka. A teljes játék nagyon kivágott verziójától kezdve, a botot az évek során úgy fejlesztették ki, hogy millió-millió mérkőzést játszott önmagával szemben, nemcsak az öt-öt csapat játékának megtanulása, hanem a győzelem módja is, következetesen.
számos showmeccsen láthattuk a bot fejlődését, mindegyik egy játék teljesebb verzióját és képzettebb emberi ellenfeleket használt. Ez a hétvégén várhatóan az utolsó show-mérkőzéssel tetőzött, amikor az OpenAI Five-t az OG elleni három legjobb meccsre állították, az a csapat, amely tavaly megnyerte az összes eSport legnagyobb versenyét, a nemzetközi.
az OpenAI-nak néhány hátránya van a dolgok érdekességének megőrzése érdekében. Mind az öt AI játékos fut egy azonos változata a bot szoftver, nincs kommunikáció közöttük: ők öt független játékosok, akik történetesen úgy gondolja, nagyon hasonló, de nincs közvetlen eszköze koordináló tevékenységüket. Az OpenAI reakcióidejét mesterségesen lelassítják annak biztosítása érdekében, hogy a játék ne egyszerűen emberfeletti reflexek bemutatója legyen. A bot pedig még mindig nem használja a játék teljes verzióját: csak korlátozott számú hős áll rendelkezésre, és az ellenőrizhető csatlósokat vagy illúziókat létrehozó elemeket tiltják, mert úgy érzik, hogy a bot képes lenne hatékonyabban kezelni csatlósait, mint bármely ember.
a játékok megtekinthetők itt. Az első játék még kb 19 perc alatt. Az embereknek volt egy kis arany előnye, de a botoknak jobb területi ellenőrzésük volt. A botok egy csapatharcban kerültek elő, megölve három emberi játékost,miközben csak egyet veszítettek el. A játék még mindig úgy nézett ki, mint egy kés szélén, de a botok nem értettek egyet: bejelentették, hogy 95%-os esélyük van a győzelemre, és e nyilatkozat megtétele után azonnal kihasználták a számuk előnyét, hogy súlyos károkat okozzanak az emberi bázisnak. Ez tovább növelte területi ellenőrzésüket, és jelentős arany ólmot is adott nekik.
ezzel az emberek a hátsó lábukra kerültek, és bár még 20 percig sikerült kihúzniuk a játékot, nem tudták legyőzni a botok előnyét, így az OpenAI 1-0-s előnyt szerzett.
a második játszmában a dolgok még közel sem voltak; a botok korán vezetést szereztek, és 15 percen belül áttörték az emberi bázist. Öt perccel később megszerezték a győzelmet.
összességében az OpenAI domináns teljesítménye volt: 2-0-s győzelem egy megalapozott emberi csapat ellen, amely megszokta, hogy a játék legmagasabb szintjén játszanak egymással. Ez a teljesítmény messze volt az OpenAI legerősebb az évek során.
a botok koordinációja rejtélyes: bár nem tudnak kommunikálni, mind az öt számítógép által vezérelt játékos ugyanúgy gondolkodik. Ha valaki úgy gondolja, hogy ez egy jó lehetőség egy emberi játékos megtámadására, akkor a másik négy is ugyanezt gondolja, és csatlakozik a támadáshoz. Ez nagyszerű koordináció látszatát kelti a csapatharcokban—olyan precizitással és szigorúsággal történő koordináció, amelyet az emberi csapatok nem tudnak összehangolni.
kezdetleges Kínai szoba
de az OpenAI verhetőnek tűnik. Határozott, ha meglepő, gyengeségei vannak-nem nagyszerű az utolsó találatok pontozásában, a gyilkos fúj a számítógépes vezérlésű egységeken, amelyeket a játékon belüli arany felhalmozására használnak. Ez lehetőséget ad az embereknek arra, hogy korai aranyelőnyt szerezzenek. A botok az emberi oldal láthatatlanságának ellensúlyozására is küzdöttek. Úgy tűnt, hogy rosszul alkalmazkodnak néhány hős bizonyos varázslataihoz, különösen a Earthshaker ‘ s Fissure-hez, egy varázslathoz, amely ideiglenesen átjárhatatlan akadályt hoz létre a térképen. Az emberek hatékonyan használták ezt a bot játékosok csapdájára és mozgásuk korlátozására, és ez úgy tűnt, hogy megzavarja az OpenAI-t.
a botok viselkedése szintén tárgyi lecke az ilyen típusú gépi tanulási rendszer és a teljes általános mesterséges intelligencia közötti nagy szakadékban. Míg az AI Five egyértelműen hatékony a játékok megnyerésében, az is egyértelműen nem tudja, hogyan kell játszani a Dotát 2. A játék emberi játékosai a “húzás” nevű technikát használják, hogy átirányítsák oldaluk számítógépes vezérlésű csatlósainak áramlását (más néven kúszik a Dota 2-ben), hogy megtagadják az ellenséges csapattól mind az aranyat, mind a tapasztalatot. Az emberi játékosok felismerhetik, hogy ez azért történt, mert a kúszások nem jelennek meg, amikor kellene. Az emberi játékosok mentális modellel rendelkeznek az egész játékról, megértik annak szabályait, és ezért felismerik, hogy valami nincs rendben; meg tudják indokolni, hogy a kúszók hova mentek, és zavarják a húzást. A számítógép ezzel szemben csak céltalanul vándorol, amikor szembesül ezzel a forgatókönyvvel.
nincs húzás
a maga ellen játszott milliónyi játékában úgy tűnik, hogy az OpenAI soha nem vette fel a húzás technikáját, ezért soha nem tanult meg ellene játszani. Tehát amikor egy emberi csapat elkezd húzni, a bot nem ismeri fel a helyzetet, és nem igazán tudja, mit kell tennie. Nem tudja megmagyarázni, hogy a játéknak hogyan kell lennie, és nem tud spekulálni arról, hogy miért viselkedik a játék váratlanul. A bot csak annyit tehet, hogy olyan mintákat keres, amelyeket felismer, és kiválasztja azt a műveletet, amely valószínűleg a legjobb eredményt hozza; adjon neki egy olyan mintát, amelyet nem ismer fel, és teljesítménye romlik.
mostanáig az OpenAI botot korlátozták; bizonyos profik és streamerek hozzáférést kaptak az ellene való játékhoz, és néhány élő eseményen is elérhető volt. De néhány napig, ez változik: Dota 2 a játékosok itt regisztrálhatnak, hogy három napig játszhassanak a bot ellen—vagy vele együtt. Sajnos ez a nyilvános időszak nem úgy néz ki, mintha egy új és továbbfejlesztett botot eredményezne: egy felső emberi csapat legyőzése volt az a cél, amelyet az OpenAI kitűzött a botjának, és ezzel a kísérlet teljesnek tűnik.