過去数年間、「人工的な一般知能がすべての人類に利益をもたらす」ことを使命とするスタートアップであるOpenAIは、宇宙で最も偉大なゲームであるDota2をプレイするための機械学習駆動型ボットを開発してきました。 完全なゲームの非常にカットダウンバージョンから始まって、ボットは、五対五チームのゲームをプレイする方法だけでなく、一貫して勝つ方法を学ぶ、自分自身
私たちは、より完全なバージョンのゲームとより熟練した人間の対戦相手を使用して、多くのショーの試合でボットの開発を見ることができました。 これは、OpenAI Fiveが昨年のすべてのesportsで最大の競争を勝ち取ったチームであるOgとのベスト-オブ-スリーマッチでピットインした週末の最終ショーマッチに期待されているもので最高潮に達しました。
OpenAIは物事を面白く保つという名の下にいくつかのハンディキャップの対象となります。 彼らは非常に似ていると思うが、彼らの行動を調整する直接的な手段を持っていない五つの独立したプレイヤーです。 OpenAIの反応時間は、ゲームが単に超人的な反射神経のショーケースではないことを確実にするために人為的に遅くなります。 そして、ボットはまだゲームのフルバージョンを使用していません:ヒーローの限られた選択のみが利用可能であり、制御可能な手下や幻想を作成するアイテ
試合はここで見ることができます。 最初の試合は約19分まで見えました。 人間は小さな金の利点を持っていましたが、ボットはより良い領土制御を持っていました。 ロボットはチーム戦で先に出てきて、3人の人間のプレイヤーを殺し、1人だけを失った。 ゲームはまだナイフエッジのように見えましたが、ボットは反対しました:彼らは勝利の95パーセントのチャンスを持っていたことを発表し、この宣言を これはさらに領土の支配を強化し、彼らにも重要な金のリードを与えました。
これにより、人間は後ろ足に置き、さらに20分間ゲームを引き出すことができたが、ボットのリードを克服することができず、OpenAIは1-0のアドバンテージを与えた。
2試合目では、状況はあまり近くなく、ボットは早いリードを奪い、15分以内に人間の基地を突破しました。 彼らは5分後に勝利を収めた。
全体的に、それはOpenAIによって支配的なパフォーマンスでした: ゲームが提供している非常に最高レベルでお互いに遊ぶことに慣れている確立された人間のチームに対して2-0の勝利。 このパフォーマンスは、長年にわたってOpenAIの最も強いものでした。
ボットの調整は不思議である:彼らは通信することはできませんが、五つのコンピュータ制御のプレイヤーはすべて同じように考えます。 人間のプレイヤーを攻撃する良い機会だと思うなら、他の四つは同じことを考えて攻撃に参加します。 これはteamfightsの大きい調整の出現を与える—人間のチームが一致させることができない精密および厳しさの調整。
初歩的な中国の部屋
しかし、OpenAIはbeatableに見えます。 それは明確な、驚くべきことであれば、弱点を持っています—それは最後のヒットを得点するのは素晴らしいことではありません、ゲーム内の金を蓄積す これは、人間に初期の金の利点を得る機会を与えます。 ボットはまた、人間側の不可視性に対抗するために苦労しました。 彼らはまた、英雄の一部、特にEarthshaker’s Fissureの特定の呪文には適応していないように見えましたが、これは一時的にマップ上に通行不能な障壁を作成する呪文です。 人間はこれを使ってボットプレイヤーを罠にかけ、その動きを制限するのに効果的であり、これはOpenAIを混乱させるように見えた。
ボットの動作は、この種の機械学習システムと完全な一般的な人工知能との間の大きなギャップのオブジェクトレッスンでもあります。 AI Fiveはゲームに勝つのに明らかに効果的ですが、実際にはDota2をプレイする方法も明らかにはわかりません。 ゲームの人間のプレイヤーは、敵チームの金と経験の両方を否定する方法として、彼らの側のコンピュータ制御の手下(Dota2ではゾッととして知られている)の 人間のプレイヤーは、彼らがすることになっているときにゾッとが表示されないので、これが発生したことを認識することができます。 人間のプレイヤーは、ゲーム全体の精神的なモデル、そのルールの理解を持っているので、何かが間違っていることを認識することができます。 これとは対照的に、コンピュータは、このシナリオに直面したときにあてもなくさまようだけです。
引きなし
何百万ものゲームで自分自身と対戦していますが、OpenAIは引きの技術を拾ったことがないようですので、それと対戦することを学んだことはあ だから、人間のチームが引っ張って起動すると、ボットは状況を認識せず、本当に何をすべきかを知らない。 それはゲームがどのようにあるべきかについて推論することはできませんし、なぜゲームが予期しない方法で動作しているのかを推測することはで ボットができることは、それが認識するパターンを探し、最良の結果をもたらす可能性が最も高いアクションを選択することです。
これまで、OpenAIボットは制限されており、特定のプロやストリーマーはそれと対戦するためのアクセス権を与えられており、一部のライブイベントでも対戦 しかし、数日間、それは変化しています:Dota2プレイヤーは、ボットと対戦するためにここにサインアップすることができます—またはそれと一緒に—三日間。 残念ながら、この公開期間は、新しい改良されたボットになるようには見えません:トップの人間チームを倒すことは、OpenAIがボットのために設定した目標で