지난 몇 년 동안”인공 일반 지능이 모든 인류에게 이익이된다”는 사명을 가진 스타트 업인 오픈 타이는 우주에서 가장 위대한 게임 인 도타 2 를 플레이 할 수있는 기계 학습 중심의 봇을 개발해 왔습니다. 전체 게임의 매우 컷 다운 버전에서 시작,봇은 지속적으로,5 대 5 팀 게임을하지만 승리하는 방법뿐만 아니라 방법을 학습,자체에 대한 경기의 수백만에 수백만 재생을 통해 수년에 걸쳐 개발되었다.
우리는 여러 쇼 경기를 통해 봇의 개발을 볼 수 있었다,각 하나는보다 완벽한 버전의 게임과 더 숙련 된 인간의 상대를 사용하여. 이 주말 마지막 쇼 경기가 될 것으로 예상 무엇에 절정,오픈 아이 파이브는 자책골과의 최고-의-세 경기에서 움푹 들어가게되었을 때,지난해 스포츠 모두에서 가장 큰 대회에서 우승 팀,국제.
오픈아이는 흥미로운 것을 유지한다는 이름으로 몇 가지 장애가 있습니다. 그 다섯 인공 지능 플레이어의 각각은 그들 사이에 통신,봇 소프트웨어의 동일한 버전을 실행:그들은 매우 비슷하게 생각하지만 자신의 행동을 조정하는 직접적인 수단이없는 일이 다섯 독립적 인 선수입니다. 오오타이의 반응 시간은 인위적으로 느려져 게임이 단순히 초인적인 반사신경을 보여주는 것이 아님을 보장합니다. 그리고 봇은 여전히 게임의 전체 버전을 사용하지 않는:영웅의 제한된 선택을 사용할 수 있습니다,이 봇은보다 효과적으로 인간의 수보다 그 부하를 세세하게 할 수있을 것이라고 생각하기 때문에 제어 하수인 또는 환상을 만들 항목은 금지되어 있습니다.
게임은 여기에서 볼 수 있습니다. 첫 경기는 약 19 분 전까지 보였다. 인간은 작은 금 이점을 가지고 있었지만 봇은 더 나은 영토 통제력을 가졌습니다. 봇은 팀전에서 앞서 나왔고,3 명의 인간 선수를 죽이고 한 명만 잃었습니다. 이 칼날에있는 것처럼 게임은 여전히 보였다,하지만 봇은 동의:그들은 승리의 95%의 기회가 있다고 발표하고,이 선언을 할 때,즉시 인간의 기지에 큰 피해를 자신의 번호 이점을 사용. 이것은 그들의 영토 통제를 더욱 강화 시켰고 그들에게 상당한 금 납을주었습니다.
이로 인해 인간은 뒷발에 올랐고,20 분 동안 경기를 이끌어 냈지만 봇의 선두를 극복 할 수 없었고,오픈 타이는 1-0 이점을 얻었습니다.
두 번째 게임에서,일이 가까이도되지 않았다;봇은 초기 리드를했다 15 분 이내에 인간의 기반을 위반. 그들은 5 분 후에 승리를 거두었습니다.
: 게임이 제공하는 매우 높은 수준에서 서로 놀기에 익숙한 확립 된 인간 팀에 대한 2-0 승리. 이 공연은 수년 동안 오픈 아이의 가장 강력한 공연이었습니다.
봇의 조정은 기괴하다:그들은 의사 소통을 할 수는 없지만,다섯 컴퓨터 제어 플레이어는 모두 같은 방식으로 생각한다. 하나는 인간의 플레이어를 공격 할 수있는 좋은 기회라고 생각하면,그 중 다른 네 같은 생각하고 공격에 참여합니다. 이것은 인간 팀이 일치 할 수없는 정밀하고 엄격함과 조정-팀 싸움에서 큰 조정의 모양을 제공합니다.
초보적인 중국 방
하지만 오픈아이는 볼만해 보인다. 그것은 명확한,놀라운 경우,약점을 가지고-그것은 마지막 안타를 득점에 큰 아니다,게임 내 금을 축적하는 데 사용되는 컴퓨터 제어 장치에 살인 불면. 이것은 인간에게 초기 금 이점을 얻을 수있는 기회를 제공합니다. 봇은 또한 인간 측에서 보이지 않는 것에 대항하기 위해 노력했습니다. 그들은 또한 일부 영웅의 특정 주문,특히 대지 셰이커의 균열에 적응하지 못하는 것처럼 보였습니다.이 주문은 일시적으로 지도에 통과 할 수없는 장벽을 만듭니다. 인간은 봇 플레이어를 함정에 빠뜨리고 움직임을 제한하기 위해 이것을 사용하는 데 효과적이었습니다.
봇의 동작은 기계 학습 시스템과 전체 일반 인공 지능의이 종류 사이의 큰 격차 객체 교훈이다. 아이 파이브는 게임에서 승리하는 데 분명히 효과적이지만 실제로 도타 2 를 플레이하는 방법을 알지 못합니다. 게임의 인간 플레이어는”당기기”라는 기술을 사용하여 적 팀에게 금과 경험을 부정하는 방법으로 컴퓨터 제어 미니언(도타 2 의 크립)의 흐름을 리디렉션합니다. 인간 플레이어는 섬뜩한 그들이해야 할 때 표시되지 않기 때문에 이런 일이 발생했음을 인식 할 수 있습니다. 인간 플레이어는 전체 게임의 정신적 모델을 가지고,그 규칙의 이해,따라서 뭔가 나쁘게 것을 인식 할 수 있습니다;그들은 섬뜩한 사라해야하는 위치에 대한 추론과 풀을 방해 할 수 있습니다. 이 시나리오에 직면했을 때 컴퓨터는,대조적으로,단지 정처없이 주위에 방황.
당김 없음
수백만개의 게임 속에서,오픈아이는 당김 기술을 결코 습득한 적이 없는 것처럼 보이며,따라서 당김 기술을 배운 적이 없다. 그래서 인간 팀이 당기기 시작하면 봇은 상황을 인식하지 못하고 무엇을 해야할지 모릅니다. 그것은 게임이 어떻게되어야하는지에 대해 추론 할 수 없으며,게임이 예기치 않은 방식으로 행동하는 이유를 추측 할 수 없습니다. 봇이 할 수 있는 것은 인식할 수 있는 패턴을 찾고 최상의 결과를 얻을 가능성이 가장 높은 동작을 선택하는 것입니다.일부 프로와 깃발은 이에 대해 플레이할 수 있는 권한을 부여받았으며,일부 라이브 이벤트에서도 플레이할 수 있게 되었습니다. 그러나 몇 일 동안,그 변화:도타 2 플레이어는 봇에 대해 재생 여기에 가입 할 수 있습니다—또는 그것으로-사흘 동안. 불행히도,이 공개 기간은 새롭고 개선 된 봇을 낳을 것 같지 않습니다:최고의 인간 팀을 때리는 것은 봇에 대해 설정 한 목표 였고,그 성취로 실험이 완료된 것 같습니다.