딥마인드 게임용 AI “알파스타”, 스타크래프트2 프로게이머에 승리

과학

딥마인드 게임용 AI “알파스타”, 스타크래프트2 프로게이머에 승리

우예진 기자

w9502@betanews.net

기사

입력 : 2019-01-26 18:17:27

▲ 스타크래프트 2 © 블리자드 공식 사이트

구글 산하 영국 AI 개발 기업 딥마인드는 1월 24일 블리자드 엔터테인먼트의 인기 RTS 게임 스타크래프트2의 플레이어 인공지능인 “알파스타(AlphaStar)”를 선보였다. 알파스타는 팀리퀴드 소속 그레고이 코민츠(Mana)와 다리오 뷘시(TLO) 등 2명의 프로게이머와 5게임 대전을 벌여 모두 완승했다.

스타크래프트2는 전작 스타크래프트1과 마찬가지로 태란, 저그, 프로토스 등 3가지 종족 중 하나를 선택해 플레이하는 게임이다. 플레이어는 사령관이 되어 종족을 선택한 후 군대를 생산 및 편성하여 다른 플레이어와 경쟁하게 된다. 각 플레이어는 서로의 기지가 어디에 있는지 모른 체 상대의 실시간 전략에 따라서 절적하게 대응해야 하므로 매우 복잡한 계산이 필수다.

딥마인드는 지난해 12월 체스, 장기, 바둑 게임의 세계 최강 인공지능을 만들게 되었다고 발표했다. 스타크래프트2의 경우 타 게임과 달리 실시간 판단으로 상황이 바뀌기 때문에 필요한 정보를 정찰 등을 통해 적극적으로 수집해야 승리할 수 있다.

또, 현실 세계처럼 스타크래프트2의 세계에서는 인과 관계가 항상 변화하므로, 초기 단계에 세운 전략은 장기적으로는 무용지물이 될 가능성도 높다.

이러한 다양한 과제를 극복하기 위해서, 딥마인드는 우선 블리자드가 공개한 익명의 게이머의 대전 데이터로 알파스타에게 기초 학습을 시켰다. 그 후 멀티 에이전트를 통한 강화 학습을 실시했다. 에이전트끼리 경쟁하는 리그를 만들어 계속 대전을 이어간 것이다.

이번 대전을 벌였던 TLO나 MaNa와 같은 프로게이머의 경우, 경기에서 분당 280회의 액션을 수행할 수 있다. MaNa는 알파스타와의 대전 후 “알파스타가 거의 모든 게임에서 내가 적용한 고도의 전술을 저지하는 것에 감명을 받았다. 내 플레이가 얼마나 사람의 실수를 유발하는 전술에 의존해 왔는지 깨달을 수 있었다.”고 말했다.

딥마인드는 알파스타가 획득한 매우 긴 일련의 데이터에 대해서 복잡한 예측을 실시한다. 따라서 이런 테크닉은 일기예보, 기후 모델링, 언어이해 등 현실에서의 문제 해결에도 활용될 가능성이 있다고 주장했다.

[챗GPT 인공지능과 로봇] 오픈 채팅방에 들어 오세요.

- 목록
- 위로