신문은 선생님

[재미있는 과학] 창의적인 이세돌 VS 기보 따르는 알파고

입력 : 2016.03.08 03:08

[이세돌과 '알파고'의 바둑 대결]
인간과 인공지능, 승자는 누가 될까

체스에선 인공지능이 인간 이겼지만 바둑은 경우의 수 많아 이기기 힘들어
알파고, 많이 둔 수 따르는 '정책망'
승률 계산하는 '가치망' 가졌지만 창의적 수 두지 못하는 것이 한계

내일(9일) 오후 1시 인공지능이 인간의 두뇌에 도전하는 흥미진진한 바둑 경기가 열려요. 구글의 인공지능 바둑 프로그램 '알파고(AlphaGo)'가 세계 바둑 최강자인 이세돌 9단에게 도전장을 내밀었거든요. 알파고의 실력은 어떨까요? 구글에서는 자체적으로 알파고를 프로 5단 수준이라고 평가한다고 합니다. 알파고는 지난해 10월 유럽 바둑 챔피언인 판 후이 2단과 벌인 대결에서 5전 5승으로 완승했습니다. 프랑스의 인공지능 바둑 프로그램 '크레이지스톤'과 일본의 '젠', 오픈소스 프로그램 '파치' 등과 겨뤘을 때도 알파고가 압도적인 승리를 거뒀습니다.

알파고는 한 달에 100만 판씩 훈련하며 실력을 갈고닦는다고 합니다. 최근 인터넷 바둑 사이트에서 알파고로 추정되는 아이디의 실력이 12월을 기점으로 급상승해 이번 승부에 더욱 긴장감을 주고 있지요. 반면 이창호를 비롯한 국내 유명 프로 바둑기사들은 "알파고가 이세돌에게 한 판도 이기기 어려울 것"이라고 진단하고 있습니다. 이번 대국에서 마지막에 웃게 될 승자는 인공지능 알파고일까요? 이세돌 9단일까요?

기보 분석·승률 계산… 인간처럼 바둑 둔다

1997년 IBM에서 만든 수퍼컴퓨터 '딥블루(DeepBlue)'가 체스 세계 챔피언 가리 카스파로프를 이겼어요. 하지만 지금까지 바둑에서만큼은 인공지능이 인간을 따라올 수 없다는 의견이 지배적이었어요. 그 이유는 바둑에서는 고려해야 할 경우의 수가 체스와는 비교도 되지 않게 많기 때문입니다. 체스는 가로·세로가 각각 8줄씩 64칸으로 이뤄진 판을 쓰지만, 바둑판은 돌을 놓는 지점이 361개(가로 세로 19줄씩·바둑에서는 줄과 줄이 만나는 점 위에 돌을 둔다)로 약 5.6배나 많아요. 361개의 점을 채워 나가는 경우의 수는 10의 170승 가지나 되고, 수퍼컴퓨터라고 해도 모든 경우를 다 따져서 계산하려면 수십억 년이 걸릴 수밖에 없다고 합니다. 그러니 지금까지 바둑에선 기계가 인간을 이길 수 없었던 거예요.

기사 관련 일러스트
그래픽=안병현
바둑에선 모든 경우의 수를 일일이 따져보기엔 시간이 너무 많이 걸리니, 알파고를 만든 과학자들은 이길 확률이 높은 경우만 모아 알파고에게'기계학습(Machine Learning)'을 시키기로 했어요. 기계학습이란 수많은 데이터를 기계에 입력해 컴퓨터가 스스로 평가·처리 과정을 거치면서 특정한 패턴을 예측할 수 있도록 훈련하는 거예요. 알파고에는 3000만 가지의 경우의 수가 들어 있는 바둑 기보(棋譜·바둑에서 승부를 이끈 수를 알 수 있도록 대국 내용을 기록한 것) 16만 개가 입력됐어요.

사람의 기보로 바둑을 배운 알파고는 바둑돌 놓을 자리도 인간처럼 결정해요. 우리 뇌는 수십 수백 층의 신경망을 갖고 있는데, 생각하고 판단할 때 여러 신경망을 조합해 쓴다고 해요. 알파고는 '정책망(policy network)'과 '가치망(value network)' 두 가지의 신경망을 조합해 의사 결정을 내려요. 우선 정책망을 이용해 '바둑 고수들이 어디에 많이 바둑돌을 놓는지'를 분석하고, 가치망을 통해서는 '여기에 놓았을 때 이길 확률이 얼마나 될지' 승률을 계산합니다. 가치망은 알파고가 스스로와의 대결을 통해 얻은 비장의 무기라고 하지요.

알파고, 전략의 한계는 뭘까

하지만 정책망과 가치망을 갖춘 알파고에게도 한계가 있습니다. 입력된 기보, 자신이 계산한 승률 그 이상의 좋은 전략을 떠올리지 못하거든요. 반면 알파고와 대결할 이세돌은 창의적인 수를 많이 두는 세계 정상의 바둑 기사입니다. 그래서 알파고 개발자들이 자꾸 알파고를 인터넷 바둑에 등장시키는 거예요. 새로운 수를 익히고, 다양한 경험을 쌓게 하려고요. 알파고가 한계를 뛰어넘길 바란 개발자들은 100만 번이나 알파고끼리 맞대결을 붙였습니다. 알파고 1은 미리 익힌 고수들의 전략으로 경기하고, 알파고2에는 알파고1을 이길 최선의 전략을 찾게 하면서 실력을 키웠습니다.

이런 전략을 통해 알파고는 좋은 수를 둘 수 있게 됐을 뿐 아니라, 상대방이 자신의 수 다음에 바둑돌을 놓을 위치를 50% 이상의 높은 확률로 예측할 수 있게 됐어요. 알파고는 유럽 바둑 챔피언 판 후이와의 대결에서 이겼고, 그후 알파고 개발팀은 지난 1월 27일자 '네이처'에 논문을 실었습니다. 이 논문을 본 바둑 전문가들은 알파고가 '수읽기' 능력이 탁월하다고 평가해요.

사실 알파고가 당장 이세돌 9단에게 승리하는 건 쉽지 않아 보여요. 하지만 바둑에서도 인공지능이 인간을 이길 가능성도 있어요. 그렇게 되면 기계가 인간의 두뇌보다 뛰어난 걸까요? 그렇지 않아요. 알파고도 수학자와 컴퓨터공학자, 프로그램 개발자 등 수많은 사람의 지능이 모여 이뤄진 결과물이에요. 오래전 딥블루 개발팀은 이렇게 말했습니다. "결국 인간과 기계의 대결은 수학자·전산학자·엔지니어가 공동으로 만든 연구결과가 최고의 실력을 가진 인간의 독창성과 대결을 벌이는 것입니다."


박태진·과학 칼럼니스트 |