본문 바로가기

4차산업혁명/빅데이터 인공지능

3일만에 알파고 격파 [알파고 제로]7가지 이야기와 그림들

3일 독학으로 알파고 누른 혁신 AI [알파고 제로] 이야기 7가지
-그림으로 알아보는 신비-

지난해 이세돌 9단을 꺾었던 바둑 인공지능 ‘알파고(알파고 리·AlphaGo Lee)’를 100대 0으로 제압한 인공지능 ‘알파고 제로(AlphaGo Zero)’가 화제입니다.

구글 자회사 딥마인드는 과학잡지 ‘네이처’를 통해 
‘인간 지식 없이 바둑 정복하기'
(Mastering the game of Go without human knowledge)라는 논문을 발표했습니다.

그림으로 '알파고 제로'의 신비를 알아봅니다.

---------------------------------------

[그림=이투데이]

1) 알파고 제로는 바둑 기보(인간의 데이터 입력) 공부 없이 ‘독학’(강화 학습 방식)으로 바둑 최강자가 됐다. 

알파고 리는 16만 건에 이르는 인간 바둑기사들의 기보 데이터를 학습하는 ‘딥러닝’(Deep Learning)과 이를 기반으로 스스로 바둑을 두며 실력을 쌓는 ‘강화학습’을 통해 바둑을 배웠다. 

이세돌을 이기기까지 12개월이란 긴 학습 시간을 보냈다. 

알파고 제로는 바둑 기본규칙만 제공 받고 인간의 도움 없이 큰 일을 냈다.
(그래서 이름에 제로가 들어감)

바둑판을 놓고 ‘셀프 바둑’을 두면서 바둑의 이치를 터득했다. 스스로 승률을 높이는 수가 어떤 것인지 깨닫고 관련 데이터를 축적하면서 실력을 키웠다. 

2) 단 3일 공부로 바둑 세계 최고수가 되는 불가사의한 능력을 보였다.
알파고 제로는 딥러닝을 완전히 생략하고 강화학습만을 통해 70시간, 단 3일 만에 세계 최고 수준의 바둑 실력을 갖췄다. 
그 시간 동안 혼자 490만 판의 바둑을 뒀다. 

알파고 제로는 한 수를 둘 때 10만 번씩 시뮬레이션 하던 기존 알파고 리의 방식을 버렸다.

독학하는 과정에서 인간이 터득한 바둑의 정석을 스스로 깨달았을뿐만 아니라 독특한 정석을 개발하기도 했다.
이를 토대로 인간처럼 신중하게 한 가지씩 수를 두었다.

[그림=조선일보]

[그림=중앙일보]

[그림=매일경제]

[그림=동아일보]


프로그램 책임자인 데이비드 실버는 “인간의 데이터와 경험을 이용하지 않음으로써 인간 지식의 한계까지 넘어서는 데 성공했다”고 의미를 부여했다.

[사진=알파고 제로의 인공 신경망]

3) 인간 의존 안하고 인간 능력 훨씬 초월하는, 혁신적 AI의 탄생

   AI 창의성 확인…인간 한계 분야에 적용 가능


알파고 제로는 인간에 전혀 의존하지 않고, 인간의 발상에 전혀 얽매이지 않는 혁신적인 AI의 탄생을 말한다.

기존 인공지능은 인간이 주는 빅데이터를 가공했다.
그러나 데이터를 구하는 데 비용이 많이 들거나, 데이터를 믿을 수 없거나, 그런 데이터가 아예 없는 경우가 현실에는 많다.

따라서 빅데이터 없이도 
인공지능이 스스로 수많은 시행착오를 통해 요령을 터득하게하는 '강화 학습'이 아주 유용할 것이라는게 구글 팀의 탁월한 착안이었다.

특히 우주나 해양처럼 믿을만한 인간 전문가가 아예 존재하지 않는 전혀 새로운 분야에서 큰 효용을 발휘할 것으로 기대된다.

4) 인간의 바둑과 더 닮았

네이처에 따르면 알파고 제로가 두는 바둑은 인간의 바둑과 더 닮았다. 감동근 아주대 전자공학과 교수도"무(無)에서 시작해 궁극의 경지에 이른 알파고 제로에게 새로운 수도 있긴 했지만 전반적으로 '사람다운 바둑'을 두는 것으로 확인됐다"고 말했다.

알파고 제로가 상대의 수를 예측하는 데 걸리는 시간은 '0.4초'에 불과했다. 논문에 따르면 기존 알파고보다 직관적이다.


5) 기존 알파고보다 뇌 구조 단순하고 비용 저렴

알파고 리는 구글이 개발한 AI용 칩 TPU(텐서프로세싱유닛)를 48개나 동원하는 등 대규모 전산 설비로 무장했지만, 알파고 제로는 고작 한 대의 산업용 컴퓨터에 TPU 4개만을 사용했다.

인공지능 구동예산을 획기적으로 줄인 것이다.

또 16만개의 기보와 3000만번의 대국을 익힌 알파고 리와 달리, 단 500만 판의 가상바둑을 훈련했다. 

6) 한계도 있다.

인간을 능가하는 인공지능의 등장을 당장 두려워할 필요는 없다.

바둑처럼 명확한 규칙이 있는 경기에 한해 이런 능력을 발휘할 수 있어서, 다방면에 활용될수 있는 '범용 인공지능' 수준은 아니다.

감동근 교수는 "연구를 해석하기에 따라 알파고 제로가 100% 자율학습으로만 실력을 다진 게 아니라 지도학습을 일부 받았다고 반론할 여지도 있다"며

"또 학습을 시작한 지 36시간 만에 알파고 리와 인간을 능가했다지만, 초기 조건들을 설정하는 사전 작업에 상당한 시간이 걸렸을 것으로 추정된다"고 말했다.

차두원 한국과학기술기획평가원 연구위원은 "알파고 제로의 작동 방식은 왜 그 수를 뒀는지 명확하게 사람이 설명할 수 없기 때문에 예상치 못한 부작용이 생길 수도 있다"면서 "철저히 승률만 따지는 방식을 인간의 생활에 적용할 수 있는지는 고민해봐야 할 문제"라고 말한다.

7) 인류에 유익한 활용 가능성

허사비스 딥마인드 대표는 "인공지능이 사람의 독창성을 배가할 수 있다고 확신한다"고 말한다.
그는 "알파고 제로에 쓰인 인공지능 기술은 단백질 구조를 밝히거나 에너지 사용량을 획기적으로 절감하는 신소재 개발같이 인류가 당면한 모든 문제를 해결하는 데 획기적인 전기를 마련할 것"이라고 주장한다.

실제로 지난해 구글의 데이터센터에 알파고를 활용한 결과, 전력 소모량을 40%나 줄일 수 있었다.

딥마인드는 영국 국민보건서비스(NHS)와 제휴해 난치병 조기 발견에 AI를 활용하고 있다.

또 영국의 송전망을 운영하는 내셔널그리드와 함께 AI를 통한 전력수급 조정 프로젝트도 진행하고 있다.

하사비스 대표는 “아무것도 없는 상태에서 스스로 배울 수 있는 알고리즘을 구축함으로써 실세계의 다양한 문제 해결에 도움이 될 수 있다”며 “알츠하이머 치료 등 의료 분야에 적용될 수 있다”고 설명했다.

또 인체 내에 단백질 구조가 만들어지는 과정이나 신소재 개발에 필요한 물리법칙을 발견할 수 있다”고 덧붙였다.

또 분자 단위에서 조합을 다양하게 구축해 슈퍼 배터리를 만들거나 독창적인 미래 전자기기를 고안해 낼 수도 있다.

우주와 해양 등 측정 데이터가 부족한 분야에도 도움이 될 수 있다.

이식 한국과학기술정보연구원 박사는 "바둑판이라는 한정된 공간처럼 외부 개입이 없는 특정한 조건 안에서는 인공지능이 빅데이터 없이도 무엇이든 최적의 해법을 찾아낼 수 있다는 뜻"이라고 말했다.

예를 들어 서울의 인구 분포와 업무 공간을 알파고 제로에 입력하면 실제 교통 상황 정보 없이도 기존과 전혀 다르면서 완벽하게 효율적인 지하철과 버스 노선도를 그려낼 수도 있다.

자율 주행차에 알파고 제로를 활용하면 지금까지 발생하지 않은 사고 형태까지 예측해 대비할 수 있다는 것이다.



스마트 팩토리/ 스마트 시티 심화학습 [수요일 4회 조찬 A스쿨]에 모십니다

 
(D-10일, 개강 11월 8일 오전 7시~9시)

프로 7분을 강사로 모셨습니다. (김은 ICT융합네트워크 상근 부회장 등)

11월 8, 15, 29일, 12월 6일 서울 강남 SC컨벤션에서 진행

*커리큘럼 등 세부 내용 : http://cafe.daum.net/ceocoop/b67P/29