Ep 51 AlphaGo vs. 이세돌 – 인간의 직관과 AI 계산의 충돌
- Track: core
- Era: era3
- Video ID: ttd_xL9v1Xg
- Playlist: PLSucJlr3QLmyvq14W_UnMsxygvbi6sNcc
- YouTube: Watch
- Thumbnail:

- Tags: deeplearning, reinforcementlearning, innovation
AlphaGo – 바둑에서 인간을 이기다
1. 개요
- 발표: 2016년, Google DeepMind
- 정의: 심층 신경망과 강화학습을 결합해 세계 최고 프로 기사와 대국에서 승리한 바둑 AI
- 의미: 복잡성에서 AI가 불가능하다고 여겨진 영역을 돌파한 상징적 사건
2. 배경 – 바둑, AI의 최후 난제
- 바둑은 경우의 수가 우주의 원자 수를 넘는다고 추정
- 체스보다 훨씬 깊은 전략과 직관이 필요
- 기존 수치 연산 기반 탐색 알고리즘으로는 한계
3. 핵심 기술
- 정책망(Policy Network) – 다음 착점 확률 예측
- 가치망(Value Network) – 현재 국면에서 승률 평가
- 몬테카를로 트리 탐색(MCTS) – 확률적 시뮬레이션으로 최적 수 선택
- 강화학습(Self-play) – AI가 스스로 수백만 판을 두며 전략 발전
4. 대국 하이라이트
- 2016년 3월, 이세돌 9단과의 5번기에서 4:1 승리
- 4국 78수 – 인간의 창의성이 보여준 기념비적 한 수
5. 영향과 확장
- 세계 언론과 대중에 AI 기술력 각인
- AlphaGo Zero, AlphaZero 등 후속 모델로 발전
- 의료, 과학, 물류 최적화 등 다른 분야로 알고리즘 확장
6. 의의
- AlphaGo는 단순한 바둑 프로그램이 아니라,
- 복잡한 문제 해결을 위한 AI 패러다임의 전환점이었다.
