Video thumbnail

Ep 51 AlphaGo vs. 이세돌 – 인간의 직관과 AI 계산의 충돌


AlphaGo – 바둑에서 인간을 이기다


1. 개요

  • 발표: 2016년, Google DeepMind
  • 정의: 심층 신경망과 강화학습을 결합해 세계 최고 프로 기사와 대국에서 승리한 바둑 AI
  • 의미: 복잡성에서 AI가 불가능하다고 여겨진 영역을 돌파한 상징적 사건

2. 배경 – 바둑, AI의 최후 난제

  • 바둑은 경우의 수가 우주의 원자 수를 넘는다고 추정
  • 체스보다 훨씬 깊은 전략과 직관이 필요
  • 기존 수치 연산 기반 탐색 알고리즘으로는 한계

3. 핵심 기술

  1. 정책망(Policy Network) – 다음 착점 확률 예측
  2. 가치망(Value Network) – 현재 국면에서 승률 평가
  3. 몬테카를로 트리 탐색(MCTS) – 확률적 시뮬레이션으로 최적 수 선택
  4. 강화학습(Self-play) – AI가 스스로 수백만 판을 두며 전략 발전

4. 대국 하이라이트

  • 2016년 3월, 이세돌 9단과의 5번기에서 4:1 승리
  • 4국 78수 – 인간의 창의성이 보여준 기념비적 한 수

5. 영향과 확장

  • 세계 언론과 대중에 AI 기술력 각인
  • AlphaGo Zero, AlphaZero 등 후속 모델로 발전
  • 의료, 과학, 물류 최적화 등 다른 분야로 알고리즘 확장

6. 의의

  • AlphaGo는 단순한 바둑 프로그램이 아니라,
  • 복잡한 문제 해결을 위한 AI 패러다임의 전환점이었다.

Ep 51 AlphaGo vs. 이세돌 – 인간의 직관과 AI 계산의 충돌 #deeplearning #reinforcementlearning #innovation - Compass