🎥 RL.15 Double DQN과 Dueling — Q 값 과대추정 문제를 해결하다
- Track: rl
- Era: era2
- Video ID: eE_n3FiSB_4
- Playlist: PLSucJlr3QLmzc3_uCDOy5YCmyWmY1dMUx
- YouTube: Watch
- Thumbnail:

- Tags: 강화학습, DoubleDQN, Dueling, ReinforcementLearning
⚡ RL.15 Double DQN과 Dueling — Q-값 과대추정 문제를 해결하다
DQN은 놀라웠지만, Q-값 과대추정이라는 치명적 약점을 안고 있었습니다. Double DQN은 선택과 평가를 분리해 문제를 줄였고, Dueling 네트워크는 상태와 행동을 구분해 더 정교한 학습을 가능하게 했습니다.
🌟 핵심 포인트
- DQN의 불안정성과 Q-값 과대추정 문제
- Double DQN: 선택과 평가의 분리
- Dueling Network: 가치와 우위의 분리
- 안정적이고 강력한 게임 AI 성능
- 알파고로 이어지는 딥 강화학습의 진화
👉 다음 에피소드 RL.16 알파고의 충격 — MCTS와 딥러닝이 만나 바둑을 정복하다에서 AI 역사의 분수령을 다룹니다.
🏷️ #강화학습 #DoubleDQN #Dueling #ReinforcementLearningOdyssey #AI역사
