Deep Nexus One
Home
AI Odyssey
RL
GA
CV
NLP
|
Tutorials
불러오는 중…
AI Odyssey
/
AI Odyssey · RL
AI Odyssey · RL
All — RL Full
AI Odyssey Reinforcement Learning Full Series
YouTube에서 보기
30
Videos
6
Eras
All / Era
분할 탐색
Era I — 강화학습의 기원
Era II — 게임 AI의 황금시대
Era III — 딥 강화학습 폭발
Era IV — 현실 세계로의 확장
Era V — 차세대 강화학습
All — RL Full
▶ 재생
🐶 RL 01 파블로프에서 AI까지 – 조건부 학습이 기계학습을 만나다 #AI #강화학습 #Pavlov #조건부학습 #ReinforcementLearningOdyssey #AI역사
8/29/2025
▶ 재생
🎥 RL 02 동적 계획법의 지혜 — 벨만 방정식이 최적 정책을 찾다 #강화학습 #벨만방정식 #동적계획법 #ReinforcementLearningOdyssey #AI수학
8/29/2025
▶ 재생
🎥 RL 03 시간차 학습의 혁신 — TD Learning이 실시간 학습을 가능하게 하다 #강화학습 #TDLearning #시간차학습 #RLOdyssey #AI역사
8/29/2025
▶ 재생
🧠 RL 04 Q-Learning의 등장 — 모델 없이도 최적 행동을 찾는 방법 #강화학습 #Q러닝 #ReinforcementLearningOdyssey #Q값
8/29/2025
▶ 재생
🎲 RL TD-Gammon의 기적 — 백개먼에서 인간을 뛰어넘은 첫 AI #강화학습 #TDGammon #게임AI #ReinforcementLearningOdyssey
8/30/2025
▶ 재생
📐 RL 함수 근사의 필요성 — 큰 상태공간 문제를 해결하려면 #강화학습 #함수근사 #FunctionApproximation #RLOdyssey
8/30/2025
▶ 재생
🎯 RL 정책 기울기의 시작 — 행동을 직접 최적화하는 새로운 접근 #강화학습 #PolicyGradient #정책기울기 #ReinforcementLearningOdyssey
8/30/2025
▶ 재생
⚖️ RL.08 액터 크리틱의 결합 — 가치와 정책을 동시에 학습하다 #강화학습 #ActorCritic #정책기울기 #ReinforcementLearningOdyssey #AI역사
9/8/2025
▶ 재생
Ep 21 Deep Blue vs Kasparov 체스 챔피언 격파
8/13/2025
▶ 재생
🎥 RL.10 몬테카를로 트리 탐색 — 무작위 시뮬레이션의 놀라운 위력 #MCTS #몬테카를로 #ReinforcementLearningOdyssey #AI역사
9/8/2025
▶ 재생
⚖️ RL.11 UCB와 탐색 활용 — 불확실성을 어떻게 다룰 것인가 #강화학습 #UCB #탐색활용 #ReinforcementLearningOdyssey #AI역사
9/8/2025
▶ 재생
🎥 RL.12 컴퓨터 바둑의 도전 — 19x19 바둑판의 엄청난 복잡성 #강화학습 #바둑AI #MCTS #ReinforcementLearningOdyssey #AI역사
9/9/2025
▶ 재생
🎥 RL.13 DQN의 혁신 — 아타리 게임을 정복한 딥 Q 네트워크 #강화학습 #DQN #딥러닝 #Atari #ReinforcementLearningOdyssey
9/9/2025
▶ 재생
🎥 RL.14 경험 재생의 아이디어 — 과거 경험을 반복 학습하다 #강화학습 #경험재생 #ExperienceReplay #ReinforcementLearningOdyssey
9/9/2025
▶ 재생
🎥 RL.15 Double DQN과 Dueling — Q 값 과대추정 문제를 해결하다 #강화학습 #DoubleDQN #Dueling #ReinforcementLearning
9/9/2025
▶ 재생
🎥 알파고(AlphaGo)의 충격 — MCTS와 딥러닝이 만나 바둑을 정복하다 #강화학습 #알파고 #바둑AI #MCTS #ReinforcementLearningOdyssey
9/9/2025
▶ 재생
🎥 AI 자기 진화 — 알파고 제로(AlphaGo Zero)의 비밀 #강화학습 #AlphaGoZero #SelfPlay #ReinforcementLearningOdyssey
9/9/2025
▶ 재생
🌍하나의 두뇌, 세 개의 게임 — 알파제로(AlphaZero)의 비밀 — 체스, 장기, 바둑을 동시에 마스터 #강화학습 #AlphaZero #범용AI
9/9/2025
▶ 재생
🎥 보이지 않는 규칙까지 학습 — 뮤제로(MuZero)의 도전! #강화학습 #MuZero #ModelBasedRL #ReinforcementLearningOdyssey #AI역사
9/9/2025
▶ 재생
⚡ 병렬로 학습하는 인공지능 — A3C의 도전 #강화학습 #A3C #비동기학습 #AI역사 #PPO #SAC
9/9/2025
▶ 재생
🎥 PPO의 안정성 — 정책 업데이트를 안전하게 제한하다 🏷️ #강화학습 #PPO #정책최적화 #SAC #AI역사
9/9/2025
▶ 재생
🎥 탐색과 활용의 새로운 균형 — SAC의 비밀 #강화학습 #SAC #최대엔트로피 #ReinforcementLearningOdyssey #AI역사
9/9/2025
▶ 재생
🎥 RL.23 AI 팀플레이 — OpenAI Five의 도전 #강화학습 #OpenAIFive #Dota2 #멀티에이전트 #AI역사 #인공지능 #AIOdyssey
9/9/2025
▶ 재생
🎥 손끝의 지능 — 로봇 조작 학습 #강화학습 #로봇조작 #로보틱스 #AI연구 #로봇학습 #AIOdyssey
9/9/2025
▶ 재생
🎥 시뮬레이션 투 리얼 (Sim-to-Real) — 가상에서 배운 것을 현실에 적용 #강화학습 #Sim2Real #로봇학습 #AI연구 #AIOdyssey
9/9/2025
▶ 재생
🎥 두 발로 선 AI — 휴머노이드 로봇의 도전 #강화학습 #휴머노이드 #로봇보행 #로보틱스 #AI연구 #AIOdyssey
9/10/2025
▶ 재생
🎥 집단의 지능 — 멀티에이전트 강화학습 #강화학습 #멀티에이전트 #AI팀워크 #자율시스템 #AI연구 #AIOdyssey
9/10/2025
▶ 재생
🧩 배우는 법을 배우는 AI — 메타 강화학습 #강화학습 #메타학습 #MetaRL #AI연구 #AIOdyssey
9/10/2025
▶ 재생
🧩데이터로만 배우는 AI — 오프라인 강화학습 #강화학습 #오프라인강화학습 #데이터AI #AI연구 #AIOdyssey
9/10/2025
▶ 재생
🌌 거대 모델과 강화학습의 만남 — 지능의 전환점 #강화학습 #FoundationModels #RLHF #AI혁신 #AIOdyssey #AI미래
9/10/2025