Deep Nexus One
Home
AI Odyssey
RL
GA
CV
NLP
|
Tutorials
불러오는 중…
AI Odyssey
/
AI Odyssey · RL
AI Odyssey · RL
Era I — 강화학습의 기원
AI Odyssey Reinforcement Learning Era I
YouTube에서 보기
8
Videos
6
Eras
All / Era
분할 탐색
Era I — 강화학습의 기원
Era II — 게임 AI의 황금시대
Era III — 딥 강화학습 폭발
Era IV — 현실 세계로의 확장
Era V — 차세대 강화학습
All — RL Full
▶ 재생
🐶 RL 01 파블로프에서 AI까지 – 조건부 학습이 기계학습을 만나다 #AI #강화학습 #Pavlov #조건부학습 #ReinforcementLearningOdyssey #AI역사
8/29/2025
▶ 재생
🎥 RL 02 동적 계획법의 지혜 — 벨만 방정식이 최적 정책을 찾다 #강화학습 #벨만방정식 #동적계획법 #ReinforcementLearningOdyssey #AI수학
8/29/2025
▶ 재생
🧠 RL 04 Q-Learning의 등장 — 모델 없이도 최적 행동을 찾는 방법 #강화학습 #Q러닝 #ReinforcementLearningOdyssey #Q값
8/29/2025
▶ 재생
🎥 RL 03 시간차 학습의 혁신 — TD Learning이 실시간 학습을 가능하게 하다 #강화학습 #TDLearning #시간차학습 #RLOdyssey #AI역사
8/29/2025
▶ 재생
🎲 RL TD-Gammon의 기적 — 백개먼에서 인간을 뛰어넘은 첫 AI #강화학습 #TDGammon #게임AI #ReinforcementLearningOdyssey
8/30/2025
▶ 재생
📐 RL 함수 근사의 필요성 — 큰 상태공간 문제를 해결하려면 #강화학습 #함수근사 #FunctionApproximation #RLOdyssey
8/30/2025
▶ 재생
🎯 RL 정책 기울기의 시작 — 행동을 직접 최적화하는 새로운 접근 #강화학습 #PolicyGradient #정책기울기 #ReinforcementLearningOdyssey
8/30/2025
▶ 재생
⚖️ RL.08 액터 크리틱의 결합 — 가치와 정책을 동시에 학습하다 #강화학습 #ActorCritic #정책기울기 #ReinforcementLearningOdyssey #AI역사
9/8/2025