Era I — 강화학습의 기원

🐶 RL 01 파블로프에서 AI
🎥 RL 02 동적 계획법의 지
🧠 RL 04 Q-Learnin
🎥 RL 03 시간차 학습의 혁
🎲 RL TD-Gammon의 기
📐 RL 함수 근사의 필요성 —
🎯 RL 정책 기울기의 시작 —
⚖️ RL.08 액터 크리틱의 결

Era II — 게임 AI의 황금

Ep 21 Deep Blue vs
🎥 RL.10 몬테카를로 트리
⚖️ RL.11 UCB와 탐색 활
🎥 RL.12 컴퓨터 바둑의 도
🎥 RL.13 DQN의 혁신 —
🎥 RL.14 경험 재생의 아이
🎥 RL.15 Double DQ

Era III — 딥 강화학습 폭

🎥 알파고(AlphaGo)의 충
🎥 AI 자기 진화 — 알파고
🌍하나의 두뇌, 세 개의 게임
🎥 보이지 않는 규칙까지 학습
⚡ 병렬로 학습하는 인공지능 —
🎥 PPO의 안정성 — 정책 업
🎥 탐색과 활용의 새로운 균형

Era IV — 현실 세계로의 확

Ep 83 멀티에이전트 시스템 –
🎥 RL.23 AI 팀플레이 —
🎥 손끝의 지능 — 로봇 조작
🎥 시뮬레이션 투 리얼 (Sim
🎥 두 발로 선 AI — 휴머노
🎥 집단의 지능 — 멀티에이전트

Era V — 차세대 강화학습

🧩 배우는 법을 배우는 AI —
🧩데이터로만 배우는 AI — 오
🌌 거대 모델과 강화학습의 만남

All — RL Full

🐶 RL 01 파블로프에서 AI
🎥 RL 02 동적 계획법의 지
🎥 RL 03 시간차 학습의 혁
🧠 RL 04 Q-Learnin
🎲 RL TD-Gammon의 기
📐 RL 함수 근사의 필요성 —
🎯 RL 정책 기울기의 시작 —
⚖️ RL.08 액터 크리틱의 결
Ep 21 Deep Blue vs
🎥 RL.10 몬테카를로 트리
⚖️ RL.11 UCB와 탐색 활
🎥 RL.12 컴퓨터 바둑의 도
🎥 RL.13 DQN의 혁신 —
🎥 RL.14 경험 재생의 아이
🎥 RL.15 Double DQ
🎥 알파고(AlphaGo)의 충
🎥 AI 자기 진화 — 알파고
🌍하나의 두뇌, 세 개의 게임
🎥 보이지 않는 규칙까지 학습
⚡ 병렬로 학습하는 인공지능 —
🎥 PPO의 안정성 — 정책 업
🎥 탐색과 활용의 새로운 균형
🎥 RL.23 AI 팀플레이 —
🎥 손끝의 지능 — 로봇 조작
🎥 시뮬레이션 투 리얼 (Sim
🎥 두 발로 선 AI — 휴머노
🎥 집단의 지능 — 멀티에이전트
🧩 배우는 법을 배우는 AI —
🧩데이터로만 배우는 AI — 오
🌌 거대 모델과 강화학습의 만남

AI Odyssey RL/Overview

Core CV GA RL NLP

Course overview

Future Makers는 커리어 설계를 통해 비전 리더십을 개발합니다.

6 modules

·

61 lessons

·

Start the course

Part 1

Era I — 강화학습의 기원

🐶 RL 01 파블로프에서 AI까지 – 조건부 학습이 기계학습을 만나다 #AI #강화학습 #Pavlov #조건부학습 #ReinforcementLearningOdyssey #AI역사
🎥 RL 02 동적 계획법의 지혜 — 벨만 방정식이 최적 정책을 찾다 #강화학습 #벨만방정식 #동적계획법 #ReinforcementLearningOdyssey #AI수학
🧠 RL 04 Q-Learning의 등장 — 모델 없이도 최적 행동을 찾는 방법 #강화학습 #Q러닝 #ReinforcementLearningOdyssey #Q값
🎥 RL 03 시간차 학습의 혁신 — TD Learning이 실시간 학습을 가능하게 하다 #강화학습 #TDLearning #시간차학습 #RLOdyssey #AI역사
🎲 RL TD-Gammon의 기적 — 백개먼에서 인간을 뛰어넘은 첫 AI #강화학습 #TDGammon #게임AI #ReinforcementLearningOdyssey
📐 RL 함수 근사의 필요성 — 큰 상태공간 문제를 해결하려면 #강화학습 #함수근사 #FunctionApproximation #RLOdyssey
🎯 RL 정책 기울기의 시작 — 행동을 직접 최적화하는 새로운 접근 #강화학습 #PolicyGradient #정책기울기 #ReinforcementLearningOdyssey
⚖️ RL.08 액터 크리틱의 결합 — 가치와 정책을 동시에 학습하다 #강화학습 #ActorCritic #정책기울기 #ReinforcementLearningOdyssey #AI역사

Part 2

Era II — 게임 AI의 황금시대

Ep 21 Deep Blue vs Kasparov 체스 챔피언 격파
🎥 RL.10 몬테카를로 트리 탐색 — 무작위 시뮬레이션의 놀라운 위력 #MCTS #몬테카를로 #ReinforcementLearningOdyssey #AI역사
⚖️ RL.11 UCB와 탐색 활용 — 불확실성을 어떻게 다룰 것인가 #강화학습 #UCB #탐색활용 #ReinforcementLearningOdyssey #AI역사
🎥 RL.12 컴퓨터 바둑의 도전 — 19x19 바둑판의 엄청난 복잡성 #강화학습 #바둑AI #MCTS #ReinforcementLearningOdyssey #AI역사
🎥 RL.13 DQN의 혁신 — 아타리 게임을 정복한 딥 Q 네트워크 #강화학습 #DQN #딥러닝 #Atari #ReinforcementLearningOdyssey
🎥 RL.14 경험 재생의 아이디어 — 과거 경험을 반복 학습하다 #강화학습 #경험재생 #ExperienceReplay #ReinforcementLearningOdyssey
🎥 RL.15 Double DQN과 Dueling — Q 값 과대추정 문제를 해결하다 #강화학습 #DoubleDQN #Dueling #ReinforcementLearning

Part 3

Era III — 딥 강화학습 폭발

🎥 알파고(AlphaGo)의 충격 — MCTS와 딥러닝이 만나 바둑을 정복하다 #강화학습 #알파고 #바둑AI #MCTS #ReinforcementLearningOdyssey
🎥 AI 자기 진화 — 알파고 제로(AlphaGo Zero)의 비밀 #강화학습 #AlphaGoZero #SelfPlay #ReinforcementLearningOdyssey
🌍하나의 두뇌, 세 개의 게임 — 알파제로(AlphaZero)의 비밀 — 체스, 장기, 바둑을 동시에 마스터 #강화학습 #AlphaZero #범용AI
🎥 보이지 않는 규칙까지 학습 — 뮤제로(MuZero)의 도전! #강화학습 #MuZero #ModelBasedRL #ReinforcementLearningOdyssey #AI역사
⚡ 병렬로 학습하는 인공지능 — A3C의 도전 #강화학습 #A3C #비동기학습 #AI역사 #PPO #SAC
🎥 PPO의 안정성 — 정책 업데이트를 안전하게 제한하다 🏷️ #강화학습 #PPO #정책최적화 #SAC #AI역사
🎥 탐색과 활용의 새로운 균형 — SAC의 비밀 #강화학습 #SAC #최대엔트로피 #ReinforcementLearningOdyssey #AI역사

Part 4

Era IV — 현실 세계로의 확장

Ep 83 멀티에이전트 시스템 – AI들이 협업하는 세상 #멀티에이전트 #AI협업 #집단지성 #AI역사 #AI혁명
🎥 RL.23 AI 팀플레이 — OpenAI Five의 도전 #강화학습 #OpenAIFive #Dota2 #멀티에이전트 #AI역사 #인공지능 #AIOdyssey
🎥 손끝의 지능 — 로봇 조작 학습 #강화학습 #로봇조작 #로보틱스 #AI연구 #로봇학습 #AIOdyssey
🎥 시뮬레이션 투 리얼 (Sim-to-Real) — 가상에서 배운 것을 현실에 적용 #강화학습 #Sim2Real #로봇학습 #AI연구 #AIOdyssey
🎥 두 발로 선 AI — 휴머노이드 로봇의 도전 #강화학습 #휴머노이드 #로봇보행 #로보틱스 #AI연구 #AIOdyssey
🎥 집단의 지능 — 멀티에이전트 강화학습 #강화학습 #멀티에이전트 #AI팀워크 #자율시스템 #AI연구 #AIOdyssey

Part 5

Era V — 차세대 강화학습

🧩 배우는 법을 배우는 AI — 메타 강화학습 #강화학습 #메타학습 #MetaRL #AI연구 #AIOdyssey
🧩데이터로만 배우는 AI — 오프라인 강화학습 #강화학습 #오프라인강화학습 #데이터AI #AI연구 #AIOdyssey
🌌 거대 모델과 강화학습의 만남 — 지능의 전환점 #강화학습 #FoundationModels #RLHF #AI혁신 #AIOdyssey #AI미래

Part 6

All — RL Full

🐶 RL 01 파블로프에서 AI까지 – 조건부 학습이 기계학습을 만나다 #AI #강화학습 #Pavlov #조건부학습 #ReinforcementLearningOdyssey #AI역사
🎥 RL 02 동적 계획법의 지혜 — 벨만 방정식이 최적 정책을 찾다 #강화학습 #벨만방정식 #동적계획법 #ReinforcementLearningOdyssey #AI수학
🎥 RL 03 시간차 학습의 혁신 — TD Learning이 실시간 학습을 가능하게 하다 #강화학습 #TDLearning #시간차학습 #RLOdyssey #AI역사
🧠 RL 04 Q-Learning의 등장 — 모델 없이도 최적 행동을 찾는 방법 #강화학습 #Q러닝 #ReinforcementLearningOdyssey #Q값
🎲 RL TD-Gammon의 기적 — 백개먼에서 인간을 뛰어넘은 첫 AI #강화학습 #TDGammon #게임AI #ReinforcementLearningOdyssey
📐 RL 함수 근사의 필요성 — 큰 상태공간 문제를 해결하려면 #강화학습 #함수근사 #FunctionApproximation #RLOdyssey
🎯 RL 정책 기울기의 시작 — 행동을 직접 최적화하는 새로운 접근 #강화학습 #PolicyGradient #정책기울기 #ReinforcementLearningOdyssey
⚖️ RL.08 액터 크리틱의 결합 — 가치와 정책을 동시에 학습하다 #강화학습 #ActorCritic #정책기울기 #ReinforcementLearningOdyssey #AI역사
Ep 21 Deep Blue vs Kasparov 체스 챔피언 격파
🎥 RL.10 몬테카를로 트리 탐색 — 무작위 시뮬레이션의 놀라운 위력 #MCTS #몬테카를로 #ReinforcementLearningOdyssey #AI역사
⚖️ RL.11 UCB와 탐색 활용 — 불확실성을 어떻게 다룰 것인가 #강화학습 #UCB #탐색활용 #ReinforcementLearningOdyssey #AI역사
🎥 RL.12 컴퓨터 바둑의 도전 — 19x19 바둑판의 엄청난 복잡성 #강화학습 #바둑AI #MCTS #ReinforcementLearningOdyssey #AI역사
🎥 RL.13 DQN의 혁신 — 아타리 게임을 정복한 딥 Q 네트워크 #강화학습 #DQN #딥러닝 #Atari #ReinforcementLearningOdyssey
🎥 RL.14 경험 재생의 아이디어 — 과거 경험을 반복 학습하다 #강화학습 #경험재생 #ExperienceReplay #ReinforcementLearningOdyssey
🎥 RL.15 Double DQN과 Dueling — Q 값 과대추정 문제를 해결하다 #강화학습 #DoubleDQN #Dueling #ReinforcementLearning
🎥 알파고(AlphaGo)의 충격 — MCTS와 딥러닝이 만나 바둑을 정복하다 #강화학습 #알파고 #바둑AI #MCTS #ReinforcementLearningOdyssey
🎥 AI 자기 진화 — 알파고 제로(AlphaGo Zero)의 비밀 #강화학습 #AlphaGoZero #SelfPlay #ReinforcementLearningOdyssey
🌍하나의 두뇌, 세 개의 게임 — 알파제로(AlphaZero)의 비밀 — 체스, 장기, 바둑을 동시에 마스터 #강화학습 #AlphaZero #범용AI
🎥 보이지 않는 규칙까지 학습 — 뮤제로(MuZero)의 도전! #강화학습 #MuZero #ModelBasedRL #ReinforcementLearningOdyssey #AI역사
⚡ 병렬로 학습하는 인공지능 — A3C의 도전 #강화학습 #A3C #비동기학습 #AI역사 #PPO #SAC
🎥 PPO의 안정성 — 정책 업데이트를 안전하게 제한하다 🏷️ #강화학습 #PPO #정책최적화 #SAC #AI역사
🎥 탐색과 활용의 새로운 균형 — SAC의 비밀 #강화학습 #SAC #최대엔트로피 #ReinforcementLearningOdyssey #AI역사
🎥 RL.23 AI 팀플레이 — OpenAI Five의 도전 #강화학습 #OpenAIFive #Dota2 #멀티에이전트 #AI역사 #인공지능 #AIOdyssey
🎥 손끝의 지능 — 로봇 조작 학습 #강화학습 #로봇조작 #로보틱스 #AI연구 #로봇학습 #AIOdyssey
🎥 시뮬레이션 투 리얼 (Sim-to-Real) — 가상에서 배운 것을 현실에 적용 #강화학습 #Sim2Real #로봇학습 #AI연구 #AIOdyssey
🎥 두 발로 선 AI — 휴머노이드 로봇의 도전 #강화학습 #휴머노이드 #로봇보행 #로보틱스 #AI연구 #AIOdyssey
🎥 집단의 지능 — 멀티에이전트 강화학습 #강화학습 #멀티에이전트 #AI팀워크 #자율시스템 #AI연구 #AIOdyssey
🧩 배우는 법을 배우는 AI — 메타 강화학습 #강화학습 #메타학습 #MetaRL #AI연구 #AIOdyssey
🧩데이터로만 배우는 AI — 오프라인 강화학습 #강화학습 #오프라인강화학습 #데이터AI #AI연구 #AIOdyssey
🌌 거대 모델과 강화학습의 만남 — 지능의 전환점 #강화학습 #FoundationModels #RLHF #AI혁신 #AIOdyssey #AI미래