번호 | 강의명 | 강의시간 | 조회수 | 재생 |
---|---|---|---|---|
1 |
누구나 할 수 있는 강화학습 (1주차) 오리엔테이션(16:32)주차별학습목표 : 강의소개 |
16:32 | 3 | |
2 |
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(14:53)주차별학습목표 : 강화학습의 기본 개념과 원리 이해 |
14:53 | 9 | |
3 |
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(12:38)주차별학습목표 : 강화학습의 기본 개념과 원리 이해 |
12:38 | 4 | |
4 |
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(7:34)주차별학습목표 : 강화학습의 기본 개념과 원리 이해 |
7:34 | 3 | |
5 |
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(15:42)주차별학습목표 : 강화학습에 필요한 기초 지식 이해 |
15:42 | 5 | |
6 |
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(12:46)주차별학습목표 : 강화학습에 필요한 기초 지식 이해 |
12:46 | 5 | |
7 |
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(17:15)주차별학습목표 : 강화학습에 필요한 기초 지식 이해 |
17:15 | 6 | |
8 |
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(9:28)주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 |
9:28 | 4 | |
9 |
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(15:22)주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 |
15:22 | 4 | |
10 |
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(10:43)주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 |
10:43 | 2 | |
11 |
누구나 할 수 있는 강화학습 (5주차) Q-Learning(15:00)주차별학습목표 : Q-Learning 알고리즘 학습 |
15:00 | 3 | |
12 |
누구나 할 수 있는 강화학습 (5주차) Q-Learning(11:12)주차별학습목표 : Q-Learning 알고리즘 학습 |
11:12 | 2 | |
13 |
누구나 할 수 있는 강화학습 (5주차) Q-Learning(8:27)주차별학습목표 : Q-Learning 알고리즘 학습 |
8:27 | 2 | |
14 |
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(11:30)주차별학습목표 : Open AI GYM 실습 환경 구축 |
11:30 | 1 | |
15 |
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(8:48)주차별학습목표 : Open AI GYM 실습 환경 구축 |
8:48 | 1 | |
16 |
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(13:09)주차별학습목표 : Open AI GYM 실습 환경 구축 |
13:09 | 1 | |
17 |
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(21:27)주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 |
21:27 | 2 | |
18 |
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(17:33)주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 |
17:33 | 1 | |
19 |
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(13:17)주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 |
13:17 | 1 | |
20 |
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(17:39)주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 |
17:39 | 2 | |
21 |
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(14:16)주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 |
14:16 | 1 | |
22 |
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(12:24)주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 |
12:24 | 2 | |
23 |
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(17:42)주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 |
17:42 | 2 | |
24 |
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(12:52)주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 |
12:52 | 2 | |
25 |
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(15:09)주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 |
15:09 | 1 | |
26 |
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(14:19)주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 |
14:19 | 3 | |
27 |
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(13:50)주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 |
13:50 | 4 | |
28 |
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(9:41)주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 |
9:41 | 2 | |
29 |
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(19:33)주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 |
19:33 | 6 | |
30 |
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(11:20)주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 |
11:20 | 3 | |
31 |
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(9:57)주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 |
9:57 | 3 | |
32 |
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(16:25)주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 |
16:25 | 3 | |
33 |
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(10:42)주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 |
10:42 | 1 | |
34 |
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(11:36)주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 |
11:36 | 1 | |
35 |
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(15:26)주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 |
15:26 | 1 | |
36 |
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(20:09)주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 |
20:09 | 2 | |
37 |
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(21:31)주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 |
21:31 | 1 | |
38 |
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(17:59)주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 |
17:59 | 1 | |
39 |
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(16:45)주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 |
16:45 | 1 | |
40 |
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(8:40)주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 |
8:40 | 1 |
수업 목표
- 강화학습(Reinforcement Learning)은 주어진 환경에서 시행착오를 통해 보상을 최대한 많이 받을 수 있는 에이전트를 학습하고 이를 기반으로 실제 현장 작업을 통해 상황에 적합한 최적의 작업 방식을 적용하는 4차 산업혁명 핵심기술임
- 본 교과목에서는 강화학습의 기본 개념과 원리, 그리고 다양한 학습 모델과 알고리즘을 학습하며, 적절한 강화학습 기법을 적용하여 실생활 및 산업현장의 다양한 문제를 해결하는 방법을 습득하는 것을 목표로함
교수자
박태준 교수
2015년 ~ 현재: 한양대학교 로봇공학과 교수
2015년 ~ 현재: 재단법인 제조혁신기술원 연구기획본부장
2015년 ~ 현재: 한양대학교 산업융합기술연구원 IoT/CPS센터장
2011년 ~ 2015년: DGIST 정보통신융합공학전공 부교수
2008년 ~ 2011년: 한국항공대학교 조교수
2005년 ~ 2008년: 삼성종합기술원(기흥) 수석연구원
2001년 ~ 2005년: University of Michigan, Ann Arbor 연구조교
1994년 ~ 2000년: LG 전자 우면동연구소(서울)