AI AcademyAI아카데미

AI아카데미

누구나 할 수 있는 강화학습

누구나 할 수 있는 강화학습

누구나 할 수 있는 강화학습 (1-14주차) 총 40개 동영상 강의
제품상세정보테이블
강사 박태준 교수 (한양대학교 로봇공학과)
  • 강의목록
  • 강의소개
강의목록
번호 강의명 강의시간 조회수 재생
1
누구나 할 수 있는 강화학습 (1주차) 오리엔테이션(16:32)

주차별학습목표 : 강의소개
학습내용 : 강의 전반에 대한 소개

16:32 3
2
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(14:53)

주차별학습목표 : 강화학습의 기본 개념과 원리 이해
학습내용 : 강화학습의 개념

14:53 9
3
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(12:38)

주차별학습목표 : 강화학습의 기본 개념과 원리 이해
학습내용 : 강화학습 적용 사례 (1)

12:38 4
4
누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(7:34)

주차별학습목표 : 강화학습의 기본 개념과 원리 이해
학습내용 : 강화학습 적용 사례 (2)

7:34 3
5
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(15:42)

주차별학습목표 : 강화학습에 필요한 기초 지식 이해
학습내용 : Markov Decision Process

15:42 5
6
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(12:46)

주차별학습목표 : 강화학습에 필요한 기초 지식 이해
학습내용 : 가치 함수

12:46 5
7
누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(17:15)

주차별학습목표 : 강화학습에 필요한 기초 지식 이해
학습내용 : 다이나믹 프로그래밍과 벨만 방정식

17:15 6
8
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(9:28)

주차별학습목표 : Monte Carlo 및 Temporal Difference 학습
학습내용 : Optimal Policy

9:28 4
9
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(15:22)

주차별학습목표 : Monte Carlo 및 Temporal Difference 학습
학습내용 : Monte Carlo 알고리즘

15:22 4
10
누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(10:43)

주차별학습목표 : Monte Carlo 및 Temporal Difference 학습
학습내용 : Temporal Difference 알고리즘

10:43 2
11
누구나 할 수 있는 강화학습 (5주차) Q-Learning(15:00)

주차별학습목표 : Q-Learning 알고리즘 학습
학습내용 : On-policy

15:00 3
12
누구나 할 수 있는 강화학습 (5주차) Q-Learning(11:12)

주차별학습목표 : Q-Learning 알고리즘 학습
학습내용 : Off-policy

11:12 2
13
누구나 할 수 있는 강화학습 (5주차) Q-Learning(8:27)

주차별학습목표 : Q-Learning 알고리즘 학습
학습내용 : Q-Learning

8:27 2
14
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(11:30)

주차별학습목표 : Open AI GYM 실습 환경 구축
학습내용 : OpenAI GYM의 소개

11:30 1
15
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(8:48)

주차별학습목표 : Open AI GYM 실습 환경 구축
학습내용 : 실습 환경 구축 (1)

8:48 1
16
누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(13:09)

주차별학습목표 : Open AI GYM 실습 환경 구축
학습내용 : 실습 환경 구축 (2)

13:09 1
17
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(21:27)

주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습
학습내용 : DQN의 이해 (1)

21:27 2
18
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(17:33)

주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습
학습내용 : DQN의 이해 (2)

17:33 1
19
누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(13:17)

주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습
학습내용 : DQN 실습

13:17 1
20
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(17:39)

주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습
학습내용 : HER의 이해 (1)

17:39 2
21
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(14:16)

주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습
학습내용 : HER의 이해 (2)

14:16 1
22
누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(12:24)

주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습
학습내용 : HER 실습

12:24 2
23
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(17:42)

주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습
학습내용 : 정책 기반 강화학습의 이해

17:42 2
24
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(12:52)

주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습
학습내용 : REINFORCE의 이해 (1)

12:52 2
25
누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(15:09)

주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습
학습내용 : REINFORCE의 이해 (2)

15:09 1
26
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(14:19)

주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습
학습내용 : Actor-Critic 및 A2C의 이해 (1)

14:19 3
27
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(13:50)

주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습
학습내용 : Actor-Critic 및 A2C의 이해 (2)

13:50 4
28
누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(9:41)

주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습
학습내용 : A2C 실습

9:41 2
29
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(19:33)

주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습
학습내용 : PPO의 이해 (1)

19:33 6
30
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(11:20)

주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습
학습내용 : PPO의 이해 (2)

11:20 3
31
누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(9:57)

주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습
학습내용 : PPO 실습

9:57 3
32
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(16:25)

주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습
학습내용 : DDPG의 이해 (1)

16:25 3
33
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(10:42)

주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습
학습내용 : DDPG의 이해 (2)

10:42 1
34
누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(11:36)

주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습
학습내용 : DDPG 실습

11:36 1
35
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(15:26)

주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습
학습내용 : TD3의 이해 (1)

15:26 1
36
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(20:09)

주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습
학습내용 : TD3의 이해 (2)

20:09 2
37
누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(21:31)

주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습
학습내용 : TD3 실습

21:31 1
38
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(17:59)

주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습
학습내용 : SAC의 이해 (1)

17:59 1
39
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(16:45)

주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습
학습내용 : SAC의 이해 (2)

16:45 1
40
누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(8:40)

주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습
학습내용 : SAC 실습

8:40 1

수업 목표

- 강화학습(Reinforcement Learning)은 주어진 환경에서 시행착오를 통해 보상을 최대한 많이 받을 수 있는 에이전트를 학습하고 이를 기반으로 실제 현장 작업을 통해 상황에 적합한 최적의 작업 방식을 적용하는 4차 산업혁명 핵심기술임

- 본 교과목에서는 강화학습의 기본 개념과 원리, 그리고 다양한 학습 모델과 알고리즘을 학습하며, 적절한 강화학습 기법을 적용하여 실생활 및 산업현장의 다양한 문제를 해결하는 방법을 습득하는 것을 목표로함



교수자

박태준 교수

2015년 ~ 현재: 한양대학교 로봇공학과 교수

2015년 ~ 현재: 재단법인 제조혁신기술원 연구기획본부장

2015년 ~ 현재: 한양대학교 산업융합기술연구원 IoT/CPS센터장

2011년 ~ 2015년: DGIST 정보통신융합공학전공 부교수

2008년 ~ 2011년: 한국항공대학교 조교수

2005년 ~ 2008년: 삼성종합기술원(기흥) 수석연구원

2001년 ~ 2005년: University of Michigan, Ann Arbor 연구조교

1994년 ~ 2000년: LG 전자 우면동연구소(서울)