한양대학교 ERICA 인공지능융합연구센터

AI AcademyAI아카데미

AI아카데미

누구나 할 수 있는 강화학습

누구나 할 수 있는 강화학습 (1-14주차) 총 40개 동영상 강의

제품상세정보테이블
강사	박태준 교수 (한양대학교 로봇공학과)

목록으로

수강신청

강의목록
강의소개

강의목록
번호	강의명	강의시간	조회수
1	누구나 할 수 있는 강화학습 (1주차) 오리엔테이션(16:32) 주차별학습목표 : 강의소개 학습내용 : 강의 전반에 대한 소개	16:32	3
2	누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(14:53) 주차별학습목표 : 강화학습의 기본 개념과 원리 이해 학습내용 : 강화학습의 개념	14:53	9
3	누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(12:38) 주차별학습목표 : 강화학습의 기본 개념과 원리 이해 학습내용 : 강화학습 적용 사례 (1)	12:38	4
4	누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(7:34) 주차별학습목표 : 강화학습의 기본 개념과 원리 이해 학습내용 : 강화학습 적용 사례 (2)	7:34	3
5	누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(15:42) 주차별학습목표 : 강화학습에 필요한 기초 지식 이해 학습내용 : Markov Decision Process	15:42	5
6	누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(12:46) 주차별학습목표 : 강화학습에 필요한 기초 지식 이해 학습내용 : 가치 함수	12:46	5
7	누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(17:15) 주차별학습목표 : 강화학습에 필요한 기초 지식 이해 학습내용 : 다이나믹 프로그래밍과 벨만 방정식	17:15	6
8	누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(9:28) 주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 학습내용 : Optimal Policy	9:28	4
9	누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(15:22) 주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 학습내용 : Monte Carlo 알고리즘	15:22	4
10	누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(10:43) 주차별학습목표 : Monte Carlo 및 Temporal Difference 학습 학습내용 : Temporal Difference 알고리즘	10:43	2
11	누구나 할 수 있는 강화학습 (5주차) Q-Learning(15:00) 주차별학습목표 : Q-Learning 알고리즘 학습 학습내용 : On-policy	15:00	3
12	누구나 할 수 있는 강화학습 (5주차) Q-Learning(11:12) 주차별학습목표 : Q-Learning 알고리즘 학습 학습내용 : Off-policy	11:12	2
13	누구나 할 수 있는 강화학습 (5주차) Q-Learning(8:27) 주차별학습목표 : Q-Learning 알고리즘 학습 학습내용 : Q-Learning	8:27	2
14	누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(11:30) 주차별학습목표 : Open AI GYM 실습 환경 구축 학습내용 : OpenAI GYM의 소개	11:30	1
15	누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(8:48) 주차별학습목표 : Open AI GYM 실습 환경 구축 학습내용 : 실습 환경 구축 (1)	8:48	1
16	누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(13:09) 주차별학습목표 : Open AI GYM 실습 환경 구축 학습내용 : 실습 환경 구축 (2)	13:09	1
17	누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(21:27) 주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 학습내용 : DQN의 이해 (1)	21:27	1
18	누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(17:33) 주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 학습내용 : DQN의 이해 (2)	17:33	1
19	누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(13:17) 주차별학습목표 : Deep Q Network(DQN) 알고리즘 학습 학습내용 : DQN 실습	13:17	1
20	누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(17:39) 주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 학습내용 : HER의 이해 (1)	17:39	2
21	누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(14:16) 주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 학습내용 : HER의 이해 (2)	14:16	1
22	누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(12:24) 주차별학습목표 : Hindsight Experience Replay(HER) 알고리즘 학습 학습내용 : HER 실습	12:24	2
23	누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(17:42) 주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 학습내용 : 정책 기반 강화학습의 이해	17:42	2
24	누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(12:52) 주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 학습내용 : REINFORCE의 이해 (1)	12:52	2
25	누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(15:09) 주차별학습목표 : 정책 기반 강화학습 및 REINFORCE 알고리즘 학습 학습내용 : REINFORCE의 이해 (2)	15:09	1
26	누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(14:19) 주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 학습내용 : Actor-Critic 및 A2C의 이해 (1)	14:19	3
27	누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(13:50) 주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 학습내용 : Actor-Critic 및 A2C의 이해 (2)	13:50	4
28	누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(9:41) 주차별학습목표 : Actor-Critic 및 A2C 알고리즘 학습 학습내용 : A2C 실습	9:41	2
29	누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(19:33) 주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 학습내용 : PPO의 이해 (1)	19:33	6
30	누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(11:20) 주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 학습내용 : PPO의 이해 (2)	11:20	3
31	누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(9:57) 주차별학습목표 : Proximal Policy Optimization (PPO) 알고리즘 학습 학습내용 : PPO 실습	9:57	3
32	누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(16:25) 주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 학습내용 : DDPG의 이해 (1)	16:25	3
33	누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(10:42) 주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 학습내용 : DDPG의 이해 (2)	10:42	1
34	누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(11:36) 주차별학습목표 : Deep Deterministic Policy Gradient (DDPG) 알고리즘 학습 학습내용 : DDPG 실습	11:36	1
35	누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(15:26) 주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 학습내용 : TD3의 이해 (1)	15:26	1
36	누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(20:09) 주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 학습내용 : TD3의 이해 (2)	20:09	2
37	누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(21:31) 주차별학습목표 : Twin Delayed DDPG (TD3) 알고리즘 학습 학습내용 : TD3 실습	21:31	1
38	누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(17:59) 주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 학습내용 : SAC의 이해 (1)	17:59	1
39	누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(16:45) 주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 학습내용 : SAC의 이해 (2)	16:45	1
40	누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(8:40) 주차별학습목표 : Soft Actor Critic (SAC) 알고리즘 학습 학습내용 : SAC 실습	8:40	1

수업 목표

- 강화학습(Reinforcement Learning)은 주어진 환경에서 시행착오를 통해 보상을 최대한 많이 받을 수 있는 에이전트를 학습하고 이를 기반으로 실제 현장 작업을 통해 상황에 적합한 최적의 작업 방식을 적용하는 4차 산업혁명 핵심기술임

- 본 교과목에서는 강화학습의 기본 개념과 원리, 그리고 다양한 학습 모델과 알고리즘을 학습하며, 적절한 강화학습 기법을 적용하여 실생활 및 산업현장의 다양한 문제를 해결하는 방법을 습득하는 것을 목표로함

교수자

박태준 교수

2015년 ~ 현재: 한양대학교 로봇공학과 교수

2015년 ~ 현재: 재단법인 제조혁신기술원 연구기획본부장

2015년 ~ 현재: 한양대학교 산업융합기술연구원 IoT/CPS센터장

2011년 ~ 2015년: DGIST 정보통신융합공학전공 부교수

2008년 ~ 2011년: 한국항공대학교 조교수

2005년 ~ 2008년: 삼성종합기술원(기흥) 수석연구원

2001년 ~ 2005년: University of Michigan, Ann Arbor 연구조교

1994년 ~ 2000년: LG 전자 우면동연구소(서울)

한양대학교 ERICA 인공지능융합연구센터
홈페이지 책임자 : 센터장 김정룡
홈페이지 관리/담당자 : 윤은주
(15588) 경기 안산시 상록구 해안로 689 (사동, 카카오 데이터센터 안산) 산학연실2
전화 : 031-503-6303
팩스 : 031-503-6306

관련사이트: 한양대학교 HY-In 학부 인공지능학과 대학원 인공지능융합학과

AI AcademyAI아카데미

AI아카데미

누구나 할 수 있는 강화학습

누구나 할 수 있는 강화학습 (1주차) 오리엔테이션(16:32)

누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(14:53)

누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(12:38)

누구나 할 수 있는 강화학습 (2주차) 강화학습의 이해(7:34)

누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(15:42)

누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(12:46)

누구나 할 수 있는 강화학습 (3주차) 강화학습의 기초(17:15)

누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(9:28)

누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(15:22)

누구나 할 수 있는 강화학습 (4주차) Monte Carlo 및 Temporal Difference(10:43)

누구나 할 수 있는 강화학습 (5주차) Q-Learning(15:00)

누구나 할 수 있는 강화학습 (5주차) Q-Learning(11:12)

누구나 할 수 있는 강화학습 (5주차) Q-Learning(8:27)

누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(11:30)

누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(8:48)

누구나 할 수 있는 강화학습 (6주차) OpenAI GYM 환경(13:09)

누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(21:27)

누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(17:33)

누구나 할 수 있는 강화학습 (7주차) Deep Q Network(DQN)(13:17)

누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(17:39)

누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(14:16)

누구나 할 수 있는 강화학습 (8주차) Hindsight Experience Replay(HER)(12:24)

누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(17:42)

누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(12:52)

누구나 할 수 있는 강화학습 (9주차) 정책 기반 강화학습 및 REINFORCE(15:09)

누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(14:19)

누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(13:50)

누구나 할 수 있는 강화학습 (10주차) Actor-Critic 및 A2C(9:41)

누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(19:33)

누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(11:20)

누구나 할 수 있는 강화학습 (11주차) Proximal Policy Optimization (PPO)(9:57)

누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(16:25)

누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(10:42)

누구나 할 수 있는 강화학습 (12주차) Deep Deterministic Policy Gradient (DDPG)(11:36)

누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(15:26)

누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(20:09)

누구나 할 수 있는 강화학습 (13주차) Twin Delayed DDPG (TD3)(21:31)

누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(17:59)

누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(16:45)

누구나 할 수 있는 강화학습 (14주차) Soft Actor Critic (SAC)(8:40)