[강화학습] Introduction_RL_2
·
Study
이 글은 Introduction_RL_1 포스팅과 이어지는 글입니다. 2025.04.05 - [Study] - [강화학습] 1.Introduction_RL_1 [강화학습] 1.Introduction_RL_1이 글은 DeepMind의 David Silver가 진행한 RL 강의 중 Lecture 1: Introduction to Reinforcement Learning의 주요 내용을 정리한 것이다.강화학습이란?기계학습(Machine Learning)은 크게 세 가지 유형으로 나뉜다.지도학dev-hyena.tistory.com강화학습의 핵심 개념보상 (Reward): 에이전트의 행동 결과에 대한 수치적 피드백이다.상태 (State): 현재 상황을 나타내는 정보로, 과거의 기록(Ht)으로부터 정의된다.정책 (P..
[강화학습] 1.Introduction_RL_1
·
Study
이 글은 DeepMind의 David Silver가 진행한 RL 강의 중 Lecture 1: Introduction to Reinforcement Learning의 주요 내용을 정리한 것이다.강화학습이란?기계학습(Machine Learning)은 크게 세 가지 유형으로 나뉜다.지도학습 (Supervised Learning): 정답(label)이 있는 데이터를 기반으로 학습하는 방식이다.비지도학습 (Unsupervised Learning): 정답 없이 데이터의 패턴을 찾는 방식이다.강화학습 (Reinforcement Learning): 정답은 없고 보상(Reward)을 통해 학습하는 방식이다.  강화학습의 특징은 다음과 같다.특징설명감독 없음정답 대신 보상만 주어진다.피드백 지연행동에 대한 결과(보상)가 ..