위키

포럼

도구

강화학습 RL

(강화 학습에서 넘어옴)

2021-04-20

편집

역링크

토론

1 개요[ | ]

reinforcement learning (RL)
强化學習
강화 학습, 강화형 기계학습

머신러닝의 한 영역
컴퓨터가 주어진 상태(state)에 대해 최적의 행동(action)을 선택하는 학습방법
어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법
에이전트가 시행착오를 통해 학습한다.
결정을 순서대로 해야 하는 문제에 적용할 수 있다.
강화 학습에서 다루는 '환경'은 주로 마르코프 결정 과정으로 주어진다.
입출력 쌍으로 이루어진 훈련 집합이 제시되지 않으며, 잘못된 행동에 대해서도 명시적으로 정정이 일어나지 않는다는 점에서 일반적인 지도 학습과 다르다.

2 예시[ | ]

Q-러닝

3 같이 보기[ | ]

4 참고[ | ]

원본 주소 "https://zetawiki.com/w/index.php?title=강화학습_RL&oldid=739553"

수정 2021-04-20 생성 2017-12-14

편집자

문서 댓글 ({{ doc_comments.length }})

{{ comment.name }} {{ comment.created | snstime }}

분류 댓글:
{{cat.name.replace(/_/g,' ')}} ({{cat.cnt}})

{{comment.page_title}}
― {{comment.name}}

CC-BY-SA 3.0 · Powered by MediaWiki

개인정보처리방침 · ABOUT