쉬운 강화학습 설명 (1) 썸네일형 리스트형 [RL] 강화학습 쉽게 이해하기 강화학습에 대한 기초를 다시 한 번 간결하게 정리해보는데에 도움을 줄 수있는 글입니다. 강화학습은 특정 목적을 달성하기 위해,순차적인 의사결정 문제를 푸는 방법을 배우는 도구입니다 반복된 시도와 오류를 통해, 행동에 대한 보상 (reward) 을 받습니다.이는 사람이 무엇을 배울때 반복된 경험을 통한 피드백을 받고 배우는 것과 유사합니다이 학습을 딥러닝의 뉴럴 네트워크를 이용하여 모델링 하는 것이 Deep RL 입니다. 그러면 이 작업을 수행할 대상들이 있어야겠죠?에이전트 = model. 습득을 하는 주체환경 = world. 습득을 할 수 있는 환경 Agent 의 목표목적을 위해 학습하는 에이전트가 하는 일은 ? 상태 관찰행동 실행보상 받기즉, 주어진 환경에서 행동하는 에이전트가 어떤 액션을 하는 것이.. 이전 1 다음