curse of dimensionality1 마르코프 결정 프로세스: 불확실성 속에서의 의사결정 모델링 마르코프 결정 프로세스: 불확실성 속에서의 의사결정 모델링마르코프 결정 프로세스(Markov Decision Process, MDP)는 불확실한 환경에서 순차적 의사결정을 모델링하는 수학적 프레임워크입니다. 이 프레임워크는 강화학습, 로봇공학, 자율주행, 경제학, 운영 연구 등 다양한 분야에서 중요한 이론적 기반을 제공합니다. 이 글에서는 MDP의 기본 개념, 구성 요소, 해결 방법 및 실제 응용 사례를 살펴보겠습니다.마르코프 결정 프로세스란?마르코프 결정 프로세스는 다음과 같은 상황을 모델링합니다:의사결정자(agent)가 존재환경은 여러 상태(state)로 구성됨의사결정자는 각 상태에서 여러 행동(action) 중 하나를 선택할 수 있음행동의 결과로 새로운 상태로 전이하고 보상(reward)을 받음이 .. 2025. 3. 28. 이전 1 다음