On the Empirical State-Action Frequencies in Markov Decision Processes Under General Policies

From MaRDI portal

Publication:5704236

Jump to:navigation, search

DOI10.1287/MOOR.1050.0148zbMATH Open1082.90131OpenAlexW2136937392MaRDI QIDQ5704236FDOQ5704236

Authors: Shie Mannor, John N. Tsitsiklis

Publication date: 11 November 2005

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://semanticscholar.org/paper/1c93280ca091393d0653ef1e21874f761d6b3653

Recommendations

zbMATH Keywords

large deviations Markov decision processes empirical measure state-action frequencies

Mathematics Subject Classification ID

Convergence of probability measures (60B10) Limit theorems in probability theory (60F99) Markov and semi-Markov decision processes (90C40)

Cited In (6)

This page was built for publication: On the Empirical State-Action Frequencies in Markov Decision Processes Under General Policies

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q5704236)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5704236&oldid=30437834"