Bisimulation Metrics for Continuous Markov Decision Processes

From MaRDI portal

Revision as of 23:02, 3 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:3225169

Jump to:navigation, search

DOI10.1137/10080484XzbMath1253.39018MaRDI QIDQ3225169

Prakash Panangaden, Doina Precup, Norm Ferns

Publication date: 15 March 2012

Published in: SIAM Journal on Computing (Search for Journal in Brave)

zbMATH Keywords

linear programming; Markov decision process; reinforcement learning; bisimulation; metrics; continuous; statistical sampling

Mathematics Subject Classification ID

60J25: Continuous-time Markov processes on general state spaces

91G80: Financial applications of other theories

37H10: Generation, random and stochastic difference and differential equations

39A30: Stability theory for difference equations

39A50: Stochastic difference equations

Related Items

Probabilistic Model Checking of Labelled Markov Processes via Finite Approximate Bisimulations, Bisimulation for Markov Decision Processes through Families of Functional Expressions, Random Measurable Selections, A pseudometric in supervisory control of probabilistic discrete event systems, Adaptive aggregation for reinforcement learning in average reward Markov decision processes, Polynomial-time algorithms for computing distances of fuzzy transition systems, Weak bisimulation is sound and complete for pCTL\(^*\), An algebraic approach for inferring and using symmetries in rule-based models, Pseudometrics for State Aggregation in Average Reward Markov Decision Processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3225169&oldid=16372425"