Universally Measurable Policies in Dynamic Programming

From MaRDI portal

Publication:4199855

Jump to:navigation, search

DOI10.1287/MOOR.4.1.15zbMATH Open0412.90071OpenAlexW2018546408MaRDI QIDQ4199855FDOQ4199855

Authors: Dimitri P. Bertsekas, Steven Shreve

Publication date: 1979

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1287/moor.4.1.15

zbMATH Keywords

dynamic programming convergence analysis discrete time Markov decision processes analytic sets Borel spaces programming in abstract spaces universally measurable policies existence of epsilon-optimal policies

Mathematics Subject Classification ID

Dynamic programming (90C39) Minimax problems in mathematical programming (90C47) Classes of sets (Borel fields, (sigma)-rings, etc.), measurable sets, Suslin sets, analytic sets (28A05) Discrete-time control/observation systems (93C55)

Cited In (16)

This page was built for publication: Universally Measurable Policies in Dynamic Programming

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q4199855)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4199855&oldid=18050111"