Adaptive aggregation for reinforcement learning in average reward Markov decision processes

From MaRDI portal

(Redirected from Publication:378753)

Jump to:navigation, search

DOI10.1007/S10479-012-1064-YMaRDI QIDQ378753zbMATH OpenOpenAlexFDO

Authors Ronald Ortner

Publication date 12 November 2013

Published in Annals of Operations Research (Search for Journal in Brave)

Full work available at URL https://doi.org/10.1007/s10479-012-1064-y

zbMATH Keywords

Markov decision process reinforcement learning regret bounded parameter MDP

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Recommendations

Cites work

Cited in

(10)

This page was built for publication: Adaptive aggregation for reinforcement learning in average reward Markov decision processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q378753)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Adaptive_aggregation_for_reinforcement_learning_in_average_reward_Markov_decision_processes&oldid=61389216"