Value function based reinforcement learning in changing Markovian environments

From MaRDI portal

Publication:3096166

Jump to:navigation, search

zbMATH Open1225.68169MaRDI QIDQ3096166FDOQ3096166

Authors: Balázs Csanád Csáji, László Monostori

Publication date: 8 November 2011

Full work available at URL: http://www.jmlr.org/papers/v9/csaji08a.html

Recommendations

zbMATH Keywords

Markov decision processes reinforcement learning changing environments value function bounds \((\epsilon \delta )\)-MDPs stochastic iterative algorithms

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05) Markov and semi-Markov decision processes (90C40)

Cited In (7)

This page was built for publication: Value function based reinforcement learning in changing Markovian environments

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q3096166)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3096166&oldid=16166040"