Extreme state aggregation beyond Markov decision processes

From MaRDI portal

Publication:329613

Jump to:navigation, search

DOI10.1016/J.TCS.2016.07.032zbMATH Open1353.68236OpenAlexW2482498454WikidataQ58012178 ScholiaQ58012178MaRDI QIDQ329613FDOQ329613

Authors: Marcus Hutter

Publication date: 21 October 2016

Published in: Theoretical Computer Science (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.tcs.2016.07.032

Recommendations

zbMATH Keywords

reinforcement learning non-MDP state aggregation

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05) Markov and semi-Markov decision processes (90C40)

Cites Work

Cited In (7)

This page was built for publication: Extreme state aggregation beyond Markov decision processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q329613)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:329613&oldid=12205254"