Policy space identification in configurable environments

From MaRDI portal

Publication:2163245

Jump to:navigation, search

DOI10.1007/s10994-021-06033-3OpenAlexW3196519516MaRDI QIDQ2163245

Guglielmo Manneschi, Alberto Maria Metelli, Marcello Restelli

Publication date: 10 August 2022

Published in: Machine Learning (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1909.03984

zbMATH Keywords

likelihood ratio test reinforcement learning configurable Markov decision processes policy space identification

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Uses Software

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2163245&oldid=14680371"