Online Reinforcement Learning of Optimal Threshold Policies for Markov Decision Processes

From MaRDI portal

Publication:5092299

Jump to:navigation, search

DOI10.1109/TAC.2021.3108121MaRDI QIDQ5092299zbMATH OpenOpenAlexWikidataFDO

Authors Arghyadip Roy, Vivek Borkar, Abhay Karandikar, Prasanna Chaporkar

Publication date 28 July 2022

Published in IEEE Transactions on Automatic Control (Search for Journal in Brave)

Full work available at URL https://arxiv.org/abs/1912.10325

Mathematics Subject Classification ID

Systems theory; control (93-XX)

Cited in

(3)

This page was built for publication: Online Reinforcement Learning of Optimal Threshold Policies for Markov Decision Processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q5092299)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5092299&oldid=19599566"