Pessimistic value iteration for multi-task data sharing in offline reinforcement learning

From MaRDI portal

Publication:6152665

Jump to:navigation, search

DOI10.1016/J.ARTINT.2023.104048MaRDI QIDQ6152665zbMATH OpenFDO

Authors

Publication date 13 February 2024

Published in Artificial Intelligence (Search for Journal in Brave)

zbMATH Keywords

uncertainty quantification data sharing offline reinforcement learning pessimistic value iteration

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Recommendations

Cites work

Cited in

(2)

This page was built for publication: Pessimistic value iteration for multi-task data sharing in offline reinforcement learning

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q6152665)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6152665&oldid=35624409"