Provably efficient offline reinforcement learning with trajectory-wise reward

From MaRDI portal

Publication:6670141

Jump to:navigation, search

DOI10.1109/TIT.2024.3427141MaRDI QIDQ6670141zbMATH OpenFDO

Authors Tengyu Xu, Yue Wang, Shaofeng Zou, Yingbin Liang

Publication date 23 January 2025

Published in IEEE Transactions on Information Theory (Search for Journal in Brave)

Mathematics Subject Classification ID

Information and communication theory, circuits (94-XX)

This page was built for publication: Provably efficient offline reinforcement learning with trajectory-wise reward

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q6670141)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6670141&oldid=40256344"