Multi-timescale ensemble Q-learning for Markov decision process policy optimization

From MaRDI portal

Publication:6605580

Jump to:navigation, search

DOI10.1109/tsp.2024.3372699MaRDI QIDQ6605580zbMATH OpenFDO

Authors Talha Bozkus, Urbashi Mitra

Publication date 16 September 2024

Published in IEEE Transactions on Signal Processing (Search for Journal in Brave)

Mathematics Subject Classification ID

Signal theory (characterization, reconstruction, filtering, etc.) (94A12)

This page was built for publication: Multi-timescale ensemble \(Q\)-learning for Markov decision process policy optimization

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q6605580)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6605580&oldid=40155866"