Convergence results for single-step on-policy reinforcement-learning algorithms

From MaRDI portal

Publication:1568533

Jump to:navigation, search

DOI10.1023/A:1007678930559zbMath0954.68127OpenAlexW2150339816MaRDI QIDQ1568533

Could not fetch data.

Publication date: 21 June 2000

Published in: (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1023/a:1007678930559

zbMATH Keywords

Could not fetch data.

Mathematics Subject Classification ID

Could not fetch data.

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1568533&oldid=13850368"