Smoothed functional-based gradient algorithms for off-policy reinforcement learning: a non-asymptotic viewpoint

From MaRDI portal

Publication:2242923

Jump to:navigation, search

DOI10.1016/j.sysconle.2021.104988OpenAlexW3185667776WikidataQ115036591 ScholiaQ115036591MaRDI QIDQ2242923

L. A. Prashanth, Nithia Vijayan

Publication date: 10 November 2021

Published in: Systems \& Control Letters (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2101.02137

zbMATH Keywords

reinforcement learning gradient estimation off-policy smoothed functional

Mathematics Subject Classification ID

Artificial intelligence (68Txx)

Cites Work

This page was built for publication: Smoothed functional-based gradient algorithms for off-policy reinforcement learning: a non-asymptotic viewpoint

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2242923&oldid=14789105"