Convergence of entropy-regularized natural policy gradient with linear function approximation

From MaRDI portal

Publication:6587339

Jump to:navigation, search

DOI10.1137/22M1540156MaRDI QIDQ6587339FDOQ6587339

Authors: Semih Cayci, Niao He, R. Srikant

Publication date: 14 August 2024

Published in: SIAM Journal on Optimization (Search for Journal in Brave)

zbMATH Keywords

nonconvex optimization reinforcement learning policy gradient

Mathematics Subject Classification ID

Analysis of algorithms and problem complexity (68Q25) Graph theory (including graph drawing) in computer science (68R10) Computer graphics; computational geometry (digital and algorithmic aspects) (68U05)

Cites Work

This page was built for publication: Convergence of entropy-regularized natural policy gradient with linear function approximation

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q6587339)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6587339&oldid=40133674"