Geometry and convergence of natural policy gradient methods

From MaRDI portal

Publication:6138809

Jump to:navigation, search

DOI10.1007/s41884-023-00106-zarXiv2211.02105OpenAlexW4379185386MaRDI QIDQ6138809

No author found.

Publication date: 16 January 2024

Published in: Information Geometry (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2211.02105

zbMATH Keywords

Markov decision process Hessian geometry stochastic policy natural policy gradient state-action frequency

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Cites Work

This page was built for publication: Geometry and convergence of natural policy gradient methods

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6138809&oldid=35604298"