Multi-agent natural actor-critic reinforcement learning algorithms

From MaRDI portal

Publication:6159507

Jump to:navigation, search

DOI10.1007/s13235-022-00449-9zbMath1519.91063arXiv2109.01654OpenAlexW3198538443MaRDI QIDQ6159507

Nandyala Hemachandra, Prashant Trivedi

Publication date: 20 June 2023

Published in: Dynamic Games and Applications (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2109.01654

zbMATH Keywords

Fisher information matrix non-convex optimization stochastic approximations networked agents function approximations actor-critic methods algorithms for better local minima local optima value comparison natural gradients quasi second-order methods traffic network control

Mathematics Subject Classification ID

Traffic problems in operations research (90B20) Distributed algorithms (68W15) Algorithmic game theory and complexity (91A68)

Related Items

Special issue: multi-agent dynamic decision making and learning

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6159507&oldid=35635001"