Multi-agent off-policy actor-critic algorithm for distributed multi-task reinforcement learning

From MaRDI portal

Publication:6092463

Jump to:navigation, search

DOI10.1016/j.ejcon.2023.100853zbMath1527.93414MaRDI QIDQ6092463

Srdjan S. Stanković, Miloš S. Stanković, Nemanja Ilić, Marko Beko

Publication date: 23 November 2023

Published in: European Journal of Control (Search for Journal in Brave)

zbMATH Keywords

convergence analysis weak convergence reinforcement learning multi-agent systems multi-task learning distributed consensus off-policy learning policy gradient actor-critic learning collaborative networks

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05) Multi-agent systems (93A16) Consensus (93D50)

Cites Work

This page was built for publication: Multi-agent off-policy actor-critic algorithm for distributed multi-task reinforcement learning

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6092463&oldid=35537584"