A Stochastic Composite Augmented Lagrangian Method for Reinforcement Learning

From MaRDI portal

Publication:6161305

Jump to:navigation, search

DOI10.1137/21m1421726zbMath1519.90109arXiv2105.09716OpenAlexW3160601834MaRDI QIDQ6161305

ZaiWen Wen, Yongfeng Li, Wei-Jie Chen, Mingming Zhao

Publication date: 27 June 2023

Published in: SIAM Journal on Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2105.09716

zbMATH Keywords

linear programming augmented Lagrangian method off-policy learning deep reinforcement learning

Mathematics Subject Classification ID

Nonconvex programming, global optimization (90C26) Linear programming (90C05) Stochastic programming (90C15) Optimal stochastic control (93E20) Markov and semi-Markov decision processes (90C40)

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6161305&oldid=35634889"