Policy gradient methods for discrete time linear quadratic regulator with random parameters

From MaRDI portal

Revision as of 14:41, 28 November 2024 by Import241128011130 (talk | contribs) (Created automatically from import241128011130)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:6491779

Jump to:navigation, search

DOI10.1051/cocv/2024014MaRDI QIDQ6491779

Publication date: 24 April 2024

Published in: European Series in Applied and Industrial Mathematics (ESAIM): Control, Optimization and Calculus of Variations (Search for Journal in Brave)

zbMATH Keywords

reinforcement learning random parameters linear quadratic optimal control sub-Gaussianity model-free policy gradient method

Mathematics Subject Classification ID

Analysis of algorithms (68W40) Linear-quadratic optimal control problems (49N10) Stochastic learning and adaptive control (93E35)

This page was built for publication: Policy gradient methods for discrete time linear quadratic regulator with random parameters

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6491779&oldid=37949076"