Optimal Scheduling of Entropy Regularizer for Continuous-Time Linear-Quadratic Reinforcement Learning

From MaRDI portal

Publication:6180253

Jump to:navigation, search

DOI10.1137/22m1515744arXiv2208.04466WikidataQ129754889 ScholiaQ129754889MaRDI QIDQ6180253

Lukasz Szpruch, Tanut Treetanthiploet, Yu-Fei Zhang

Publication date: 19 January 2024

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2208.04466

zbMATH Keywords

linear-quadratic entropy regularization regret analysis continuous-time reinforcement learning exploratory control proximal policy update

Mathematics Subject Classification ID

Linear-quadratic optimal control problems (49N10) Stochastic learning and adaptive control (93E35) Sequential statistical design (62L05) Measures of information, entropy (94A17)

Cites Work

This page was built for publication: Optimal Scheduling of Entropy Regularizer for Continuous-Time Linear-Quadratic Reinforcement Learning

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6180253&oldid=35665321"