Simple and Optimal Methods for Stochastic Variational Inequalities, II: Markovian Noise and Policy Evaluation in Reinforcement Learning

From MaRDI portal

Publication:5081106

Jump to:navigation, search

DOI10.1137/20M1381691zbMath1493.90205arXiv2011.08434OpenAlexW3106200437MaRDI QIDQ5081106

Tianjiao Li, Georgios Kotsalis, Guanghui Lan

Publication date: 1 June 2022

Published in: SIAM Journal on Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2011.08434

zbMATH Keywords

variational inequality acceleration reinforcement learning temporal difference learning operator extrapolation stochastic policy evaluation

Mathematics Subject Classification ID

Analysis of algorithms and problem complexity (68Q25) Stochastic programming (90C15) Complementarity and equilibrium problems and variational inequalities (finite dimensions) (aspects of mathematical programming) (90C33) Stochastic approximation (62L20)

Related Items (3)

Variable sample-size operator extrapolation algorithm for stochastic mixed variational inequalities ⋮ Smooth monotone stochastic variational inequalities and saddle point problems: a survey ⋮ \(\mathcal{H}_\infty\) tracking learning control for discrete-time Markov jump systems: a parallel off-policy reinforcement learning

Cites Work

This page was built for publication: Simple and Optimal Methods for Stochastic Variational Inequalities, II: Markovian Noise and Policy Evaluation in Reinforcement Learning

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5081106&oldid=19579821"