A neural network-based policy iteration algorithm with global \(H^2\)-superlinear convergence for stochastic games on domains

DOI10.1007/s10208-020-09460-1zbMath1472.82030arXiv1906.02304OpenAlexW3027682703WikidataQ114852444 ScholiaQ114852444MaRDI QIDQ2031059

Christoph Reisinger, Kazufumi Ito, Yu-Fei Zhang

Publication date: 8 June 2021

Published in: Foundations of Computational Mathematics (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1906.02304

zbMATH Keywords

neural networks policy iteration \(q\)-superlinear convergence inexact semismooth Newton method Hamilton-Jacobi-Bellman-Isaacs equations global conergence

Mathematics Subject Classification ID

Existence of solutions for minimax problems (49J35) Finite difference methods for initial value and initial-boundary value problems involving PDEs (65M06) Stability and convergence of numerical methods for initial value and initial-boundary value problems involving PDEs (65M12) Stochastic games, stochastic differential games (91A15) Neural nets applied to problems in time-dependent statistical mechanics (82C32) Uniqueness problems for PDEs: global uniqueness, local uniqueness, non-uniqueness (35A02) Strong solutions to PDEs (35D35) Finite difference methods applied to problems in statistical mechanics (82M20)

Related Items (8)

Extensions of the deep Galerkin method ⋮ Optimal polynomial feedback laws for finite horizon control problems ⋮ Unnamed Item ⋮ Linear Convergence of a Policy Gradient Method for Some Finite Horizon Continuous Time Control Problems ⋮ State-dependent Riccati equation feedback stabilization for nonlinear PDEs ⋮ Deep ReLU network expression rates for option prices in high-dimensional, exponential Lévy models ⋮ Time-extremal navigation in arbitrary winds on conformally flat Riemannian manifolds ⋮ Regularity and Stability of Feedback Relaxed Controls

Uses Software

Cites Work

This page was built for publication: A neural network-based policy iteration algorithm with global \(H^2\)-superlinear convergence for stochastic games on domains