scientific article; zbMATH DE number 6902561

From MaRDI portal

Revision as of 12:03, 7 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:4576234

Jump to:navigation, search

DOI10.3233/978-1-61499-672-9-1026zbMath1396.90053MaRDI QIDQ4576234

Shalabh Bhatnagar, Ajin George Joseph

Publication date: 12 July 2018

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

Mathematics Subject Classification ID

Nonconvex programming, global optimization (90C26) Learning and adaptive systems in artificial intelligence (68T05) Stochastic programming (90C15)

Related Items (3)

An incremental off-policy search in a model-free Markov decision process using a single sample path ⋮ An Incremental Fast Policy Search Using a Single Sample Path ⋮ An online prediction algorithm for reinforcement learning with linear function approximation using cross entropy method

This page was built for publication:

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4576234&oldid=18712770"