Algorithms for reinforcement learning. (Q3588852)

!

WARNING

This is the item page for this Wikibase entity, intended for internal use and editing purposes.

Please use the normal view instead:

scientific article; zbMATH DE number 5782596

Language	Label	Description	Also known as
default for all languages	No label defined
English	Algorithms for reinforcement learning.	scientific article; zbMATH DE number 5782596

Statements

instance of

scholarly article

0 references

title

Algorithms for Reinforcement Learning (English)

0 references

author

Csaba Szepesvári

0 references

published in

Synthesis Lectures on Artificial Intelligence and Machine Learning

0 references

publication date

10 September 2010

0 references

zbMATH Keywords

reinforcement learning

0 references

Markov decision processes

0 references

temporal difference learning

0 references

stochastic approximation

0 references

function approximation

0 references

stochastic gradient methods

0 references

least-squares methods

0 references

overfitting

0 references

bias-variance tradeoff

0 references

online learning

0 references

active learning

0 references

planning

0 references

simulation

0 references

PAC-learning

0 references

Q-learning

0 references

actor-critic methods

0 references

policy gradient

0 references

natural gradient

0 references

describes a project that uses

R-MAX

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.2200/s00268ed1v01y201005aim009

0 references

Identifiers

zbMATH Open document ID

1205.68320

0 references

DOI

10.2200/S00268ED1V01Y201005AIM009

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:3588852