Temporal-difference search in Computer Go

From MaRDI portal

(Redirected from Publication:420936)

Jump to:navigation, search

DOI10.1007/S10994-012-5280-0MaRDI QIDQ420936zbMATH OpenOpenAlexFDO

Authors David Silver, Richard S. Sutton, Martin Müller

Publication date 23 May 2012

Published in Machine Learning (Search for Journal in Brave)

Full work available at URL https://doi.org/10.1007/s10994-012-5280-0

zbMATH Keywords

reinforcement learning Computer Go Monte Carlo search simulation based search temporal-difference learning

Mathematics Subject Classification ID

Monte Carlo methods (65C05) Markov and semi-Markov decision processes (90C40) Combinatorial games (91A46) Computational methods for problems pertaining to game theory, economics, and finance (91-08)

Recommendations

Cites work

Cited in

(13)

This page was built for publication: Temporal-difference search in Computer Go

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q420936)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Temporal-difference_search_in_Computer_Go&oldid=61740630"