Adaptive control of discounted Markov decision chains (Q796461)

From MaRDI portal

Jump to:navigation, search

!

WARNING

This is the item page for this Wikibase entity, intended for internal use and editing purposes.

Please use the normal view instead:

Adaptive control of discounted Markov decision chains

scientific article; zbMATH DE number 3865009

Language	Label	Description	Also known as
default for all languages	No label defined
English	Adaptive control of discounted Markov decision chains	scientific article; zbMATH DE number 3865009

Statements

scholarly article

0 references

Adaptive control of discounted Markov decision chains (English)

0 references

Steven I. Marcus

0 references

Onésimo Hernández-Lerma

0 references

Journal of Optimization Theory and Applications

0 references

publication date

1985

0 references

We consider discounted-reward finite-state Markov decision processes which depend on unknown parameters. An adaptive policy inspired by the nonstationary value iteration scheme of \textit{A. Federgruen} and \textit{P. J. Schweitzer} [ibid. 34, 207-241 (1981; Zbl 0426.90091)] is proposed. This policy is briefly compared with the principle of estimation and control recently obtained by \textit{M. Schäl} [Lect. Notes Pure Appl. Math. 86, 239-253 (1983; Zbl 0525.93071)].

0 references

zbMATH Keywords

discounted-reward finite-state Markov decision processes

0 references

adaptive policy

0 references

nonstationary value iteration

0 references

MaRDI profile type

MaRDI publication profile

0 references

Nonstationary Markov decision problems with converging parameters

0 references

Dynamic programming and stochastic control

0 references

0 references

The average-optimal adaptive control of a Markov renewal model in presence of an unknown parameter

0 references

0 references

0 references

0 references

Estimation and control in Markov chains

0 references

Strongly consistent estimation in a controlled Markov renewal model

0 references

Adaptive control of service in queueing systems

0 references

Optimal adaptive control of priority assignment in queueing systems

0 references

Conditions for optimality in dynamic programming and for the limit of n-stage optimal policies to be optimal

0 references

0 references

0 references

Convergence analysis of parametric identification methods

0 references

full work available at URL

https://doi.org/10.1007/bf00938426

0 references

Recommended article

Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes

Similarity Score

0.8918963074684143

Recommender Run

Recommender Run 4

0 references

Similarity Score

0.8857804536819458

Recommender Run

Recommender Run 4

0 references

Nonstationary value-iteration and adaptive control of discounted semi- Markov processes

Similarity Score

0.8774420619010925

Recommender Run

Recommender Run 4

0 references

Similarity Score

0.8732749223709106

Recommender Run

Recommender Run 4

0 references

Similarity Score

0.873055100440979

Recommender Run

Recommender Run 4

0 references

Identifiers

zbMATH Open document ID

0 references

10.1007/BF00938426

0 references

Mathematics Subject Classification ID

0 references

zbMATH DE Number

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Adaptive control of discounted Markov decision chains

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q796461&oldid=64403967"