Discrete Dynamic Programming with Sensitive Discount Optimality Criteria

From MaRDI portal

Publication:5575236

Jump to:navigation, search

DOI10.1214/aoms/1177697379zbMath0183.49102OpenAlexW2001015965MaRDI QIDQ5575236

Arthur F. jun. Veinott

Publication date: 1969

Published in: The Annals of Mathematical Statistics (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1214/aoms/1177697379

zbMATH Keywords

operations research

Related Items

Variational characterizations in Markov decision processes, Approximating a diffusion by a finite-state hidden Markov model, Stability Estimation of Transient Markov Decision Processes, An efficient basis update for asymptotic linear programming, Bias optimality and strong \(n\) \((n= -1,0)\) discount optimality for Markov decision processes, Markov decision processes with a minimum-variance criterion, A two-queue polling model with priority on one queue and heavy-tailed on/off sources: a heavy-traffic limit, Optimality equations and sensitive optimality in bounded Markov decision processes¹, Solving H-horizon, stationary Markov decision problems in time proportional to log (H), A Mixed Value and Policy Iteration Method for Stochastic Control with Universally Measurable Policies, On fractional flow models and equivalent finite state processes, A canonical form for pencils of matrices with applications to asymptotic linear programs, Blackwell Optimality for Controlled Diffusion Processes, Blackwell optimal policies in a Markov decision process with a Borel state space, A generalized inverse method for asymptotic linear programming, Survey of linear programming for standard and nonstandard Markovian control problems. Part I: Theory, The multi-armed bandit, with constraints, Q-learning and policy iteration algorithms for stochastic shortest path problems, Error bounds for stochastic shortest path problems, Strong 0-discount optimal policies in a Markov decision process with a Borel state space, First passage problems for nonstationary discrete-time stochastic control systems, Reduction of total-cost and average-cost MDPs with weakly continuous transition probabilities to discounted mdps, Nonstationary Markov decision problems with converging parameters, Strong \(n\)-discount and finite-horizon optimality for continuous-time Markov decision processes, Approximations for the distribution of perpetuities with small discount rates, Recursive stochastic games with positive rewards, Stochastic Abelian and Tauberian theorems, Conditions for characterizing the structure of optimal strategies in infinite-horizon dynamic programs, Stochastic control via direct comparison, Unnamed Item, Optimal control of Markov chains admitting strong and weak interactions, Resolvent expansions of matrices and applications, Simultaneous recurrent conditions on countable state Markov chains, Average Cost Optimality Inequality for Markov Decision Processes with Borel Spaces and Universally Measurable Policies, Unnamed Item, An Efficient Factorization for the Group Inverse, Optimal threshold probability in undiscounted Markov decision processes with a target set., Denumerable semi-Markov decision chains with small interest rates, Unnamed Item, Another Set of Conditions for Strongn(n = −1, 0) Discount Optimality in Markov Decision Processes, Sample-path optimality and variance-maximization for Markov decision processes, Continuous-time Markov decision processes with \(n\)th-bias optimality criteria, Transient policies in discrete dynamic programming: Linear programming including suboptimality tests and additional constraints, Controlled jump processes, A Fixed Point Approach to Undiscounted Markov Renewal Programs, Optimal threshold probability and expectation in semi-Markov decision processes, An analysis of transient Markov decision processes, Bounds on the fixed point of a monotone contraction operator, Note on discounted continuous-time Markov decision processes with a lower bounding function, Blackwell optimality in the class of Markov policies for continuous-time controlled Markov chains, Singularly perturbed linear programs and Markov decision processes, A survey of recent results on continuous-time Markov decision processes (with comments and rejoinder), Markov decision processes and strongly excessive functions, Markov Branching Decision Chains with Interest-Rate-Dependent Rewards, Gainfree Leontief substitution flow problems, Ergodic Control, Bias, and Sensitive Discount Optimality for Markov Diffusion Processes, On the functional equations in undiscounted and sensitive discounted stochastic games, Are limits of \(\alpha\)-discounted optimal policies Blackwell optimal? A counterexample, Finite state multi-armed bandit problems: Sensitive-discount, average-reward and average-overtaking optimality, Maximum-Stopping-Value Policies in Finite Markov Population Decision Chains, Unnamed Item, On the reduction of total‐cost and average‐cost MDPs to discounted MDPs, Computation of optimal policies in discounted semi-Markov decision chains, MARKOV DECISION PROCESSES, The variational calculus and approximation in policy space for Markovian decision processes, An asymptotic simplex method for singularly perturbed linear programs, Computational Methods for Risk-Averse Undiscounted Transient Markov Models

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5575236&oldid=30201540"