Time-inconsistent risk-sensitive equilibrium for countable-stated Markov decision processes (Q2232770)

From MaRDI portal

Jump to:navigation, search

scientific article

Language	Label	Description	Also known as
English	Time-inconsistent risk-sensitive equilibrium for countable-stated Markov decision processes	scientific article

Statements

scholarly article

0 references

Time-inconsistent risk-sensitive equilibrium for countable-stated Markov decision processes (English)

0 references

0 references

Applied Mathematics and Optimization

0 references

publication date

8 October 2021

0 references

full work available at URL

https://arxiv.org/abs/1909.06863

0 references

Consider an integer-valued Markov decision process \(X_t; t=1,2,\dots,T\), which dynamics is described by transition probabilities \[\Pr(X_{t+1}=j|X_t=i,u_t(i))=q_t^{\varepsilon}(j;i,u_t(i)),\] where \(q_t^{\varepsilon}(j;i,u_t(i))\geq 0\), \(\sum_{j \in \mathbb{Z}}q_t^{\varepsilon}(j;i,u_t(i))=1\). Here \(u_t(i) \in U\) stands for currently chosen action, \(U\) is a complete metric space. Given strategy \(\pi_t=\{u_s(X_s)\}_{s=t}^T\) and initial condition \(X(t)=x\), the time-inconsistent \(\varepsilon\)-risk-sensitive cost functional is defined as \[ J^{\varepsilon}_{\tau,t}(x,\pi_t)=\varepsilon \log \mathbf{E}_{t,x}^{\varepsilon,\pi_t} \left[\varepsilon^{-1}\left(\sum_{s=t}^T f_{\tau,s}(X_s,u_s(X_s))+g_\tau(X_{T+1})\right)\right] \] for each \(t \in \{1.\dots,T\}\), \(\tau \in \{1.\dots,T\}\), where \(f(\cdot), g(\cdot)\) are cost functions, \(J_{\tau,t}(x,\pi_t)=\limsup_{\varepsilon \to +0} J^{\varepsilon}_{\tau,t}(x,\pi_t)\). Corresponding value functions are \(J^{\varepsilon}_{t,t}(x,\pi_t), J_{t,t}(x,\pi_t)\). In the article a time-inconsistent \(\varepsilon\)-risk-sensitive equilibrium, which verifies some step-optimality of control strategy \(\pi_t\) with respect to the cost functional \(J^{\varepsilon}_{t,t}(x,\pi_t)\), is established. As \(\varepsilon \to +0\), convergence of the \(\varepsilon\)-risk-sensitive equilibrium and corresponding value functions is proved. Some illustrative examples are given.

0 references

Alex V. Kolnogorov

0 references

zbMATH Keywords

Markov decision processes

0 references

risk-sensitive control problem

0 references

large deviation principle

0 references

time-inconsistent equilibrium

0 references

Bellman principle of optimality

0 references

MaRDI profile type

MaRDI publication profile

0 references

Nonzero-Sum Risk-Sensitive Stochastic Games on a Countable State Space

0 references

Markov decision processes with applications to finance.

0 references

Partially Observable Risk-Sensitive Markov Decision Processes

0 references

Risk-sensitive capacity control in revenue management

0 references

More Risk-Sensitive Markov Decision Processes

0 references

Risk sensitive control of finite state Markov chains in discrete time, with applications to portfolio management

0 references

A theory of Markovian time-inconsistent stochastic control in discrete time

0 references

On time-inconsistent stochastic control in continuous time

0 references

The vanishing discount approach in Markov chains with risk-sensitive criteria

0 references

Discounted Approximations for Risk-Sensitive Average Criteria in Markov Decision Chains with Finite State Space

0 references

Risk-Sensitive Control of Discrete-Time Markov Processes with Infinite Horizon

0 references

0 references

The golden rule when preferences are time inconsistent

0 references

Investment and consumption without commitment

0 references

Controlled Markov processes and viscosity solutions

0 references

Risk-sensitive control of continuous time Markov chains

0 references

Risk-Sensitive Markov Decision Processes

0 references

Time-Inconsistent Stochastic Linear--Quadratic Control

0 references

Average optimality for risk-sensitive control with general state space

0 references

A variance minimization problem for a Markov decision process

0 references

Equilibrium strategies for time-inconsistent stochastic switching systems

0 references

0 references

Time-Inconsistent Recursive Stochastic Optimal Control Problems

0 references

Deterministic time-inconsistent optimal control problems -- an essentially cooperative approach

0 references

Time-inconsistent optimal control problems and the equilibrium HJB equation

0 references

Identifiers

zbMATH Open document ID

0 references

10.1007/s00245-020-09690-3

0 references

Mathematics Subject Classification ID

0 references

0 references

zbMATH DE Number

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:2232770

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q2232770&oldid=36721019"