引用本文: | 殷保群,李衍杰,唐昊,代桂平,奚宏生.半Markov决策过程折扣模型与平均模型之间的关系[J].控制理论与应用,2006,23(1):65~68.[点击复制] |
YIN Bao-qun,LI Yan-jie,TANG Hao,DAI Gui-ping,XI Hong-sheng.Relations between discounted models and average models for semi-Markov decision processes[J].Control Theory and Technology,2006,23(1):65~68.[点击复制] |
|
半Markov决策过程折扣模型与平均模型之间的关系 |
Relations between discounted models and average models for semi-Markov decision processes |
摘要点击 2331 全文点击 2037 投稿时间:2004-04-29 修订日期:2005-04-30 |
查看全文 查看/发表评论 下载PDF阅读器 |
DOI编号 10.7641/j.issn.1000-8152.2006.1.012 |
2006,23(1):65-68 |
中文关键词 半Markov决策过程 折扣模型 平均模型 最优性方程 最优平稳策略 |
英文关键词 semi-Markov decision processes discounted model average model optimality equation optimal stationary policy |
基金项目 国家自然科学基金资助项目(60274012,60574065); 安徽省自然科学基金资助项目(050420301) |
|
中文摘要 |
首先分别在折扣代价与平均代价性能准则下,讨论了一类半M arkov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于零时的极限来得到. |
英文摘要 |
|
|
|
|
|
|