/胡奇英,刘建庸著
ISBN/ISSN:7-5606-0830-2
价格:CNY28.00
出版:西安 :西安电子科技大学出版社 ,2000
载体形态:273页 ;26cm
附注:国家科学技术学术著作出版基金资助出版。
简介:本书提供了处理离散时间、连续时间、半马氏等三类基本马氏决策过程模型的一般化方法。在此基础上,本书研究了状态部分可观察、多目标、带约束条件等一般化马氏决策过程以及处于随机变化环境中的马氏决策过程。
并列题名:An introduction to Markov decision processes
中图分类号:O225
责任者:胡奇英 著 刘建庸 著
豆瓣内容简介:
马尔可夫决策过程是研究随机环境下多阶段决策过程优化问题的理论工具,在过去的几十年中,随着生态科学、经济理论、通讯工程以及众多学科中需要考虑不确定因素和序列决策问题的大量新模型的涌现,进一步刺激了马尔可夫决策过程在理论上和应用领域中长足发展。本书从简单的例子开始,介绍了马尔可夫决策过程的基本概念、决策过程以及一些常用的基本理论。还介绍了多种最优准则,包括有限阶段准则、折扣准则、平均准则、权重报酬准则、概率准则等。从模型角度考虑了有限状态空间、可数状态空间和一般Borel状态空间;从决策时间上来说,考虑了离散时间、连续时间和半马氏决策时刻问题。本文还介绍了大量的应用实例以及建模方法。本书可作为高年级大学和研究生教材,也可作为运筹学、管理科学、信息科学、系统科学以及计算机科学和工程领域的学者和技术人员的参考书。
豆瓣作者简介:
分馆名 | 馆藏部门 | 图书条码 | 索书号 | 登录号 | 架位导航 | 卷期 | 状态 |
序号 | 图书条码 | 索书号 | 登录号 | 藏书部门 | 流通状态 | 年卷期 | 装订册 | 装订方式 | 装订颜色 |
类型 | 说明 | URL |
评 论 |
北京创讯未来软件技术有限公司 版权所有 ALL RIGHTS RESERVED 京ICP备 09032139
欢迎第40035337位用户访问本系统