历史百科网

序贯决策

[拼音]:xuguan juece

[外文]:sequential decision

用于随机性或不确定性动态系统优化的决策方法。序贯决策的特点是:

(1)所研究的系统是动态的,即系统所处的状态与时间有关,可周期(或连续)地对它观察;

(2)决策是序贯地进行的,即每个时刻根据所观察到的状态和以前状态的记录,从一组可行方案中选用一个优方案(即作优决策),使取决于状态的某个目标函数取优值(极大或极小值);

(3)系统下一步(或未来)可能出现的状态是随机的或不确定的。序贯决策的过程是:从初始状态开始,每个时刻作出优决策后,接着观察下一步实际出现的状态,即收集新的信息,然后再作出新的优决策,反复进行直至之后。系统在每次作出决策后下一步可能出现的状态是不能确切预知的,存在两种情况:

(1)系统下一步可能出现的状态的概率分布是已知的,可用客观概率的条件分布来描述。对于这类系统的序贯决策研究得较完满的是状态转移律具有无后效性的系统,相应的序贯决策称为马尔可夫决策过程,它是将马尔可夫过程理论与决定性动态规划相结合的产物。

(2)系统下一步可能出现的状态的概率分布不知道,只能用主观概率的条件分布来描述。用于这类系统的序贯决策属于决策分析的内容。

严正声明:本文由历史百科网注册或游客用户弘方自行上传发布关于» 序贯决策的内容,本站只提供存储,展示,不对用户发布信息内容的原创度和真实性等负责。请读者自行斟酌。同时如内容侵犯您的版权或其他权益,请留言并加以说明。站长审查之后若情况属实会及时为您删除。同时遵循 CC 4.0 BY-SA 版权协议,尊重和保护作者的劳动成果,转载请标明出处链接和本声明内容:作者:弘方;本文链接:https://www.freedefine.cn/wenzhan/33439.html

赞 ()

相关阅读

我是一个广告位
留言与评论(共有 0 条评论)
   
验证码: