[拼音]:suiji bijin
[外文]:stochastic approximation
在有随机误差干扰的情况下,用逐步逼近的方式估计某一特定值的数理统计方法。1951年,H.罗宾斯和S.门罗首先研究了此问题的一种形式:设因素x的值可由试验者控制,x的“响应”的指标值为Y,当取x之值x进行试验时,响应Y可表为Y=h(x)+ε,式中h(x)为一未知函数,ε为随机误差。设目标值为A,要找这样的x,使h(x)=A。分别以Y-A和h(x)-A代替Y和h(x)。不妨设A=0,问题就在于找方程h(x)=0的根x。例如若x为施药量,Y为衡量药物反应的某种生理指标,则问题在于找出施药量x,以使该生理指标控制于适当的值A。
若随机误差 ε=0,且h(x)为已知函数,则数值分析中提供了许多近似解法。例如可用牛顿迭代法求解:从一适当选择的初始值x0出发,用迭代公式xi+1=xj+αjyj,式中yj=h(xj);但当h(x)未知且有随机误差干扰时,αj和yj无法算出。罗宾斯等将上述算法稍作修改,引进迭代程序xi+1=xj-bjYj,式中Yj为当x=xj时Y的响应值,bj为适当选定的常数。假定 h(x)为x的递增函数且增长速度不快于线性,而各次量测相互独立,则理论研究证明了,只要取bj>0满足则由此算法决定的序列{xj}以概率1收敛到x(见概率论中的收敛)。上述算法叫罗宾斯-门罗程序,这是随机逼近的开创性的工作。
在有的问题中,要找的不是h(x)的零点,而是其极值点慜,它满足h′(慜)=0。但试验观测到的不是h′(x)+ε而只是h(x)+ε,故上述算法不能用于逼近慜。J.基弗和J.沃尔弗维茨依据用差商逼近h′(x)的想法在 1952年提出了一个算法(基弗-沃尔弗维茨程序)以解决估计慜的问题。
1951年以来,随机逼近的研究已取得了很大的进展。在理论上,讨论了量测误差不独立的情形和带约束条件的情形,以及h(x)具有更一般性质的情形。也考虑了时间连续时的算法和修正系数bj的选择,并对算法的渐近性质作了深入的研究。在方法上,也从纯概率发展到结合使用微分方程等工具。随机逼近在优化问题、适应控制、调节及跟踪系统等方面都有应用。
参考书目
M.T.Wasan,Stochastic ApproxiMation,cambridge Univ. Press,cambridge,1969.
H.Robbins and S.Monro,A Stochastic Approximation Method,Ann. Math. Statist.,Vol.22(1),1951.
严正声明:本文由历史百科网注册或游客用户堰维自行上传发布关于» 随机逼近的内容,本站只提供存储,展示,不对用户发布信息内容的原创度和真实性等负责。请读者自行斟酌。同时如内容侵犯您的版权或其他权益,请留言并加以说明。站长审查之后若情况属实会及时为您删除。同时遵循 CC 4.0 BY-SA 版权协议,尊重和保护作者的劳动成果,转载请标明出处链接和本声明内容:作者:堰维;本文链接:https://www.freedefine.cn/wenzhan/134252.html