英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
分段近似贝叶斯计算:使用因式后验分布的离散马尔科夫模型的快速推理
S.R. White·T.Kypraios·S.P.Preston
收到:2012年12月17日/接受:2013年10月24日/在线发布:2013年11月29日
copy;作者2013年。本文在Springerlink.com上以开放存取的方式发布.
摘要:许多现代的统计学上的应用涉及似然函数很难计算甚至不可能计算的复杂随机模型,因此常规的基于似然的推理技术不能使用。在这样设置中,贝叶斯推论可以通过近似贝叶斯计算展现(ABC)。然而,尽管ABC方法有很大的发展,在许多的应用中,ABC的计算费用 有必要进行汇总统计选择和公差可能严重偏向后验估计。
我们提出一个新的“分段的”ABC逼近适合观察到的离散马尔可夫模型,其中该马尔可夫模型涉及到将参数的后验概率密度写成一个因素的产物。逼近可以避免选择汇总统计的以及可以设置严格的公差的优点,得到的是后面的“更少近似”。对每个因素,我们调查了两种基于ABC样本估计得后验概率密度的两种方法:第一种方法是运用对每个因素高斯逼近,第二种方法是运用内核密度估计。两种方法都有它们的优点。对于许多运用,高斯逼近简单,快捷和合适。另一方面,当ABC样本数目趋于无穷,使用核密度估计有利于一贯地估计分段ABC后验。我们列举了四个关于分段ABC逼近例子;在每个例子中,这个逼近提供了快捷和精准的推理。
关键词:近似贝叶斯逼近计算 模拟 随机Lotka-Volterra
1 介绍
在物理科学中,随机模型被广泛运用于模型程序中(Wilkinson 2011a;Van Kampen 2007)。对于许多这样的模型,运用如最大似然估计的常规推理技术来计算似然比是很难,花费很多,并且不可行。但是,若可能从一个模型中模拟出似然比,如近似贝叶斯计算(ABC)的“隐含”方法的推理不用计算似然比。这些方法是在人口遗传学(Pritchard et al. 1999)和人口统计(Beaumont et al. 2002)中发展起来的,但是现在被广泛应用于许多领域,比如包括流行病学(McKinley et al. 2009),物种进化(Tom et al. 2009),金融(Dean et al. 2011)和病原体的进化(Gabriel et al. 2010)。
直观地,ABC方法涉及模拟数据该模型使用各种参数值进行推理基于哪些参数值产生实现这与观察到的数据“接近”。令数据为一个包括在时间点处可能的向量状态变量。
我们假设数据由一个作为推理目标的被向量参数化的马尔可夫随机模型(其中包括作
为特殊情况的IID数据)产生,并且我们用表示给定一个特定的值数据的概率密度。关于先验信念经过由被表示的密度表达。算法1从贝叶斯后验密度生成准确的样本,其中贝叶斯后验密度与成比例。
算法1 精确贝叶斯计算(EBC) |
1:从中抽取 |
2:从使用参数的模型中模拟数集 |
3:如果,则接受,否则拒绝 |
4:重复 |
算法2 近似贝叶斯计算(ABC) |
如算法1,但是第3步被换为: |
3rsquo;:若,则接受,否则拒绝 |
如果是离散的,该算法只是实际使用,否则步骤3中的验收概率为零。对于连续分布,或其中步骤3中的接受概率是不可接受的低的离散的,Pritchard et al. (1999)建议算法2里面是距离函数,通常认为在争论间的不同的;是数据的函数;是容忍度。标记为识别函数,但是在实际应用中,为了给出接受率,通常将其视为包含表征数据关键方面的汇总统计的低维向量。
ABC算法的输出是一个从ABC后验密度中的一个样本。假设对于是足够的,则当时,ABC后验密度收敛于(Marin et al. 2012)。然而,在实际应用中,用充足的或者令很小(或者为0)是基本不可能。因此ABC要求仔细选择和来使得接受率容许很大,同时试图不使ABC后验与真实后验不同。换句话说,有一个平衡,涉及由于选择和公差而将蒙特卡罗误差与“ABC误差”混淆。
在过去的几十年中,原始ABC算法已经被广泛地扩展,包括马尔科夫链蒙特卡罗模拟(MCMC)(Marjoram等人,2003)和顺序实施(Toni等人,2009;Dean and Singh 2011),纳入辅助回归模型(Beaumont等人,2002;Blum and Franccedil;ois 2010)和(半)自动选择汇总统计(Fearnhead and Prangle 2012);看Marin等人 (2012)评论。在所有这些ABC变体中,计算成本仍然是一个中心问题,因为总是计算成本决定了控制蒙特卡罗误差与使用汇总统计量和/或非零容差产生的控制偏差之间的平衡。
在本文中,我们提出一种称为分段ABC(PW-ABC)的新型算法,其目的是大幅度降低ABC的计算成本。该算法适用于特定(但相当广泛)的模型类别,即具有马尔科夫属性的模型,并且可以在离散时间点观察状态变量。算法基于后验密度的因式分解,使得每个因子仅对应于数据的子集。这个想法是对每个因子(计算上非常便宜的任务)应用算法2,以计算每个因子的密度估计,然后估计全后验密度作为这些因子的乘积。利用因式分解可以降低ABC的计算负担,从而可以完全避免总结统计量和容差的选择以及伴随的偏差。
在下一节中,我们将更详细地描述PW-ABC。该方法的主要实际问题是如何使用每个后验因子的ABC样本来估计完整的后验密度。我们讨论了两种估算密度相关密度和密度乘积的方法,然后使用两种方法对PW-ABC进行了四个例子:一个推测二项式实验中成功概率的玩具说明性例子,随机微分方程模型,一个自回归时间序列模型和一个动态捕食者-猎物模型。 我们最后讨论了PW-ABC的优势和局限性,以及潜在的进一步概括。
2 分片ABC(PW-ABC)
我们的出发点是使用马尔可夫属性写出似然:
(1)
第一个数据点的似然贡献可以被包括在推论中,但是这个贡献随着观测次数n的增加而渐近无关,我们从此遵循常规做法,在(1)中忽略。考虑到这一点,并且通过使用贝叶斯定理的多个定理,后验密度可以用以下分解形式写出,
算法3 分片近似贝叶斯计算(PW-ABC) |
i=2,...,n a:用ABC算法从隐含的ABC密度中抽取m个近似值样本(如果和,或者取精确值); b:运用样本以及(6)或(12),计算的密度估计 结束 将密度估计带入(3)中来计算的估计 |
(2)
其中:
本质上,在(2)中,给定全数据的的后验密度已经被分解为涉及密度的乘积,每一个只取决于一对数据。
现在的关键是运用ABC从每个密度来描绘近似样本。运用算法2,(i)从中描绘,(ii)模拟,,和(iii)如果,接受。从被绘制的样本(如果和,)中,我们用来表示隐含的ABC密度。从每个,我们通过重复(i)-(iii)来生成个绘制点的样本,即。现在,假设是密度(因此为密度)的一个基于样本的估计。则后验密度(2)可以通过(3)估计:
(3)
其中 (4)
PW-ABC的步骤在算法3中总结了。
分段方法的基本原理是减少ABC的尺寸,用多个低维度代替高维问题。在标准ABC中,摘要统计量是用于减小维数的工具,但是在PW-ABC中,由于(2)中的因式分解,维数已经减少,所以我们可以采用,通常使用更小的。
如何计算密度估计的问题仍然存在。下面我们讨论两种方法:(i)使用高斯近似,和(ii)使用核密度估计。此后,基于(i)的量由上标表示,并且基于(ii)的量由上标表示。
在这两种情况下,我们讨论了渐近政权中估计量的行为观察值保持固定,而当时,每个ABC样本的大小增加。
2.1 的高斯逼近
用均值和协方差表示维多元高斯密度,
(5)
对于的一个高斯逼近是
(6)
其中,,是ABC后验样本的样本均值和样本协方差。使用(6)的结果是密度近似的乘积也是高斯(通常是非标准化):
(7)
其中, (8)
(9)
(10)
(11)
我们注意到近似(6)的以下属性(参见Mardia等人,1979)。如果从被描绘的的密度是高斯,即,和是分别是和的无偏估计,因此和是的真实均值和协方差的一致估计。更一般地说,对于不是高斯的,和是使Kullback-Leibler发散最小化的高斯密度真实均值和协方差的一致估计,
;
即对每个,渐近地为的“最优”高斯近似。然而,对密度乘积没有这样的相关的最优性:其中每一个在方向上最接近于的高斯的(归一化)乘积通常不是最接近(归一化版本);实际上它可能是非常大的不同。换句话说,如时,和一般不要最小化。
2.2 的核密度估计
我们考虑的第二种方法是使用核密度估计来估计每个密度(参见Silverman 1986,Wand和Jones 1995)。基于高斯核函数的核心密度估计(5)是
(12)
其中是带宽矩阵。我们遵循Fukunaga(1972)在选择带宽矩阵的方法,使得核的形状模拟样本的形状,特别是通过将与样本协方差矩阵成正比。用带宽矩阵
(13)
其中是与无关的常数,且确保作为样本大小的合适行为。特别的,就小(即,当时,)和期望E而言,使用带宽(13),(Wand and Jones 1995)的温和规律性条件,
(14)
(15)
从(14)-(15),偏差,方差和和平均综合平方误差,都是
(16)
这些结果常规地推广到核密度估计的乘积的情况下,也就是说,其中被用作的估计量。因此,由于对于所有的是独立的,然后,运用(14)-(15),
,
,
。
因此,在由后一方程定义的意义上,密度估计收敛到真密度,当。
关于(13)中的选择,在某些设置中可以确定最优值。假设真密度是高斯,并且(12)中的是的核密度估计。
(17)
然后,在(13)是(16)的大型渐近扩展的最大化带宽的无偏差和一致的估计量的意义上,则是最优的。参阅Wand and Jones(1995,p.111)。然而,类似的计算更多地涉及产品案例:即使假设每个是高斯的,则的闭合表达式是可能的。因此,在下一节的例子中,第4部分,由Wand和Jones(1995)描述我们选择以启发式方式调整,一个大的(在(17)十次)中开始,然后手动减少,直到“随机”波动开始出现在密度估计中。
使用高斯核函数的结果
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[26356],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。