英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
一种更好估计人口趋势的方法
Jean-Yves Humbert, L. Scott Mills, Jon S. Horne and Brian Dennis
从丰度数据的时间序列估计群体趋势是生态学中的重要任务,但是这种估计在实践中在逻辑上和概念上仍然是具有挑战性的。首先,由于缺失观察或不规则抽样,折衷趋势估计在时间序列中的不等间隔的程度不是众所周知的。此外,主要趋势估计方法(丰度数据对时间的对数线性回归)忽略可能的过程噪声,而另一种替代方法(“扩散近似”)忽略了在丰度数据中的观测误差。适用于同时存在过程噪声和观测误差的状态空间模型存在,但是很少被使用。我们研究了一种适用于指数生长状态空间(EGSS)的模型,以便在时间序列中含有缺失的数据时使用,同时我们将其趋势估计与现状方法进行比较。EGSS模型在时间序列长度和变化来源有广泛的范围时提供了更好的估计趋势。EGSS模型的性能,即使在时间序列缺失一半的计数,意味着趋势估计可以通过将功能从年度监测和增加时间序列长度或提高收集年份数据的丰度估计精度的转换来改进。
估计人口的变化率或趋势是基本和应用生态学的一个根本挑战。人口趋势可以定义为每单位时间对数丰度的平均变化(Dennis et al. 1991, Link and Sauer 1998)。虽然趋势可以从年龄或特定的阶段生命率来估计,但是通常通过枚举随时间收集的丰度数据,丰度估计或丰度指数(Morris et al.2002,Marsh and Trenham 2008)来估计。生态时间序列模型,丰度数据从时间到单个人口过渡,可以并入其他因素,例如环境协变量(Dennis and Otten 2000),相关协变量(Link and Sauer 1997)和密度依赖性(James et al. 1996, Brook and Bradshaw 2006, Dennis et al. 2006)。然而,数据支持这种分析通常是不容易获得的。(例如:协变量在近5000个人口的时间序列中大多不存在,来自于全球人口动态保持数据库;见Fagan et al. (2001),Inchausti and Halley(2001) and Brook et al. (2006))。因此,缺乏协变量的指数生长模型是最常用的用于趋势估计的应用中(Sabo et al. 2004)。
对从丰度数据估计简单指数趋势感兴趣的生态学家通常面临四个主要挑战。 首先,时间序列的长度短,经常只有5〜10个时间步长(例如几年),并且很少超过30个。第二,时间序列通常具有不等的时间间隔,这是由于资金,后勤或人员限制导致的观察结果缺失引起的。第三,丰度数据的方差来自于环境噪声和观测或者丰度数据本身的估计误差的一些经常未知的组合。最后,存在不同的统计方法来估计时间序列丰度数据的趋势,而对于相对性能没有指导。
目前,在时间序列中适应不等间隔的两种方法最常用来估计趋势(表1)。 最古老,主导的方法是数量对时间的对数线性回归,其中回归的斜率给出群体趋势(Caughley 1977, Gerrodette 1987, Eberhardt and Simmons 1992)。我们将其称为指数生长观察误差(EGOE)模型,因为它默认假设数据中的变化纯粹是由于抽样或“观察误差”引起的,其中群体本身被确定性指数生长控制(补充材料附录1)。
用于估计指数趋势参数的第二种方法是假设群体被调查(即没有观察误差),并且丰度变异性是完全是由于环境变率或“过程噪声”引起的生长速率波动(Dennis et al. 1991,Lande et al. 2003)。该方法需要通过具有恒定漂移率的布朗运动扩散过程来描述对数标度上的丰度。我们将其称为指数生长过程噪声(EGPN)模型。
表1:EGOE(指数生长观察误差),EGPN(指数生长过程噪声)
和EGSS(指数生长状态空间)方法的典型实例应用,来估计动物群体趋势参数
应用 |
分类单位 |
引证 |
EGOE(对数线性方法) |
||
确定当代衰退 |
考拉 |
Phillips 2000 |
评估衰退 |
常见的青蛙 |
Meyer et al. 1998 |
确定人口增长率 |
牛羚,水牛,斑马 |
Grange et al. 2004 |
估计濒危物种的生长速率 |
小袋鼠 |
Fisher et al. 2000 |
估计人口增长率 |
ibex |
Largo et al. 2008 |
EGPN(扩散近似法) |
||
预测灭绝概率 |
35稀有繁殖鸟种 |
Gaston and Nicholls 1995 |
预测灭绝概率 |
山格雷姆红松鼠 |
Buenau and Gerber 2004 |
预测灭绝概率 |
海角山斑马 |
Watson et al. 2005 |
EGSS(状态空间方法) |
||
估计人口增长和灭绝参数 |
海獭和黄石北美灰熊 |
Lindley 2003 |
确定空间相关性如何影响PVA |
奇努克三文鱼 |
Hinrichsen 2009 |
有趣的是,EGPN估计已广泛用于估计人口活力分析(PVA)的趋势参数,但很少用于简单描述人口趋势(表1)。
最近开发的用于估计趋势的第三种方法使用一种假设观测误差和环境过程噪声同时存在的随机“状态空间”指数生长模型(Holmes 2001, Lindley 2003, Staples et al. 2004,Dennis et al. 2006)。我们称这是指数增长状态空间(EGSS)模型。估计是基于以下认识:EGSS模型可以被写为线性混合模型(Staples et al. 2004),从而使得可能通过用于分析的软件进行有混合随机和固定效应的方差计算。当相应的方差参数接近零时,EGOE和EGPN模型可以在这种限制特殊情况使用。最近,Staudenmayer和Buonaccorsi(2006)在线性混合模型框架中缩放观察值,以允许在有不等间隔的时间间隔时使用。EGSS模型可以容纳丢失的数据在生态实践中是未知的。
在本文中,基于Staudenmayer和Buonaccorsi的延伸观察(2006),我们来解释如何获得最大似然(ML)和限制最大似然(REML)参数估计的EGSS模型。然后我们使用计算机来模拟比较EGOE,EGPN和EGSS方法的估计人口趋势的性能。我们记录了趋势参数的点和间隔估计的统计特性,当三个模型中的每一个模型都应用于包括多种时间序列长度、时间序列中缺失值的数量以及观察误差与过程噪声的比率的随机指数生长中产生的数据。根据我们对EGSS模型下趋势估计的大量稳健性的研究结果,我们为未来的生物监测研究设计和分析提供了建议。
方法
我们使用小写表示数据以及常量,大写表示生成数据的随机过程(随机变量)。 因此,当时间为0时(= ),时,我们用作为一个记录群体丰度的时间序列。同时当时间与一些相关联的概率分布有关时,用代表随机群体丰度。“丰度”是指数字,生物量或密度,并且可以从完整的人口普查,一个估计或一个可靠且成比例地跟踪人口波动的指数中确定。
我们考虑的三个模型都是基于熟悉的确定性指数增长模型:
(1)
当时间为时,代表人口丰度,其中。并且是一个常数,表示增加(ge;1)或减少()的群体。对数形式为:
(2)
同时具有过程噪声和观测误差的指数生长模型的一般随机版本采用具有不可观测的状态空间模型的形式以及代表所观察或估计的丰度值的分量。设是在时间的总体的未观测的对数丰度(现在假定为随机过程),是的估计或观测值。我们将EGSS模型写为:
(3)
(4)
其中,,。术语是表示过程噪声(环境变异性)的随机扰动,表示观察误差,假设没有自相关或交叉相关。量是在一个时间单位中的预期变化;这是我们的趋势参数(有关详细信息,请参见补充材料附录1)。该模型将定义为具有漂移率的布朗运动过程,并且表示将早期EGSS版本推广到连续时间。方程3提供了用于在小时间内模拟总体轨迹增量的简单配方间隔作为由正态随机量扰动的对数标度上的确定性指数增长的增量;将通过累积这样的增量来构建整个群体轨迹。样本时间不一定是等间隔的。EGSS模型的特殊情况是EGOE()和EGPN()。 EGOE,EGPN和EGSS模型的附加属性以及ML和REML参数估计的细节参见补充材料附录1。
对于评估的每组条件,我们模拟了具有指定的(从-0.2到0.2)和方差参数(:过程噪声和:观察误差都是从0到0.25)的EGSS模型的5000个重复时间序列。 模拟时间序列的持续时间范围为5至50,包围距离远低于最小值估计人口趋势大约是目前可获得的最长时间序列的时间段(Bence 1995, Holmes 2004)。
对数群体丰度用离散时间自回归模型生成:
(5)
当时该模型成立。自回归模型具有与在离散时间评估的连续时间模型(等式3)相同的统计特性。然后将观察误差加到每个中:
(6)
其中,模拟人口数值用来计算。此外,如果模拟人口减少到不足2个,则将其删除并再次模拟,以便在获得所需数量的观察值之前将估计限制为不灭绝的群体。其中,,并且的初始值被公式
随机选择。(结果对的变化不敏感;见补充材料附录2)。为了探索时间序列中遗漏观察的影响,我们随机删除了固定数量的数据。每个模拟时间序列的丰度数据(不允许去除第一个和最后一个观察值以保持测量长度不变)。比较完整和缺失数据下同一时间序列趋势的估计,可以将遗漏观测值与其他影响因素(如过程随机性)的影响隔离开来。
对于每个被模拟的时间序列,我们使用ML和使用REML的EGSS模型拟合了EGOE和EGPN模型。我们为这三种方法(EGOE,EGPN和EGSS)中的每一种创建了5000个重复的点估计值的框图。我们还通过绘制其置信区间(CI)实际包括的5000个重复的百分比来探索的间隔估计器的覆盖范围。(有关置信区间建设的详情,请参见附录1)。因为在一个适用的上下文中,对于一个可以超过或不包括真实的CI,我们使用50%的CI来提供对称性评估和低估。例如,覆盖率达到40%的模型可以被解释为同样偏向具有60%覆盖率的另一个模型。相比之下,更传统的90%或95%CI可能会掩盖比较,因为过度和不包括的不对称性。所有的模拟和计算都用R 2.8.1 for Windows(代码见附录)。
结果
对于输入趋势参数(正的,零或负,具有一定范围的过程噪声和观察误差)的所有组合,都发现了相同的一般模式。因此,我们只给出一个场景的详细结果,相对较大的过程和抽样方差()的小的真实人口下降。(输入参数的其他组合结果可在补充材料附录2中找到)。
无论过程噪声()与观测误差()的比值如何,这三个模型都提供了相对无偏估计的(图1A)。此外,的估计对于5到50年的时间序列长度(图1B)和时间序列中缺少观测值的数量是具有鲁棒性的(图1C)。虽然EGSS模型中的附加参数可能导致与EGOE和EGPN模型相比估计有更高的变异性,我们没有发现这一点的证据在任意的条件下。对于所有的3种方法,变异性随过程变化与观察误差的比率(图1A)和时间序列长度减小而增加(图1B),但几乎不受缺失观察的影响(图1C)。
虽然三个模型的表现相对于的估计中的偏差是好的,但置信区间覆盖率存在显着差异(图2)。只有当过程噪声不存在或相对于观察误差(接近0时,图2A)时,使用EGOE模型构建的置信区间是良好的(即,包含在约50%的间隔中);然而,随着比率的增加,置信区间覆盖率变为小于50%,表明间隔太窄。通过减小时间序列长度来改善覆盖范围(图2B)。类似地,随着时间序列变得不完整(即有更多的缺失值;图2C),覆盖也能得到改善。当估计在统计学上不一致(即渐近地收敛到错误的值)时,经常会发生较小样本的改进覆盖。
使用EGPN模型构建的置信区间在过程噪声压倒观测误差(例如gt;5;图2A)时具有优异的覆盖范围。然而,当过程噪声相对于观测误差(lt;1)最小时,置信度使用EGPN模型构建的间隔变得太宽(50%)。与EGOE模型一样,覆盖率随着时间序列长度的减小而略有改善(图2B)和更多的缺失数据(图2C)。
使用EGSS模型构建的置信区间的经验覆盖率往往小于50%(CI太窄),但仅略微上升,因此覆盖率很少偏离额定值的10%以上(图2)。 覆盖范围始终优于EGOE和EGPN模型,涵盖过程噪声和观测
全文共7278字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[144452],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。