英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
时空排列扫描统计量疾病疫情检测
马丁Kulldorff1 *,理查德Heffernan2杰西卡·Hartman2,3,雷纳托Assuncao4,法扎德Mostashari2
1门诊和预防,哈佛医学院和哈佛朝圣者卫生保健,波士顿,马萨诸塞州,美国,2纽约市卫生和心理卫生,纽约,纽约,美国,3纽约医学专科学院的,纽约,纽约,美国,4 Departamento de Estatistica大学联邦德·米纳斯吉拉斯,贝洛奥里藏特,米纳斯吉拉斯,巴西
相互竞争的利益:作者宣布不存在竞争利益。
作者贡献:MK和FM设计了这项研究。MK、RA和FM开发了统计冰毒学。MK和RH分析了数据。MK、RH、JH、RA和FM为论文的撰写做出了贡献。
学术编辑:Sally M. Blower,美国加州大学洛杉矶分校
引文:Kulldorff M,霍夫曼R,哈特曼J,Assunccedil;tilde;o R,Mostashari F(2005)置换时空扫描统计疾病疫情检测。科学硕士2(3):e59。
收到:2004年9月21日接受:2005年1月11日出版:2005年2月15日
DOI:10.1371 / journal.pmed.0020059
版权:O 2005 Kulldorff等人。这是一篇根据知识共享署名许可条款发布的开放获取的文章,该许可在任何媒体上进行无限制的使用、分发和再制作,前提是原作被适当引用。
缩写:DOHMH,纽约市卫生与心理卫生署;GLR, gener化似然比
*与谁通信应该解决。电子邮件:martin_kulldorff@hms收Educational institutions 教研机构
摘要
背景
及早发现疾病暴发的能力是重要的,以便通过及时实施疾病预防和控制措施将发病率和死亡率降到最低。许多国家、州和地方卫生部门正在推出疾病监测系统,每天对医院急诊部门的访问、救护车调度电话、或无法获取或不相关的高危人群信息的药房销售进行分析。
方法和结果
我们提出了一种前瞻性的时空排列扫描统计数据,用于仅使用病例数的疾病暴发的早期检测,而不需要人口风险数据。它对疫情爆发的时间、地理位置或规模做出了最小的假设,并根据自然的纯粹空间和纯粹时间的变化进行调整。通过对纽约市医院急诊科的日常分析,对新方法进行了评估。四个在五种最强的信号中,可能是由于轮状病毒引起的全市暴发的局部前体,诺瓦克病毒和流感。错误信号的数量是最有限的。
结论
如果这样的研究结果能够支持更长时间的研究和在其他地方的研究,那么时空置换扫描统计数据将成为建立早期疾病检测监测系统的地方和国家卫生部门的重要工具。
介绍
2001年世界贸易中心和炭疽恐怖袭击,以及最近的西尼罗河病毒和非典爆发,促使许多公共卫生部门及早爆发疾病 检测系统非诊断信息,通常来源于电子为其他目的收集的数据(“综合症监测”)[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17]。这些系统包括监控急诊就诊次数的系统-tems,主车。 E探视,救护车调度员,护士热电话,药品销售,西尼罗河相关的死亡鸟类报告。这种系统的建立涉及到数据收集、分析方法、信号解释和响应方面的许多挑战。重要的分析挑战包括处理 在未知的爆发时间、地点和规模的情况下,尽早发现疫情,根据自然的时间和地理变化进行调整,并处理缺乏合适的波普乌尔的问题。 风险评估数据。
早期检测所用的大多数分析方法疾病暴发纯粹是暂时性的[18,19,20,21,22]。这些方法有助于发现同时影响受监测地理区域所有地区的疫情, 但在发现从当地开始的疫情时可能会迟到。虽然纯时间的方法可以并行使用不同大小的重叠区域,以涵盖所有可能的爆发, T方法导致了一个严重的多重测试问题,产生了比标称统计信号电平所指示的更多的假信号。
由Naus[23]首次研究,扫描统计量是一种优雅的方法。当空间区域和/或时间间隔紧密重叠时,解决多重测试问题。时间、空间和时空扫描统计[24,25,26,27]现在已经出现了。 广泛用于疾病聚类检测和评价,包括癌症[28,29],克雅氏病[30],粒细胞埃利希氏病[31],硬化症[32], d糖尿病[33]。其基本思想是,有一个扫描窗口,可以在空间和/或时间之间移动。对于窗口的每个位置和大小,都会计算观察到的和预期的病例数。 其中,观察到的病例中最“不寻常”的情况是多的。然后,考虑到多个POTEN产生的多个测试,评估该集群的统计信号fi性能。 评估TiAl簇的位置和大小。
迄今为止,所有扫描统计量都要求统一。处于危险中的人群、对照组或其他数据,这些数据提供了关于潜在高危人群的地理和时间分布的信息。人口普查数字为USEF UL作为癌症、出生缺陷和其他登记数据的分母,在这些数据中,可以根据潜在人群准确地估计病例数。它们与su不太相关。 由于每家医院/药房的集水区是UNDEfiNed,所以需要监测数据,如急诊和药房销售。即使有,集水区的人口也会 不是一个好的分母,因为由于疾病流行程度、获得医疗保健的机会和消费者BE等方面的差异,医疗保健利用数据不可能有自然的地理变化。 哈维奥[34]。在评估受使用行为影响的数据时,一个选项是使用总量作为分母。例如,可以使用总计。当评估腹泻时,急诊科作为分母访问[7],同样,当评估腹泻药物销售[4]时,所有药房销售作为分母。这取决于数据的性质。例如,由于销售促销或过敏季节而导致的药品总销售额的变化可能会隐藏一个真实的信号,或者为感兴趣的药品类别制造一个错误的信号。
在本文中,我们提出了一种前瞻性时空模型。方法可以是前瞻性地定期扫描地理图形区域,以确定任何地点和大小的暴发。对于每一个地点和大小,它都会在ord中观察可能的一天和多天的爆发。 呃,要快速发现一个快速上升的疫情,还有能力通过综合多天的信息,来检测一个缓慢出现的疫情。
时空置换扫描统计量逐渐增加。作为纽约市卫生和心理卫生局(DOHMH)监测举措的一部分,与调整基于人口风险的死亡扫描统计数据同时进行。 税务局报告(西尼罗河病毒)[13]
急诊室探访[7]、救护车派遣呼叫[6]、药房销售[4],学生缺勤记录[3]。本文给出了DIAR的时空置换扫描统计量,并以DIAR的紧急分离访问为例进行了说明。 风湿病,呼吸道和发烧/flu样疾病。
方法
纽约市急诊综合征监测系统
纽约市急诊科综合征监测系统在其他地方有详细说明[7]。简单地说,参与的医院每周七天向卫生部传送电子文件。文件包含所有急诊室的数据。 前一天的患者访视,包括访视时间、患者年龄、性别、家庭邮政编码和主诉——获取患者自身疾病描述的自由文本。 截至2002年11月,纽约市66个应急部门中有38个参加了该系统,估计占纽约市应急部门访问次数的75%。
数据为完整和准确的fi编辑。链接到单个数据集,并使用SAS[35]附加到主存档中。将访问归类为“综合症”(例如,“腹泻综合症”),一种计算机算法搜索自由文本的首席投诉fiLD字符串,表明症状与该综合症。
数据分析的目标,为期七天。每周,关键综合征类别的异常增加。要运行空间–时间置换扫描统计,我们编写了一个SAS程序,生成必要的案例和参数文件 S,调用SaTScan软件[36],并将结果读入SAS以进行报告和显示。
我们进行了两组分析,一组是基于分配每个人根据他们的医院地址到他们的住宅邮政编码和其他人的坐标。有183个邮政编码和38个医院,前者使用更详细的地理位置。 信息,而后者可能会发现疫情不仅与居住地有关,而且还与工作地点或其他外部活动有关。(如果人们生病时去最近的医院)。医院没有记录约3%的病人的居住邮政编码,在这里所描述的分析中,这些人是o。 仅包括在医院基础上的分析。
未来时空的表现-采用住院和住院两种方法进行统计分析。我们利用历史腹泻数据模拟前瞻性监测系统,并从2001年11月15日起进行每日分析。 2002年11月14日。对于这些天中的每一天,分析只使用了相关日期之前的数据和包含的数据,而忽略了随后几天的所有数据。这与实际可用的数据相对应。 e在当天结束后8至12小时的DOHMH会议上,如果当时系统已经到位,就会进行分析。我们还提供了为期一周的每日前瞻性分析报告。 反恐执行局于2003年11月在每日结束后约12小时进行每日分析,作为卫生部常规综合征监测活动的一部分。
时空置换扫描统计量
与基于poisson和bernoulli的前瞻性时空扫描统计[27]一样,时空置换扫描统计量利用数千或数百万个重叠的柱体来计算sc。 安宁窗口,每一个都可能成为爆发的候选。圆形基地代表可能爆发的地理区域。一种典型的方法是对一个finite数进行first迭代。 地理网格点,然后由用户逐步将圆圈半径从零增加到某个最大值defiNed,按其进入圆的顺序迭代邮政编码。在 这样,小圆和大圆都被考虑,所有这些都与许多其它圆重叠。圆柱体的高度代表天数,要求最后一天为 总是包括在内加上前几天的可变天数,直到一些最大的defiNed由用户。例如,我们可以考虑所有高度为1,2,3,4,5,6或7d的圆柱。 所有可能的时间圆柱长度。这意味着我们将评估地形图上大且时间短的圆柱,在磁盘上形成一个fl,那些在地理上较小的和 时间长的,形成一根杆子,中间的每一个组合。
时空置换扫描系统有什么新的-TISTIC是概率模型。由于我们没有危险人口数据,所以只能用这些情况来计算预期的数据。假设我们每天都有邮政编码区域的案例计数,czd就在这里。 观察到的案件数目日间邮编区域z。观察到的总数目。案件(C)是
(1)
对于每个邮政编码和日,我们计算观察到的边距-als上的期望情况lzd条件数:
(2)
换句话说,这是在邮政编码区域z中发生的所有病例的比例,是d天内总病例数的倍数。特定圆柱A中案件lA的预期数是这些期望在该圆柱体内所有邮政编码天内的总和:
(3)
在计算这些期望数时的基本假设是,如果在d天观察到一个情况在邮政编码区域z中的概率,则所有天d的概率都是相同的。
假定CA是圆柱中观察到的情况数。以边缘为条件,当不存在时空相互作用时,CA按超几何分布 平均lA和概率功能,作用
(4)
当RZ2 A CZD和RD2 A CZD比C小时,CA近似为泊松分布,平均L A〔37〕。基于这个近似,我们使用泊松广义似然比(GL)。 (R)作为A缸爆发的证据的衡量标准:
(5)
换句话说,这是被观察到的除以在气缸内观察到的能量,乘以被观察到的除以预期到被观察到的外部的能量。 林德。在被评估的许多钢瓶中,具有最大glr值的钢瓶构成了最不可能发生的情况的时空集群,因此,它是主要的候选。 为了真正的爆发。使用泊松近似的一个原因是,当按周间交互作用调整空间时,处理这种分布要比超几何学容易得多。 n(见下文),因为泊松分布之和仍然是泊松分布。因为我们正在评估大量的疫情位置,大小和时间长度,有严重的多重测试,我们需要调整。由于我们没有高危人口数据,所以不能用任何一种常用的扫描方法来完成。 乐感。相反,它是通过创建大量随机排列的空间和时间属性的每一种情况下在数据集中。也就是说,我们关闭fle的日期/时间并分配它们的原始集合案例位置,确保空间和时间边缘不变。在此之后,对每个模拟数据集进行最有可能的聚类计算,方法与实际数据完全相同。用蒙特Ca法评价fi的统计意义 Rlo假说检验[38]。例如,如果最大glr是从999模拟数据集中计算出来的,而实际数据的最大glr值高于第50最高值,那么该集群就是sta。 说明fi不能在0.0 5水平。一般情况下,p值为p=R/(S1),其中R是真实数据集中最大GLR的秩,S是模拟数据集的个数[38]。在 加上p值,我们还报告空出现率(8),例如每一次。45d或每23 mo一次。零发生率是在假设零假设为真的情况下,在GLR相同或更高的情况下,从看到爆发信号之间的预期时间。对于日常分析,它例如,在0.0 5的假设下,我们平均每20d对监测中的每一种综合征期望一次虚警。
由于蒙特卡罗假设检验,方法是计算机密集型的。为了方便地方、州和联邦卫生部门使用这些方法,时空置换扫描统计量已被作为一项特性在“科学”杂志中得到了应用。“。 e免费和公共领域SaTScan软件[36]。
纽约市综合征监测的实施
根据应用程序的不同,该方法可以使用不同的参数设置。对于症状监测 一个半径为5公里的圆圈,最大时间长度为7天。这意味着我们正在评估一个圆半径大小介于0公里(只有一个邮政编码)到5公里之间的疫情。 时间长度(圆柱高度)为1至7天,后一项限制是对以下信念的fl分析,即该综合征监测系统的主要目的是及早发现疾病爆发,以及 暴发已经存在了超过1周,它更有可能被临床医生或实验室报告的fic疾病诊断报告。
另一个实际的选择是包括在分析中。一种选择是包括所有数据可用的前几天。相反,我们选择分析最后30天的数据,添加一天,并删除另一
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[464938],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- GIS矢量地图的鲁棒水印方案外文翻译资料
- 中国相似地理位置发达地区房价影响因素的差异——以西安高新区和沣渭新区为例外文翻译资料
- 集成数据在城市土地利用变化时空动态监测的应用——以印度金奈都市为例外文翻译资料
- 全球地表水及其长期变化的高分辨率制图外文翻译资料
- 造成沿海大型城市内涝灾害的主要因素识别——以中国广州为例外文翻译资料
- 基于SFPHD框架的中国快速城市化地区城市生态系统健康综合评价方法外文翻译资料
- 基于绿地演变的未来城市地表热岛强度的多情景模拟预测外文翻译资料
- 中国大陆272个城市地面和冠层城市热岛强度的长期趋势外文翻译资料
- 与孟加拉湾热带气旋有关的中国低纬度高原远距离降雨事件外文翻译资料
- 新丰江水库流域GPM IMERG降水产品评价及水文效用研究外文翻译资料