英语原文共 28 页,剩余内容已隐藏,支付完成后下载完整资料
一种用于疾病检测的矩阵合并算法
B.L.Hedt和M.Pagano
2008.8.24
摘要
在本文中,我们介绍了一种用于检测疾病的新的合并算法,即矩阵合并算法,它可以容纳不完善的测试。我们发现,在合理的检测试剂盒敏感性和特异性的水平下,矩阵合并算法比单独检测更准确。特别是,对于低发病率的疾病,这种方法准确性更高,测试次数比单独测试更少。事实上,当处理非常低的患病情况时,节约成本相当可观,通过我们提出的技术使一些疾病的筛查更加可行。
1 引言
诊断测试是患者治疗和护理的基石。在感染的早期阶段通过适当识别感染某种疾病的个体,医生通常可以提供及时和全面的反应。早期发现对患者是有益的,它可以延缓或减缓疾病传播给其他人。我们迫切需要一种满足高精度和低成本的测试方法。低成本缺乏的一个原因是由于资源有限,所以对许多疾病的普遍筛查很难实现,而且如果感染的个体在疾病扩散之前未被确定,医生就无法进行及时干预。
Dorfman介绍了混合检测,这是一种可以降低成本识别感染梅毒的个体的巧妙方法[1]。使用Dorfman合并过程,将n个样品分组到一个池中,并对池进行测试。如果结果为阴性,那么池中的所有样本都被分类为疾病阴性。如果测试结果是阳性,那么池中的个体将分别进行测试。这种测试算法比低发病率中的单独测试要便宜,因为在大多数情况下,只会执行一次测试而不是n次测试。池越大,每个结果的预期测试次数越少;然而,一旦池的规模太大,池内的一个或多个样品预计会被感染,那么测试的好处就会减少。因此,n的选择取决于患病率。此外,还有一种情况是因为想要避免一个池太大而无法发现受感染的个体。自Dorfman最初的工作以来,合并方法已经发展到包含许多测试性能和算法,主要有两个目标:分类,或识别患有疾病的个体,以及估计普通人群的疾病发病率。有关合并方法的综述,请参阅Lancaster和Keller-McNulty,Venette,Moon和Hutchison,Zenios和Wein以及其中的参考文献[2,3,4]。
尽管合并样本减少了在低患病率环境中检测疾病的成本,但提出的大多数原始的合并算法(包括Dorfman合并方法)与单独检测相比有一个主要缺点,即具有较高的假阴性预测值,因为总体敏感性受到程序的影响。准确性的下降限制了实践中合并方法的普及。为了解决这些问题,Litvak,Tu和Pagano提出了一种合并算法,通过对所有阶段检测为阴性的池进行再测试来提高敏感性[5] [6]。的第一步从测试n个样本池开始。如果池测试结果为阴性,则重新测试整个池。如果池第二次检测为阴性,则整个池被宣布为未感染。如果池在第一次测试或再测试时测试结果为阳性,那么如果原始池大小n是偶数,则池被分成两个大小相等的子池,大小为(n-1)/ 2和(n 1)/ 2;如果n是奇数,那么子池就像原始池一样被处理。此后,此分割过程将被称为“二分步骤”。为了识别感染的个体,这个测试过程会持续到每个样本被确定为疾病阳性或阴性。通过重新测试阴性库,总体敏感性不仅得以保留,而且与个体检测相比有所改善,同时在低发病率情况下保持较少检测的好处。
有重新测试形式的合并算法通过将相同个体或相同个体的子集分组来合并。然而,如果存在交感配对或对偶配对行为的风险,那么在具有不同组成的测试池中存在潜在的益处。一种设计能够实现这一点,至少在第一阶段,将样品按类似矩阵的设计方式进行排列,并形成列池和行池,这样在测试的第一阶段,一对样品最多可以同时出现在一个池中。此外,矩阵合并测试算法通常可以比其他重测试算法更快执行,因为初始双重测试是并行而不是按顺序进行的。注意到这些好处,并认识到额外优点的潜力,我们探索了一种矩阵合并设计的特性。我们在这里介绍的算法自然地建立在方法的基础上,并在第2部分中与敏感性,特异性和预期测试次数的概要一起描述。最后,在第3部分中,我们将矩阵合并算法的特性与单个测试进行了比较,并且显示了矩阵合并在提高准确性方面以及在低患病率下每个结果的预期测试次数的减少的优势。
2 矩阵合并算法
考虑个体感染或未感染的疾病,以及考虑能够将受感染个体的样本以概率识别为阳性和以概率正确识别未感染个体的样本的试验,并且分别考虑所述试验的敏感性和特异性。我们假设对于n个样本池,如果所有样本都没有感染,则合并的样本将是未感染的,但是如果任何样本被感染,则合并的样本将被感染。此外,我们假设测试的敏感性和特定性在合并下得到保留;换句话说,如果受感染的样本以概率单独测试阳性,那么在将该样本与其他n-1个样本结合在一个池中时,该池仍将以概率测试阳性。此外,来自n个未感染个体的样本池将以概率检验为阴性。贯穿整个计算中的进一步假设是重复测试互相独立。
我们提出的方法,称为矩阵合并或,扩展了算法,并且是适应不完善测试的矩阵测试方法。对于,将个样本随机放置在ntimes;n矩阵中以形成两组池:n个合并行r1,...,rn和n个合并列c1,...,cn。
测试算法定义如下。测试所有行池和所有列池。然后,
- 如果所有2n检测结果均为阴性,则停止检测并宣布所有n2样本均无疾病。
- 如果r行(r = 1,...,n)且没有列测试为阳性,则使用一次中的二分步骤对这些r池中的每一个进行进一步测试,因为它们已经测试为阳性。其余(n-r)times;n个样本被宣布无病。
- 如果c列(c = 1,...,n)且没有行测试为阳性,则类似于上面的步骤2,使用一次中的二分步骤对这些c池中的每一个进行进一步测试,因为他们已经测试为阳性。其余(n-c)times;n个样本被宣布无病。
- 如果n行和n列测试结果为阳性,则提交n行池以进一步使用的二分步骤进行测试,因为它们已经测试为阳性。
- 否则,如果r行(r = 1,...,n)和c列(c = 1,...,n),但,测试为阳性,就声明那些出现在行和列中都测试为阴性的样本是无病的。对每一个大小为n-c的r个池进行测试处理,这些r池由测试为阳性的r行和测试为阴性的n-c列中的样本组成;并且每一个大小为n-r的c池中c列测试为阳性,且n-r行测试为阴性使用进一步测试。最后,单独测试剩余的rc个样本,如果初始结果为阴性则重新测试。
2.1 矩阵合并算法的敏感性
设为第一个n-1行池的r和第一个n-1列池的c检验为阳性的概率,假设p是疾病的患病率(推导见附录A),令表示在大小为k的池的敏感性(由Litvak等人推导[5])。
定理1(敏感性)。矩阵合并算法的敏感性表示为,是在检测过程结束时,感染样本被确定为疾病阳性的概率。的敏感性是矩阵大小的函数,并且取决于疾病的患病率,可以写成
证明 在不失一般性的情况下,让初试测试矩阵中坐标(n,n)的样本为受感染。为了将此样本确定为阳性,有必要在第一步结束时,第n行池检测为阳性且第n列池检测为阴性,或者第n行池检测为阴性且第n列池检测为阳性,两者都以概率发生;或者第n行和第n列测试结果都是阳性的,这种情况发生的概率是。
首先假设第n行池检测为阳性,第n列池检测为阴性。如果没有其他的列池检测结果为阳性,那么对于阳性行池的任意组合,r = 0,...,n-1,将第n行提交给,用二分步骤进行进一步检测,感染样品被分类为阳性的概率等于。这里,a = 和b = 。如果其中一个或多个其他列池在最初的步骤中检测为阳性,则c = 1,...,n-1,对于阳性行池的任意组合,r = 0,... n-1,第n行 ,除了在阳性列池测试交叉处的c样品之外,提交给进行进一步测试。在这种情况下,感染样本被鉴定为阳性的概率等于。使用这种逻辑,在第n行池检测为阳性且第n列池检测为阴性的情况下,感染样品被鉴定为疾病阳性的概率是
(1) |
请注意,同样的推理适用于第n行池检测为阴性且第n列池检测为阳性的情况。由于初始测试矩阵在行和列中具有相同数量的样本,因此在这两种情况下感染样本被鉴定为阳性的概率是相等的,因此上面等式(1)中的每个项都乘以2。
现在假设第n行池和第n列池都检测为阳性。那么如果所有其他行池和列池检测结果都是阳性,那么r = n-1且 c = n-1,那么第n行被提交到,用二分步骤进行进一步检测,感染样品被分类为阳性的概率等于。如果其他行和列的某些组合检测为阳性,r,c = 0,...,n-1,,则坐标(n,n)的样本被确定为阳性的概率等于。结合这四种可能的方式将感染样本鉴定为阳性,将导致定理1所述的敏感性。
2.2 矩阵合并算法的特异性
给定坐标(n,n)的细胞未感染,令和分别是第n行和第n列检测为阳性的事件,并且和分别是第n行和第n列检测为阴性的事件。设是检测为阴性的列与第n行交叉处的样本疾病的患病率,则第n行检测为阳性;设是检测为阳性的列与最后一行交叉处样本疾病的患病率,则最后一行检测结果为阳性,或者检测为阳性的行与最后一列的交叉处,或者最后一列检测结果为阳性( 见附录B)。另外,当给定流行率为p(见[5])应用于规模为n的池时,令为的特异性。
定理2(特异性)。矩阵合并算法的特异性表示为,是在检测过程结束时,未感染样本被确定为疾病阴性的概率。并且取决于矩阵的大小和疾病的患病率,可以写成
(2) |
证明 在不失一般性的情况下,让初试测试矩阵中坐标(n,n)的样本为未感染。下面的推导显示了使用矩阵合并将未感染样本确定为阳性的概率。一减去给出特异性的这个概率。为了将未感染的样品鉴定为阳性,在第一步结束时,第n行池检测为阳性且第n列池检测为阴性,或者第n行检测为阴性且第n列池检测为阳性,两者都以概率发生; 或者第n行和第n列都必须测试为阳性,以概率发生。
鉴于(n,n)细胞固定为未感染,
首先假设第n行池测试为阳性,第n列池测试为阴性。如果没有其他池检测结果为阳性,那么对于阳性列池的任意组合,r = 0,...,n-1,第n行提交给,用二分步骤进行进一步检测,未感染样品被分类为阳性的概率等于。这里,最后一项是一减去的特异性,当患病率为时应用于大小为a和b的样本。如果其中一个或多个其他列池在初始步骤中检测为阳性,则c = 1,...,n-1,对于任意组合的阳性行池,r = 0,...,n-1,第n行,除了在阳性列池测试交叉处的c样品之外,提交给进行进一步测试,未感染的样本被鉴定为阳性的概率等于。因此,当第n行池检测为阳性且第n列池检测为阴性时,未感染样品被鉴定为疾病阳性的概率是
(3) |
||
请注意,同样的推理适用于第n行池检测为阴性且第n列池检测为阳性的情况,并且由于初始检测矩阵在行和列中具有相同数量的样本,因此在这两种情况下未感染样本被鉴定为阳性的概率是相等的,因此方程(3)中的每个项都乘以2。
现在假设第n行池和第n列池都检测为阳性。然后,如果所有其他行池和列池检测结果都是阳性,则r = c = n-1,那么将第n行提交给并用二分步骤进行进一步检测,未感染样本归类为阳性的概率等于
,
给定坐标(n,n)的细胞是未感染的和。如果其他行和列的某些组合检测为阳性,,则坐标(n,n)的样本被确定为阳性的概率等于。结合这四种情况可以得到定理的证明。
2.3 矩阵合并算法的预期测试次数
当疾病患病率为p时(附录C)令表示n个行池之外的r和n个列池之外的c检测为阳性的概率。设表示样品处于交叉点不一致的行池和列池测试的疾病患病率,表示样品处于行和列(附录D)一致为阳性的交叉处的疾病患病率。最后,是池的大小为k,患病率为p时的预期测试次数(参见Litvak等人[5])。
(4) |
||||||||
证明 最初测试n个行池和n个列池,导致总共2n个测试。现在我们计算矩阵合并算法的额外预期测试次数,方法是列举r行池和c列池检测为阳性的每种可能组合,乘以r行池和c列池检测为阳性的概率。
- 如果所有的行和列池都检测为阴性,并且概率为,则不再进一步进行测试。
-
如果r(
全文共9891字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[10913],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。