关于检测脉搏波中的心房颤动的深度学习系统的诊断评估
摘要
目的 评估深度学习系统在光电容积脉搏波(PPG)脉搏波中自动检测心房颤动(房颤)的诊断性能。
方法 我们使用由几个公开可用的PPG数据库构建的149048个PPG波形的训练数据集训练深度卷积神经网络(DCNN)以检测17秒PPG波形中的房颤。使用3039智能手机获取的PPG波形的独立测试数据验证DCNN,所述PPG波形来自一般门诊诊所的房颤高风险患病成人,针对由两名心脏病专家审查的ECG记录。基于手工特征的六个已建立的房颤检测器在相同的测试数据集上进行评估以进行性能比较。
结果 在由1013名参与者(平均(SD)年龄,68.4(12.2)岁; 46.8%男性)的三个连续PPG波形组成的验证数据集(3039 PPG波形)中,房颤的患病率为2.8%。用于房颤检测的DCNN的接收器操作特性曲线(AUC)下的面积为0.997(95%CI 0.996至0.999),并且显着高于所有其他房颤检测器(AUC范围:0.924-0.985)。DCNN的敏感性为95.2%(95%CI 88.3%至98.7%),特异性为99.0%(95%CI 98.6%至99.3%),阳性预测值(PPV)为72.7%(95%CI 65.1%至79.3%)和阴性预测值(NPV)为99.9%(95%CI 99.7%至100%)。使用三个连续PPG波形组合(总共lt;1分钟),灵敏度为100.0%(95%CI 87.7%至100%),特异性为99.6%(95%CI 99.0%至99.9%),PPV为87.5% (95%CI为72.5%至94.9%),NPV为100%(95%CI为99.4%至100%)。
结论 在现实的初级护理环境中,对房颤进行筛查的成人PPG波形评估中,DCNN具有高灵敏度,特异性,PPV和NPV用于检测房颤,优于其他基于手工特征的最先进方法。
介绍
心房颤动(房颤)与三分之一的中风有关,但是超过三分之一的患者无症状并且通常未被诊断。尽管用口服抗凝剂治疗房颤患者可有效降低60%-70%的中风风险,但近25%的中风患者仅在潜在可预防的中风事件后发现房颤的存在。作为智能手机应用的使用,可穿戴能够通过光电容积描记法(PPG)采集脉搏波的健身追踪器和智能手表变得越来越普遍,这些工具可能为早期检测未确诊的房颤提供新的途径,并及时进行抗凝治疗以预防中风。基于PPG的房颤检测算法的先前工作主要依赖于明确的规则和手工制作的特征,这些特征源自PPG波形的一系列相互间隔,是为了捕获房颤的标志性脉冲不规则性。公布的方法包括变异系数(CoV),样本熵系数(CoSEn),连续差异的归一化均方根(nRMSSD) Shannonentropy(ShE),nRMSSD Poincareacute;图几何(SD1 / SD2),Poincareacute;图模式和使用支持向量机(SVM)进行自相关分析。迄今为止,实现非常高的灵敏度和特异性仍然具有挑战性,因为其他心律失常如异位搏动以及可以模拟房颤的PPG信号中存在运动或噪声伪影。在这项工作中,我们过使用大量PPG信号训练了一个深度卷积神经网络(DCNN)通来区分噪声、窦性心律、异位节律和房颤。与手工制作的功能相比,DCNN根据训练示例直接从原始PPG波形自动学习最具预测性的特征。
方法
数据集和参考标准
为了开发DCNN,我们从几个可公开访问的PPG存储库构建了数据集(PPG-RHYTHM),包括MIMIC-III重症监护数据库,健康志愿者的Vortal数据集和IEEE-TBME PPG呼吸速率基准数据集。将所有PPG记录重新采样到30Hz并分成512个样本(大约17s长)的片段。总共3373名不同的人的186317个具有同步心电图的PPG段被分析并分配到四个节律类别中的一个:窦性心律(n=81437波形)、噪声(n=6561)、异位节律(n=17257)和房颤(N=81062)。通过形成模板节拍并量化给定节拍和运行模板之间的相似度来评估每个PPG段的信号质量指数(SQI)。平均SQI低于0.4的PPG段被分配到噪声等级。根据护理提供者输入的图表观察以及经验丰富的研究人员的额外审查,我们对从剩余的干净PPG片段中的来自MIMIC-III数据库的片段进行了标记。来自Vortal(健康成人)和IEEE-TBME PPG呼吸率基准数据集(主要是儿童)的片段被标记为窦性心律。异位节律类包括过早的心房收缩,室性早搏和双性,三叉和四肢节律。我们使用80:10:10的比例将PPG-RHYTHM数据集划分为训练,调整和测试子集;节奏类的分布保持不变。对于DCNN的临床验证,我们使用Chan等人详细描述的独立数据集(MOBILE-SCREEN-AF)。简而言之,在一般门诊诊所使用智能手机(iPhone 4S; Apple)从1013名参与者(每位参与者连续三次PPG波形)获得了3039个PPG波形,这些波形具有房颤的高风险。PPG波形在30Hz下采样,每次测量持续17s(512个样本)。还使用带有不锈钢电极的手持设备(第一代AliveCor心脏监测器;AliveCor)记录单导联I ECG跟踪。所有心电图描记都具有足够的信号质量,并由两名不知道PPG波形和彼此的诊断结果的独立心脏病专家进行评估,以提供标准的参考诊断。ECG解释没有差异。在28名(2.8%)参与者中诊断出房颤,并使用标准的12导联心电图进行确认;28名患者中有5名(17.9%)患者通过筛查试验检测到新诊断的房颤。
DCNN架构和培训
我们的深度学习系统将大约17秒长的PPG波形(以30赫兹采样)作为输入,并输出四个节奏类别之一的标签预测,以及四个类别的概率分布。通过使用带通滤波器(0.48-12Hz)对所有PPG波形进行去趋势和滤波,以去除基线漂移和高频。我们使用密集连接的DCNN架构,具有六个密集块(总共201层),增长率为6。选择此架构是因为它鼓励功能重用并显着减少要学习的参数数量。为了提高计算效率和模型紧凑性,我们使用瓶颈和压缩层。DCNN模型由总共445856个可训练参数组成,仅需要3.6MB的存储空间。开发和验证DCNN的工作流程如图1B所示。我们在PPG-RHYTHM训练子集(149048波形)上从头开始训练我们的模型,采用He等人的权重初始化,并使用随机梯度下降,Nesterov动量为0.9,总共300个时期。我们使用了周期性学习率计划,并将学习率降低了10倍,达到了训练时期总数的50%和75%。保存了基于PPG-RHYTHM调谐子集(18631波形)性能的最佳模型,并用于后续测试。PPG-RHYTHM测试子集(18638个波形)用于表征DCNN用于多类节奏分类的准确度,并使用t-SNE(t分布随机邻域嵌入)可视化DCNN中的最后隐藏层表示。
统计分析和性能比较
使用用于二元分类的MOBILE-SCREEN-房颤数据集评估用于在初级护理设置中检测房颤的DCNN的准确度。DCNN对噪声,窦性心律或异位的预测被认为是非房颤标签。为了进行比较,我们还在同一数据集上评估了六种最先进的房颤检测算法(CoV,CoSEn,nRMSSD ShE,nRMSSD SD1 /SD2,Poincareacute;图和SVM)的性能。在线补充eAppendix中提供了算法的简要说明。此外,我们通过使用多数投票方案组合这六个房颤检测器来构建一个集成学习器。除SVM外,每个比较模型都在与DCNN相同的PPG-RHYTHM训练子集上进行重新训练,以确定房颤检测的最佳阈值(PPG-RHYTHM测试子集上的比较模型的性能在线显示补充eTable 1)。每个探测器的输出与MOBILE-SCREEN-AF数据集中的参考诊断分别比较三个连续PPG波形中的每一个(单次测量)和组合(三次测量)。如果三个单独的PPG波形中的至少两个被检测器分类为房颤,则组合读数被认为是房颤。通过改变每个房颤检测器的操作阈值来生成接收器操作特性(ROC)曲线。使用心脏病学家对相应ECG的注释作为基础事实,使用灵敏度,特异性,阳性预测值(PPV),阴性预测值(NPV)和ROC曲线下面积(AUC)比较所有房颤检测器的准确性。计算AUCs的95%CI,并使用DeLong检验进行比较。灵敏度和特异性的95%CI认为是#39;精确#39;Clopper-Pearson区间;PPV和NPV的CI计算为Mercaldo等人给出的标准logit CI。本研究中使用的所有统计检验均为双侧,p值小于0.05被认为是显着的。
结果
多类节奏分类
DCNN模型学会区分PPG波形中的四种节律类别的噪声,窦性心律,异位和房颤,总体准确度为96.1%(95%CI 95.8%至96.3%)。噪声,窦性心律,异位和房颤的敏感性为97.0%(95%CI 95.4%至98.2%),99.1%(95%CI 98.8%至99.3%),72.2%(95%CI 69.9%至74.4%)和97.6%(95%CI 97.2%至97.9%);相应的特异性为100%(95%CI 99.9%至100%),98.5%(95%CI 98.2%至98.7%),98.8%(95%CI 98.6%至99.0%)和96.5%(95%CI 96.1)分别为%(96.8%)。
单次测量的房颤检测
用于分类单个PPG波形的房颤检测器的性能如表3所示.DCNN的灵敏度高达95.2%(95%CI 88.3%至98.7%),最高特异性,PPV和NPV为99.0%(95%CI 98.6%至99.3%,72.7%(95%CI 65.1%至79.3%)和99.9%(95%CI 99.7%至100%)。DCNN的AUC为0.997(95%CI 0.996至0.999),显着高于所有其他检测器(AUC范围:0.924-0.985,p lt;0.001)。使用集成分类器将其他六个传统房颤检测器组合在一起,除了SVM之外,其性能优于其他所有成员,但没有达到与DCNN相当的性能。通过测试2-17s的段长度来评估输入段长度对DCNN性能的影响。随着输入节段长度从17秒减少到5秒,DCNN的AUC和特异性略有下降;相应的DCNN灵敏度稳步下降。对于长度小于5s的段长度,DCNN的性能迅速恶化。每个房颤检测器的列联表如图3所示。由DCNN正确和错误分类的脉冲波形示例如图4所示。在DCNN产生的四个假阴性中,一个被归类为异位节律,其他三个作为嘈杂的节奏。在所有四种情况下,DCNN产生的第二高等级概率对应于房颤。
从三次测量中检测房颤
当组合每个患者的所有三个单独的PPG记录时,所有房颤检测器的性能得到改善。DCNN在所有指标上均优于所有其他方法,灵敏度达到100%(95%CI 87.7%至100%),特异性为99.6%(95%CI 99.0%至99.9%),PPV为87.5%(95%CI)72.5%至94.9%)和NPV为100%(95%CI 99.4%至100%)。DCNN只犯了四个错误(误报);三个被认为是窦性心律,一个根据相应的心电图描记有过早的心房收缩。
可视化DCNN
为了深入了解DCNN学到了什么,我们可视化了代表学习卷积滤波器的第一层权重。所学习的滤波器似乎适用于检测峰值,波谷以及向上和向下斜坡等特征。实际上,第一层激活图的可视化揭示了在与输入脉冲波形的峰值,谷值和向上和向下斜率一致的位置处的强激活,提供了进一步的确认。使用图5C中的t-SNE可视化DCNN自动学习的内部特征。每个点表示从DCNN的最后隐藏层的输出投影到二维的脉冲波形。属于同一节奏类的点聚集在一起。房颤聚集在窦性心律的对面,而异位节律聚集在它们之间。图5C还示出了每个节律类的脉冲波形的示例,展示出了为何某些异位节律难以与房颤区分。
讨论
据我们所知,这是第一项验证使用深度学习系统从原始PPG波形中检测房颤的研究。这些结果表明DCNN从短脉冲波形实现了房颤的一般检测,而不必指定明确的规则或特征。DCNN对房颤检测具有非常高的灵敏度和特异性,超过了使用手工制作功能的其他最先进的方法,并且与使用单导联ECG的自动房颤检测器相当(灵敏度为94%-99%,特异性为92%-97%)。PPG波形的重复测量改善了诊断性能的所有指标,与先前的发现一致。DCNN直接从PPG波形学习并且在显式特征方面优于房颤检测器的能力,强调了原始数据捕获的信息的价值,这些信息在使用手工制作的特征时可能被丢弃。此外,尽管对使用传统脉冲血氧计收集的示例进行了训练,进行学习的DCNN模型依然显示了对使用智能手机获取的脉搏波的推广。
此前,Shashikumar等人报道了一种卷积神经网络(CNN),其具有0.92的较低AUC和85.8%的准确度,用于使用从PPG信号导出的频谱图像来检测房颤,而不是直接使用PPG波形作为CNN的输入。当将PPG波形转换成频谱图像,小训练集(98个病人)和相对浅的网络架构(六个层)时,先前CNN的辨别力可能受到信息潜在损失的限制。DCNN可以在某些方面进行改进。例如,异位检测的灵敏度较低,因为DCNN区分的两个最难的节律类别是异位和房颤。这可能部分是由于训练期间节律类表示的不平衡(异位与房颤脉冲波形的比率约为1:5)。使用更平衡的数据集,增加训练样本的总数或增加输入段长度(例如,1-5分钟)可以提高性能。考虑到与房颤相关的中风风险显着升高,高灵敏度是筛查工具的主要要求。同时,高度特异性和PPV特别适用于大规模筛查计划,以避免引发人们不必要的焦虑并防止后续调查的可避免成本。DCNN实
全文共6781字,剩余内容已隐藏,支付完成后下载完整资料
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[3066]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。