Contents lists available at ScienceDirect
Biomedical Signal Processing and Control
ELSEVIER
journal homepage: www.elsevier.com/locate/bspc
Automatic cell nuclei segmentation and classification of cervical Pap smear images
Pin Wanga,[1], Lirui Wanga, Yongming Lia, Qi Songa, Shanshan Lva, Xianling Hub
a College of Communication Engineering, Chongqing University, Chongqing, 400030, PR China
b Department of Radiology, Southwest Hospital, Third Military Medical University (Army Medical University), Chongqing, 400038, PR China
article info
abstract
Pathological examination of microscopic image of Pap smear slide remains the main method for cervical cancer diagnosis. The accurate segmentation and classification of images are two important phases of the analysis. Firstly, the Mean-Shift clustering algorithm is applied to obtain regions of interest (ROI) for cell nuclei segmentation. Then the flexible mathematical morphology is applied to split overlapped cell nuclei for better accuracy and robustness. For classification of the images, features based on shape, textural features based on color space and Gabor features are extracted and put together to obtain better classification performance. The optimal feature set is obtained by chain-like agent genetic algorithm (CAGA), P-value and maximum relevance-minimum multicollinearity (MRmMC). The proposed segmentation and classification methods were tested on 362 cervical Pap smear images. Experimental results showed that the cervical cell nuclei can be segmented by the proposed segmentation method with high effective segmentation results (Sensitivity: 94.25%士 1.03% and Specificity 93.45%士 1.14%). The feature selection method based on CAGA with Gabor features has the highest classification performance for normal, uninvolved and abnormal images (more than 96% accuracy). The proposed method can automatically and effectively segment cell nuclei of microscopic images. From the experimental results, Gabor features and feature selection based on CAGA are apparently helpful for improving the performance of classification.
Article history:
Received 23 June 2017 Received in revised form 14 September 2018 Accepted 26 September 2018 Available online 25 October 2018
Keywords:
Cervical cell Uninvolved images Gabor features
Mean-shift clustering algorithm Flexible mathematical morphology Feature selection
copy; 2018 Elsevier Ltd. All rights reserved.
- Introduction
Cervical cancer, as the fourth leading causes of cancer morbidity and mortality in females is curable at its premalignant stage [1]. So the early detection of cervical cancer is very important for successful treatment. Pap smear test is a physical examination technique that is widely used to prevent cervical cancer by finding cells that have the potential to turn cancerous. However, such diagnosis is heavily dependent on the clinicianrsquo;s experience, which is extremely time consuming and is subjected to human error even for experienced doctors [2,3].Thanks to recent advances in digital pathology, the automatic image analysis method has the potential to overcome the subjective interpretation and reduce the workload. Computer- aided diagnosis (CAD) scheme is becoming an important tool to assist pathologist in cervical cancer detection and diagnosis. And systematic screening can reduce mortality rates for cervical cancer by 70% or more [4]. CAD scheme consists of two phases, which are segmentation phase and classification phase [5-7].
Segmentation of nuclei is the important first step towards automatic analysis of cervical smear images. The segmentation of cervical Pap smear images can be categorized into three categories: 1) single nuclei segmentation; 2) multiple nuclei segmentation; 3) overlapped nuclei splitting. Existing single nuclei segmentation methods utilize an edge-based method and a patch-based fuzzy C-means clustering method to extract cell contours [8,9]. The methods only work for the single cell images. The nuclei segmentation of multiple cells images has employed threshold [10-12], Hough transform [13], Morphological watershed [14-16] and radial tracing [17]. But the techniques suffer from over-segmentation and do not work well for the overlapped cells. For splitting of overlapped nuclei, concave point detection [18-20] is a commonly used methods. An unsupervised method [21] for splitting overlapped nuclei has been proposed by the combination of distance transform, expectation maximization algorithm and ellipse fitting techniques. The algorithms based on deep learning are used for the segmentation of cervical cell nuclei [22,23]. However, the deep learning methods require a large number of cervical cell images and have high time cost and high randomness. From earlier threshold and watershed-based techniques until now, various methods ha
生物医学信号处理和控制 48(2019)93-103
目录在科学直通车
生物医学信号处理与控制
基于宫颈涂片图像的细胞核自动分割和分类
Pin Wanga,*,Lirui Wanga,Yongming Lia,Qi Songa,Shanhan Lva,
Xianling Hub
a 重庆大学通信工程学院,重庆 400030
b 第三军医大学西南医院放射科(军医大学),重庆 400038
文章历史:
2017 年 6 月 23 日收到修订后的表
格 2018 年 9 月 14 日接受 2018 年 9
月 26 日接受 2018 年 10 月 25 日在线提供
关键词:
未参与宫颈细胞的图像Gabor 功能
均值漂移聚类算法灵活的数学形态学特征选择
摘 要
文 章 信 息
宫颈涂片显微图像的病理检查仍然是宫颈癌诊断的主要方法。图像的准确分割和分类是分析的两个重要阶段。首先,应用Mean-Shift聚类算法来获得细胞核分割的感兴趣区域(ROI)。然后应用灵活的数学形态学来分裂重叠的细胞核,以获得更好的准确性和稳健性。对于图像的分类,提取基于形状的特征,基于颜色空间的纹理特征和Gabor特征,并将它们放在一起以获得更好的分类性能。最优特征集是通过链式代理遗传算法(CAGA),P值和最大相关性 - 最小多重共线性(MRmMC)获得的。所提出的分割和分类方法在362个宫颈涂片图像上进行了测试。实验结果表明,所提出的分割方法可以对宫颈细胞核进行分割,具有较高的分割效果(敏感性:94.25%士1.03%,特异性93.45%士1.14%)。基于具有Gabor特征的CAGA特征选择方法对于正常,未涉及和异常图像具有最高的分类性能(超过96%的准确度)。该方法可以自动有效地分割显微图像的细胞核。从实验结果来看,基于CAGA的Gabor特征和特征选择显然有助于提高分类性能。
copy;2018 Elsevier Ltd.保留所有权利。
1 通讯作者。
电子邮件地址:wangpin@cqu.edu.cn (P. Wang)。
1.介绍
宫颈癌在女性主要的癌症发病率和死亡率上排第四,可以在其癌症前期进行治疗[1]。因此宫颈癌的早期检测对于成功治疗非常重要。宫颈涂片检查是一种物理检查技术,通过寻找有可能转变为癌症的细胞,广泛用于预防子宫颈癌。然而,这种诊断在很大程度上取决于临床医生的经验,这是非常耗时的,甚至对于经验丰富的医生也会出现人为错误[2,3]。由于数字病理学的最新进展,自动图像分析方法可以克服主观解释并减少工作量。计算机辅助诊断方案正成为帮助病理学家进行宫颈癌检测和诊断的重要工具。系统筛查可以将宫颈癌的死亡率降低70%或更多[4]。 计算机辅助诊断方案由两个阶段组成,即分段阶段和分类阶段[5-7]。
细胞核分割是自动分析宫颈涂片图像的重要第一步。宫颈涂片图像的分割可以分为三类:1)单核分割; 2)多核分割; 3)重叠核分裂。现有的单核分割方法利用基于边缘的方法和基于补丁的模糊均值聚类方法来提取细胞轮廓[8,9]。该方法仅适用于单细胞图像。多个细胞图像的细胞核分割采用阈值[10-12],霍夫变换[13],形态学分水岭[14-16]和径向牵引[17]。但是这些技术容易受到过度分割的影响,并且对于重叠的单元不能很好地工作。对于过度叠加的核的分裂,凹点检测[18-20]是常用的方法。通过距离变换,基于最大化算法和椭圆拟合技术的组合,提出了一种用于分裂重叠核的无监督方法[21]。基于深度学习的算法用于宫颈细胞核的分割[22,23]。然而,深度学习方法需要大量的宫颈细胞图像,并且具有高时间成本和高随机性。从早期的阈值和基于分水岭的技术到现在,已经在宫颈细胞图像分割的研究中提出了各种方法。然而,由于宫颈细胞图像的高度可变性,例如重叠细胞,灰尘,杂质和不均匀照射,细胞核图像的可靠分割仍然是一项具有挑战性的任务。
在经过细胞核精确分割后,进入分类阶段。分类算法中最重要的部分是特征提取和分类算法。大多数提取的特征是基于形态学和基于纹理的特征[14,24-26]。他们中的大多数使用纹理方法进行分类,例如统计纹理[14],Daubechies小波[24]和灰度共生矩阵[25]。纹理方法只能反映细胞特征的一个方面,因此纹理方法的组合可以更好地表示细胞核的结构特征。均匀性中强度的存在可能影响基于强度的特征提取的质量,并且结构信息的提取是具有挑战性的,例如宫颈涂片图像的尺度和方向。 Gabor过滤器是一种加窗傅立叶变换,源于Gabor D. Daugman [27]的工作。它已经扩展到二维(2D)空间位置。2D Gabor滤波器可以在时域和频域中提供良好的分辨率。由于(a)频率动机,它为提取局部特征提供了最佳基础:Gabor小波的多分辨率和多方向特性对于测量局部空间频率是最佳的;(b)形态学动机:它扭曲了模式识别任务的容忍空间[28]。本文将Gabor滤波器应用于宫颈细胞图像,以提取宫颈细胞核的能量和振幅特征。
对于分类算法,大多数研究使用支持向量机(SVM)[29],线性判别分析(LDA)[9],k-最近邻(k-NN)[9]和朴素贝叶斯(NB)[21]。神经网络[30]也已用于细胞图像分类。 几乎所有关于宫颈细胞图像分类的文献都使用了所有特征提取方法进行分类[9] [15] [28]。特征选择可以提高分类的准确性和可靠性[31], 特征选择旨在寻找原始特征的最佳或次优子集, 以便于将来分析高维问题[32-34]。 因此,有必要在宫颈细胞图像的分类中应用特征选择。
本文提出了一种宫颈涂片图像的自动计算机辅助设计方案。对于宫颈涂片图像的细胞核分割,上下帽变换适用于增强灰度图像。由于细胞核,细胞质和背景的密度信息不同,采用基于密度原理的均值漂移聚类算法获得感兴趣区域。为了分割重叠的单元,应用自适应地选择侵蚀半径的灵活的数学形态方法可以获得更好的准确性和鲁棒性。对于细胞核的分类,提取了基于形状的 4 个特征,基于颜色空间的 138 个纹理特征和 60 个 Gabor 特征以形成初始特征集。最后,我们组织了几个实验,包括:1)记录分类没有 Gabor 的阳离子结果和 Gabor 初始特征集分别作SVM分类器的输入; 2)记录分类特征选择和无特征选择的结果分别; 3)比较状代理遗传算法(CAGA)的分类结果[35], P值算法[36] 和MRmMC[33]基于特征选择。
本文的主要贡献如下:1)数据库包括未涉及的细胞图像(细胞理学和细胞学图像)来自异常患者的恶性细胞。对未涉及的细胞的研究可以证明该技术在检测细胞病理学中细胞发育异常方面的潜力。2)提出了一种基于多特征 均值漂移聚类的弹性数学形态学的宫颈涂片图像自动分割方法。3)研究不同类型的特征用于检测发育异常变化,包括作为全局特征的形状和统计纹理特征以及作为局部特征的Gabor特征。4)特征选择可以降低时间成本,提高分类性能。
本文分为五个部分。 第1节介绍了宫颈细胞核分割和分类方法的综述。第2节描述了本文中用于分析的图像的采集进度。 第3节介绍了细胞分割阶段的方法。还描述了特征提取,选择和分类算法。第4节显示了实验结果和分析。第5节介绍了讨论。最后,第6节得出结论。
2.细胞图像的获取和分类
通过安装在显微镜上的数码相机以40x放大率捕获细胞图像。捕获的图像以JPEG格式存储为RGB彩色图像。由细胞病理学家审查数字化的细胞图像以对细胞图像进行分类。它被视为评估分类器效率的黄金标准。 图像以1388times;1040像素的分辨率显示,具有24位颜色深度。选择362个宫颈细胞图像进行分析,分类为118个正常细胞图像(来自正常患者的正常细胞),182个未涉及的细胞图像(来自患者的细胞病理学正常细胞)和62个异常细胞图像(来自异常患者的异常细胞)。 异常患者的细胞来自低度鳞状上皮内病变(LSIL), 高级别鳞状上皮内病变(HSIL)和鳞状细胞癌(SCC)。
3.细胞核检测和分割
虽然所有后续过程都基于分段结果,但是整个核被正确隔离是非常重要的,因此,提出了一种基于数学形态学均值漂移聚类算法的自动分割方法。 图1显示了该方法概述的方框图。整个方法可分为三个步骤,包括预处理,目标区域提取和重叠核孤立。预处理的目的是增强细胞核与其他区域之间的对比。 首先,将RGB图像转换为灰度图像,然后将上下帽变换应用于灰度图像。然后应用均值漂移聚类算法去除干扰并精确定位目标区域。最后,数学形态用于分割目标区域中的重叠核。
3.1预处理
由于数字化的显微技术和压缩过程,捕获的RGB 图像的背景照明通常不均匀。为了获得更好的分割效果,应用了上下帽变换(TBhat) 来增强细胞核与其他区域之间的对比[37].上下帽变换的两个重要步骤是顶帽(That)和底帽(Bhat)转换。设为灰度图像,增强关闭可以通过以下方式定义:
fenh= TBhat = f That - Bhat
That =f – (f o b ) (1)
Bhat = (f bull; b) – f
其中表链和f·b是灰度图像f结构元素b上的形态学打开和关闭操作。
图 1.所提出的分割方法的流程图
3.2用均值漂移聚类算法提取目标区域
在预处理之后,核和背景之间的对比度已经增强,但它们没有彼此分离。由于细胞核密度,细胞质和背景不同,我们可以利用密度信息来定位细胞核。因此,选择基于密度信息的均值漂移聚类算法来提取目标区域。该方法的基本思想是:首先,从每个像素中提取灰度和位置特征,以形成特征向量。然后,这些特征向量与均值移位聚类算法聚类。细胞核,细胞质和背景的密度不同。选择窗口参数r以获得最佳聚类量。还选择数量和簇的中心,并且对每个像素进行分组和标记。最后,根据像素的邻居连接理论再次对具有相同标签的区域进行分段。将像素数设置为mtimes;n。像素点(x,y)的位置特征X,Y可表示为:
X =omega;_xy * (x/ max(m, n)) , Y =omega;_xy bull; (y/max(m, n (2)
其中max(m,n)是最大值,⑴xy是空间位置特征的权重,它被设置为1,灰色特征设置为Gr。然后我们对这些特征应用高斯平滑以获得像素特征。对于上述分析和计算,图像的像素特征向量表示为:
Fi(i=1,mtimes;n)={Gr,X,Y} (3)
以下是具有consth的聚类算法。假设符号:Xi(i = 1,... n)表示像素的总数,K是聚类数,Ck(k = 1,...,K)是聚类中心,均值漂移聚类算法的伪代码描述如下:
算法:使用均值漂移聚类的目标区域提取
输入:xi (i= 1,...n)// n 是像素总数
输出:K,Ck(k = 1,hellip;,k)和每个簇的序列号
当 xi ne;empty; do时
从xi中选择一个点 x 作为第一个聚类的起点
构造半径为h 的超球面sh,以x 为中心,计算其中的数据点
计算均值漂移矢量Mh
5 如果 ‖Mh (x)‖lt;ε
如果 k = 0 或者 ‖x-ck ‖ge;h/2
k = k 1,Ck= x //创建新类
在窗口移位期间记录选票Ck
结束
计算 k = arg min || x - Ck || //找到最近的 Ck 到k
在窗口移位期间记录Ck 的选票。
12 否则如果 ‖Mh (x)‖gt;ε
在聚类期间,窗口参数bh对于不同的图像是不同的。因此,提出了聚类中的平均破碎(AS)和聚类之间的平均划分(AD)来决定聚类最佳聚类量。
, (4)
其中 Nk 是第 k 个簇的像素点数。簇中的 AS 是像素之间的差异。当AS较小时,像素更相似,AD 是聚类中心之间的距离,距离越大,聚类越不同。根据以上描述,K选择的规则是小AS 和大AD。因此,我们定义Rk = ASk / ADk 来选择K.
3.3分割重叠的细胞
在大多数情况下,细胞核轮廓表现出高径向对对称性。因此,单个和重叠的细胞区域通过以下步骤分开。
步骤 1:计算每个细胞的圆周半径(R)。
步骤 2:将 R 大于 0.6 的单元格保存为分割矩阵fout,将其他单元
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。