英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
滚动轴承故障诊断的多层域自适应方法
概要
在过去几年中,诸如深度学习的数据驱动方法已广泛应用于机械信号处理以开发智能故障诊断系统。在实际应用中,域移位问题通常发生在标记的训练数据(表示为源域)的分布与未标记的测试数据(称为目标域)的分布不同的情况下,这会导致诊断性能严重下降。本文提出了一种基于深度学习技术的滚动轴承故障诊断领域自适应方法。深度卷积神经网络被用作主要架构。最小化多层中两个域之间的多核最大均值差异(MMD),以使来自源域中的受监管的表示法适用于目标域。可以通过这种方式有效地提取域不变特征,并且可以显著提高跨域测试性能。
已对两个滚动轴承数据集进行了实验,以验证域自适应方法的有效性。与其他方法和相关研究间的对比证明了所提出方法的优越性。该研究的实验结果表明,所提出的域自适应方法为智能故障诊断提供了一种新的有前途的工具。
简介
滚动轴承是重型机械,制造系统等的关键部件,已广泛应用于现代工业。长期运行中意外的轴承故障导致维护成本高和安全性降低[1]。在过去的几十年中,轴承故障诊断得到了研究人员的广泛关注,并提出了大量的故障诊断方法[2-8]。特别是数据驱动的智能故障诊断方法,能够快速有效地处理收集的信号,提供可靠的故障诊断结果,并且不需要先前的专业知识,现在变得越来越流行[9-14]。通常,用于故障诊断的数据驱动技术是在假设训练和测试数据受到相同分布的情况下进行的。然而,在实际应用中,由于环境,操作条件,轴承质量等的变化,训练和测试数据的分布通常彼此不同,这降低了应用从标记中学习的模式知识的泛化能力。训练数据,表示为源域,指向新的未标记的测试数据,表示为目标域。这种模式学习有效性的挑战被称为域移位问题[15]。
图1给出了域移位的图示。 虽然可以使用标记的源域数据有效地训练分类器,但是由于域移位的存在,它会失去目标域上的分类有效性。这导致故障诊断中的严重性能下降。本文提出了一种基于多层域自适应的滚动轴承故障诊断的新型深度学习方法。如图1所示,期望通过联合最小化分类错误和源域与目标域之间的分布差异来解决域移位问题。
传统上,许多信号处理方法已应用于机械故障信号分析,包括小波分析[2,3],随机共振技术[4,16]等[5-8]。
图1.域适应的插图 三角形和圆形表示不同的两类
在过去十年中,基于机器学习和统计推断技术进行了大量研究,如人工神经网络(ANN)[9,10],支持向量机(SVM)[13,14],随机森林(RF)[17],模糊推理和其他改进算法[11,12]。通常,神经网络是识别故障和健康机器状况的最流行的数据驱动方法之一。通过特征提取将故障诊断视为分类问题。首先,原始输入信号被映射到代表性特征。然后根据提取的特征识别健康状况和相应的故障位置和严重性。
最近,深度学习网络正在成为一种高效的模式识别网络结构,它有可能克服当前智能故障诊断中的障碍。深度学习的特点是深度网络架构,其中多层堆叠在网络中,以完全捕获来自原始输入数据的代表信息[18]。借助复杂的深层结构,可以很好地模拟高层次的数据抽象,与浅网络相比,导致更有效的特征提取。深度学习方法引起了人们的极大兴趣,并在机械故障诊断研究中取得了显著成果[19-25]。在本研究中,深度学习被用作故障诊断的主要架构。
域自适应(DA)是利用源域中标记数据的转移学习的特殊情况,以学习目标域中未标记数据的分类器[15]。近年来,领域适应方法已成功开发并应用于许多实际任务,如情感分析[26],不同情境下的物体识别[27,28],面部识别[29],语音识别[30]。视频识别[31]等。通常,假设任务对于不同的域是相同的,即共享类标签,并且源域与目标域相关。但是,这两个域不遵守相同的分布。域差异在跨域调整训练有素的模型方面存在障碍。在轴承故障诊断中,域转移在工业中非常普遍。例如,对于相同的故障位置和严重性分类任务,数据的分布可能随着不同的转速和电动机负载而显着不同。基本上,将学习的故障模式应用于新的操作条件需要特别定制以适应新的域数据。一种解决方案是通过在目标域中获取一定数量的有效和标记数据。然而,在大多数情况下这是耗时且昂贵的,甚至在一些实际应用中也是不可行的。另一方面,可以进一步探索标记的源域数据和未标记的目标域数据以校准建立的模型,以便在新情况下实现期望的性能,这在现实世界的应用中相对容易实现并优选。这种方法可以通过使用未标记的目标数据调整从源域训练的建立模型,或者利用所有可用数据开发新模型来实现。
域自适应通过探索弥合分布差异的域不变结构来建立从源域到目标域的知识转移[32]。在过去几年中,大量研究人员一直在尝试从数据构建域不变模型,这最小化了潜在特征空间中的分布差异。在[33-35]中,通过最小化差异来学习浅域不变特征。此外,最新的研究表明,领域适应的深度学习架构能够学习更多可转移的特征,因此更有前途[36-39]。
通常,深层体系结构通过层提取从通用到特定于任务的功能。一些研究发现,随着域差异的增加,特征可转移性在较高层中显着下降[38],而另一些研究报告认为较低层可能对域偏差负责[40]。基于对文献中域差异的最新理解,我们尝试通过最小化整个深度网络中的分布差异来增强特征可转移性。具体地,多层的表示被嵌入到再生核Hilbert空间中,其中不同的平均嵌入域分布可以明确匹配。由于平均嵌入匹配不可避免地受到内核选择的影响,因此进一步设计了多内核方法以利用不同的内核并为最佳内核选择制定原则方法。
尽管通过域适应取得了成功,但在其在故障诊断中的应用方面可以找到有限的研究。 Lu等人提出了一种基于深度神经网络的域自适应诊断方法,其中特征最大均值差异(MMD)被最小化,并且权重正则化项用于增强代表性特征。
张及其同事[41]提出了一种自适应批量归一化方法,以提高神经网络的域适应能力。谢等人[42]利用传输分量分析(TCA),利用频谱包络预处理和时域同步平均原理,解决了时域和频域的跨域特征提取和融合问题。在[43]中,源域数据用作辅助数据以辅助目标数据分类。
本文提出了一种基于深度卷积神经网络的滚动轴承故障诊断域自适应方法。机械振动数据用作模型输入。假定标记的源域数据和未标记的目标域数据可用。与现有研究不同,源域数据和目标域数据之间的多层和多核最大均值差异被最小化以解决域移位问题。对两个滚动轴承数据集进行了实验,以验证所提方法的有效性。在不同情况下广泛评估诊断性能。结果表明,多层而不仅仅是最后一层通过网络对域偏差做出贡献,并提出了应用多层MMD的必要性。通过与其他方法和相关工作的比较,证明了该方法的优越性。
本文的其余部分从第2节的理论背景入手。介绍了域适应问题,卷积神经网络,MMD和softmax分类器。所提出的故障诊断方法在第3节中给出,并在第4节使用两个滚动轴承数据集进行实验验证。我们在第5节中得出结论。
2理论背景
本节介绍了故障诊断的领域适应问题,介绍了卷积神经网络,最大均值差异和softmax回归的预测。
2.1问题表述
传统上,机械故障诊断旨在基于先前已知的故障集来识别故障位置,严重性等。假设源域和目标域分布是相同的,并且来自标记的训练样本的学习的故障模式可以直接应用于未标记的测试样本。然而,源域和目标域之间的差异不可避免地存在于实际任务中,这使得模型泛化能力在域之间恶化。因此,本研究调查了转移学习问题,定义为定义1(转移学习)。给定源域和学习任务,目标域和学习任务,转移学习旨在使用和中的知识帮助改善中目标预测函数的学习,其中=或=[44]。
具体而言,在一般转移学习框架内,域转移问题集中在有关滚动轴承故障诊断任务上。一般而言,本研究是在以下假设下进行的:
1.对于不同的主电源,故障诊断任务保持相同,即共享类标签。
2.源域和目标域彼此相关,但具有不同的分布。
3.来自源域的标记样本可用于培训。
4.来自目标域的未标记样本可用于培训和测试。
为了解决域移位问题并更好地将学习的故障模式从源域概括到目标域,开发了域自适应方法。设表示输入空间,表示可能的机器健康状况的集合。我们给出了标记样品的源域和未标记样品的靶域。和分别从关节分布P(X,Y)和Q(X,Y)中取样,并且Pne;Q。本文的目的是构建一个深度神经网络,它能够减少关节分布中的跨域位移,学习域不变特征和分类器,以最小化具有源监督的目标风险。
2.2 最大平均差异
在这项研究中,采用最大平均差异(MMD)来衡量分布之间的差异[45]。 MMD定义为再生核Hilbert空间(RKHS)中边缘分布的内核嵌入之间的平方距离。
其中表示赋予特征核k的RKHS。当且仅当P = Q时,最重要的属性是(P,Q)= 0。
如[46]中所述,内核选择对于确保MMD的测试能力和低测试误差至关重要,因为不同的内核可能在不同的RKHS中嵌入概率分布,其中可以强调不同的足够统计的顺序。因此,在本研究中,我们采用MMD的多个内核来利用不同的内核,并为最佳内核选择制定原则方法。具体而言,使用 RBF核的混合物,
其中表示带宽参数为的高斯核。在实验中,发现使用简单的带宽参数值和5个核的混合物能够获得良好的结果[47]。因此,在本研究中,默认带宽参数被选择为1,2,4,8和16,并且为了简单起见,它们的权重保持相等。
2.3 卷积神经网络
本研究中使用了专为可变和复杂信号设计的卷积神经网络(CNN)。 在过去的几年中,大量的研究[22-48]受益于CNN的局部感受野特征,共享权重和空间子样本。
卷积层使用原始输入数据卷积多个过滤器并生成特征,然后以下池化层提取最重要的局部特征。 以下简要介绍1维(1D)CNN。
假设输入顺序数据为其中N表示序列的长度。 卷积层中的卷积运算可以定义为滤波器内核w,w和串联矢量表示。之间的乘法运算,可以表示为
图2.提出的用于故障诊断的深度学习架构。 Conv1到Conv4表示4个卷积层,其后是批量标准化(BN)和ReLU激活。
其中表示从第i个点开始的长度顺序信号的窗口,并将数据样本连接成更长的嵌入。 最终的卷积操作定义为,
其中表示矩阵的转置lowast;,b和 ϕ分别表示偏置项和非线性激活函数。 输出可以被认为是相应子序列上的滤波器内核w的学习特征.滑动滤波器窗口从样本数据中的第一个点到最后一个点,第j个特征映射可以获得过滤器,表示为,
在CNN中,可以在具有不同滤波器长度的卷积层中应用多个滤波器内核。
3.提出的故障诊断方法
3.1网络架构
在本文中,我们关注域适应的研究,并且为了简单起见使用传统的深CNN架构。图2显示了用于机械故障诊断的所提出的网络的结构。通常,所提出的深度学习方法结合了两种架构思想,用于更好地提取振动信号,即CNN和完全连接层。
首先,四个堆叠的1D卷积层被设计用于特征提取,并且为了方便起见它们应该共享相同的配置。在每个卷积层中使用长度窗口大小的局部滤波器,并且实施零填充操作以保持特征映射维度不变[49]。每个卷积层之后是最大池层,以减少数据维度,同时保持重要的空间信息。以这种方式,获得输入数据的不同级别的表示。
接下来,学习的高级特征表示被展平并连接到完全连接(FC)层。在该层中使用压差技术,速率为0.5,以避免过度拟合[20]。最后,采用softmax回归来预测故障类别。
批量归一化(BN)是用于加速训练过程的有效技术,并且可以被认为是网络中的层操作。 BN最近在不同的深度学习相关任务中取得了良好的表现[50],并且有望用于故障诊断研究。在这项研究中,在每个卷积层之后使用BN,之后实现激活功能,如图2所示。此外,整流线性单元(ReLU)激活功能通常用于网络[51]。他们做在训练过程中不会出现梯度消失或梯度扩散。因此,通常可以实现更好的性能,尤其是在深层架构中[52]。
基于先前的研究,卷积滤波器的数量和大小可以显着影响网络性能。由于卷积参数与层的分布差异密切相关,因此预计它们将对所提出的方法产生显着影响,并将在4.3.4节中进行研究。默认情况下,本文中过滤器编号为10,过滤器长度为10,完全连接层有256个神经元用于最终回归。
3.2 优化目标
如2.1节所述,本研究中不同域的故障诊断任务相同,表明类别是共享的。由于标记的训练样本可用,因此第一优化目标是最小化训练样本的分类误差。在这种情况下,交叉熵函数用作损失函数[53]。
此外,为了有效地推广从源域训练到目标域的分类器,假设输入数据的两个域分布从学习的特征表示(即网络中的隐藏层)彼此更接近地绘制。因此,2.2节中描述的分布之间的多内核MMD用作优化目标。
虽然MMD已经在文献中被采用并且获得了良好的领域适应结果,但是大多数研究旨在最小化网络的最后一层中的分布差异。然而,正如[32]中所指出的,特征可转移性在多个顶层中恶化,并且适应单个层不能有效地消除源域和目标域之间的偏差,因为其他层可能不可转移。此外,最近的研究指出,第一层比后面的层更容易发生域移位[40]。因此,在本文中,我们通过联合调整表示层和分类器来开发域自适应方法,并采用多层MMD。预计这将弥合边际分布和条件分布背后的领域差异[54]。 MMD损失定义为,
其中L表示MMD损失被计算和使用的层,K表示内核集,和分别是源样本和目标样本的第l层表示,表示MMD之间的MMD。使用内核k在第l层表示上评估源域和目标域。
通过整合交叉熵损失函数,最终目标函数可表示为,
其中表示本文中默认值为1的惩罚系数。
3.3诊断程序
所提出的故障诊断方法的流程图如图3所示。首先,通过传感器收集原始机械振动信号,并根据标记的源域和未标记的目标域数据准备训练和
全文共9042字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[2182]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。