英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
用功率分析法确定汽车液压制动系统故障诊断的最小样本量
V. Indira1, R. Vasanthakumari2, R. Jegadeeshwaran3, V. Sugumaran3
(1. Sri Manakula Vinayagar Engineering College数学系,Madagadipet,本地治里,印度)
(2. Villianur College for Women数学系,Villianur,本地治里,印度)
(3.韦洛尔理工大学金奈校区机械与建筑科学学院,金奈 600127,印度)
摘 要:液压制动系统在汽车工程中被认为是最重要的组成部分之一。该部分的状态检测与故障诊断对乘客、车辆的安全以及缩减不必要的保养工时至关重要。液压制动系统状态检测中基于机器学习法的震动是获取动量。调整与测试分类仪是特征分类中最重要的两项任务。本项研究提出一种称为功率分析的系统的统计法以寻找将分类仪的统计能力调整到所需精度的最小样本量。C4.5决策树算法提供了描述性的统计特性以及更多的特征选择。功率分析的结果同样利用C4.5决策树算法校核。
关键词:故障诊断;机器学习;功率分析;振动信号;最小样本量;统计特性
- 引 言
制动系统是汽车上可以为车内乘员以及道路上的行人提供最高级别安全性的关键部件。对汽车驾驶员、乘员和汽车生产厂家来说制动失效的后果都是非常严重的。故障分析是液压制动系统预防性维护的重要环节,它可以避免在工作时由于部件的瑕疵所导致的严重的损坏。杜渐防微总是优于亡羊补牢,所以故障分析可以避免由于部分零件的故障而导致的整个制动系统的损坏甚至发生事故。故障分析模型可以随时测试系统的状态,避免出现意外失效。
本文之中仅将优质的振动信号和液压制动系统的九个故障条件作为故障诊断。振动信号由机器学习的方法采集。机器学习方法中重要的两项任务是对分类仪进行调整和测试。为了将故障诊断模拟为机器学习,对于研究所考虑的每个条件都需要大量的振动信号。这可以获得任何数量的良好状态的振动信号; 然而,获取不同故障条件的信号却是非常困难的。实际上,信号是从系统运行期间自然发生的故障中获取的。执行这一过程所涉及的困难迫使故障诊断工程师做出如此妥协。从具有典型预期故障的一个样本中获取许多振动信号是实际试验中的一个折中。而另一种折中方案是在该系统上模拟所需的故障类型,然后再从系统获取该故障类型的振动信号。为了解决这些问题,首先应该获得用于测试的样本数量,以获得良好的分类准确性。并且只有在知道调整分类仪使其获得良好分类准确度所需的最小样本数的情况下,才能从自然发生故障的系统获取信号。事实上,从这些信号中获得的任何结果本质上都会更切合实际。因此,关于构建模型或调整分类器所需的最佳样本数的信息是非常重要的。在这种情况下,确定最小样本量的研究是十分必要的。样本的特征对功率有直接的影响,高度多样化的样本需要调整样本大小。当结果必须非常准确时,足够的功率难以实现。非常高的置信度需要非常大的样本。一个功率不足的实验可能会导致研究人员放弃潜在可用的样本,因此功率分析是避免这些严重错误的最佳方法。
在机器学习中,构建模型所用样本量越大,模型可靠程度也会越高。在实践过程中,有必要了解构建拥有统计稳定特性的分类器所需的样本数量。许多研究人员在生物信息学和其他临床研究领域报道的最小样本量测定方面采取了不同的方法,例如微阵列数据[1],cDNA阵列[2]转录水平[3]等等。基于这些研究,可以开发有关数据驱动的假设,从而进一步进行振动信号的分析研究。尽管在[4,5]中已经报道了固定样本大小以调整振动分析的某些特定应用的分类仪,但相同的样本大小不能用于本研究。因此,本文着重于确定构建一个可靠的故障诊断分类仪所需的样本量。有很多方法可用于确定样本大小,即用于连续变量的测试[6],对于比例的测试[7],对于时间 - 事件(生存)数据[8],对于接受器操作曲线(ROC)分析[9],对于逻辑和泊松回归[10],重复测量[11],精度[12],配对样本[13],协议测量[14],以及功率[15]。除此之外还开展了另一些研究,以讨论关于估计方差的问题,基于临时数据的样本量重新估计[16],计划中期分析[17]和道德问题[18]的研究。但是,在利用这些技术以获得更好的统计稳定性时仍然需要解决一些问题。
在机器学习方法中,振动信号通常经受诸如假设检验,分类[19],依赖统计参数得出结论的回归和聚类等分析[20-23]。但是,只有少量振动信号才能可靠地估计这些参数。由于结论的统计稳定性在很大程度上取决于所用参数的准确性,因此需要一定的最小数量的振动信号来确保样本分布的可信度和参数值的准确性。本文的目的是确定使用基于F检验的统计功效分析来分离具有统计稳定性的类别所需的最少样本数量。
-
- 方法论
图1 流程图-方法论
在典型的汽车液压制动系统的帮助下,该方法已经得到了阐述。图1中展示了所提出的研究方法。参照图1,从制动装置获取不同故障条件下的振动信号,再从振动信号中提取描述性统计特征的数量。其中最重要的特征是使用决策树法选择的。所需的最少样本数由基于F检验的统计功效分析的统计稳定性分类法得出。最小样本大小也使用称为“C4.5决策树”的基于熵的算法来确定。最后将功效分析结果与C4.5决策树算法的结果进行比较,并在结论部分给出了所考虑系统的样本量指导原则。
- 实验研究
实验研究在图2 [24]所示的液压制动系统装置上进行。制动系统的测试装置是在售乘用车(铃木雨燕)的液压制动系统(如图2所示)。试验台的鼓式制动器和盘式制动器通过轴联接在一起。轴又利用皮带传动系统从直流电机(1HP)处获取动力。直流电机由一个内置驱动器组成。电动机的顶部放置杠杆,与加速踏板连接,提供最高达2500 rpm的转速。当加速踏板踩下时,连接在杠杆上的弹簧就会被压缩,从而使皮带轮轴与内置的驱动器连接,电力就会从驱动器传输到滑轮。当踏板松开时,弹簧的扩张使滑轮轴从驱动轴上脱离。制动踏板设置在加速踏板的左侧。它通过推杆连接到制动主缸中的活塞上。主液压缸是液压制动器最重要的部件,配有活塞,其能够沿孔进行运动。由于液压制动器是汽车等中型机动车中主要使用的制动系统结构,因此为了对实际销售中使用的汽车制动系统进行试验,本次实验使用了在售汽车的部件。试验台的尺寸为。
图3 (a)振动信号-制动没有任何故障 (b)振动信号-制动液有空气残留 (c)振动信号-制动器溢油 (d)振动信号-盘式刹车片磨损(均匀)-内部 (e)振动信号-盘式刹车片磨损(均匀)-内部和外部 (f)振动信号-盘式刹车片磨损(不均匀)-内部 (g)振动信号-盘式刹车片磨损(不均匀)-内部和外部 (h)振动信号-鼓式制动器机械褪色 (i)振动信号-鼓式刹车片磨损 (j)振动信号-制动液泄漏
图2 制动故障诊断-实验装置
图3 (接上)
获取振动信号的传感器是压电式加速度计。本次实验中使用的是测量参数为50g的单轴加速度计,灵敏度为,共振频率大约为40Hz。 实验所用的DAQ系统的型号是NI USB 4432。使用采样频率为24 kHz的数据采集系统采集振动信号。采用奈奎斯特采样定理,样本长度假定为1024。从液压制动系统取得55个样本。
测试台的初始状况良好(所有组件都是全新的)。 本次实验模拟测试了汽车使用过程中经常发生的九个最重要的故障状态。它们是制动液(AIR)中有空气残留,盘式制动器(BOS)上的制动油渗漏,鼓式制动器磨损(DRPW),盘式制动器摩擦片内部磨损(均匀)(DPWI),盘式制动器摩擦片内外磨损(均匀)(DPWIO),盘式制动器摩擦片内部磨损(不均匀)(UDPWI),盘式制动器内外磨损(不均匀)(UDPWIO),制动液渗漏(RL),鼓式制动器机械褪色(DRMF)。 振动信号由在恒定制动条件下工作的液压制动系统(原始速度667rpm,制动负载67.7N)测量。从加速度计,不同故障条件下的振动信号采用以下设置。
LabVIEW图形程序可以将测试信号存储在计算机中。然后对数字信号进行处理以提取包含与所考虑的故障条件相关的信息的不同特征。图3(a)-(j)显示了从制动实验设备获取的时域信号。当模拟的故障发生时,振动信号就会被记录下来,并利用这些振动信号进行特征提取和特征选择[24]。
- 特征选择
对代表振动信号的某些特定测量的计算过程称为特征提取。应选择广泛的统计参数作为研究的基础。它们是平均值,标准误差,样本方差,峰度,偏度,最小值,最大值,标准偏差,计数,模式和中位数。这些参数称为统计特征。可以使用表1中提供的公式计算统计参数。信号中包含的统计信息已使用带有Microsoft Office Excel的Visual Basic软件工具提取出来。表1中给出的统计特征是使用Microsoft Office Excel中的统计工具从原始振动信号中提取的。Sugumaran等人描述了提取统计特征的过程用于轴承故障诊断[23]。可利用Sugumaran等人的研究方法完成特征提取的步骤。
表1 |
||
统计特征定义 |
||
统计特征名称 |
公式/说明 |
|
|
|
|
标准差 |
|
|
样本方差 |
||
|
|
|
偏态 |
|
|
最大值 |
给定信号中的最大信号值 |
|
最小值 |
给定信号中的最小信号值 |
|
范围 |
给定信号的最大和最小信号值的差异 |
|
和 |
每个样本的所有特征值之和 |
|
平均值 |
一组值或分布的算术平均值 |
|
中位数 |
能将数值集合划分为相等的上下两部分的值 |
|
众数 |
统计术语,指的是在一组数字中最常出现的数字。即众数是最常出现在一组数据中的值。换句话说,这是最有可能被抽样的值。 |
目前多种技术可用于特征选择。常用的特征选择技术是主成分分析(PCA),遗传算法(GA)和决策树(DT)[23]。在Sugumaran等人的一项研究中,说明了使用决策树从给定的样本集中识别最佳特征选择以进行分类的情况[23]。最重要的特征将被放置在决策树的顶部,其他的将随之而排列于其后。由此可以确定最重要的特征,即最小值,标准误差,样本方差,峰度和偏态。
- C4.5决策树算法
故障诊断可以看作是一个数据挖掘的问题。其通过分类的过程从获取的数据中提取信息。分类的预测模型调用了通过逻辑过程识别的分支和主干的概念。任何好的分类仪都应该具有以下特性:
1)其应具有良好的预测精度,这是模型正确预测新的或以前未曾出现过的数据类别标签的能力。
2)其应具有良好的速度。
3)其生成和使用模型时所需的计算成本应尽可能低。
4)其应具有鲁棒性;鲁棒性是指模型能够根据丢失的值对嘈杂的数据做出正确预测的特性。
5)分类模型所提供的理解力应该足够高。
根据报告可知由J.R. Quinlan引入的C4.5模型满足上述标准,因此在本研究中使用与其相同的方法[25]。分类的过程通过一个决策树来完成,其叶子代表制动系统的不同故障条件。图2显示了从C4.5决策树算法中获得的决策树。以叶子结尾的连续分支过程是基于与个体特征相关的条件概率。决策树算法(C4.5)分为两个阶段:构建和修剪。构建阶段也被称为“成长阶段”[26]。按照习惯,样本分为两部分:调试集和测试集。调试集用于调试分类器,测试集用于测试分类器的有效性。采用10倍交叉验证来评估分类的精度。
使用具有连续估值属性的样本的C4.5的调试过程如下。
1)主干开始作为表示训练样本的单个节点。
2)如果样本都是相同的类,那么该节点变成一个叶子并且用该类标记。
3)否则,该算法离散每个属性以选择最优阈值,并使用称为信息增益(在5.1节中讨论)的基于熵的度量作为试探来选择将样本分成最佳单独类别的属性。
4)为测试属性的每个最佳离散时间间隔创建分支,并相应地对样本进行分区。
5)该算法递归地使用相同的过程来为每个
全文共11661字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[11213],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。