您的当前位置:首页正文

毕业设计(论文)-K-均值聚类算法在滚动轴承故障诊断中的应用.doc

2020-07-09 来源:榕意旅游网


吉 林 农 业 大 学

学 士 学 位 论 文

题目名称: K-均值聚类算法在滚动轴承故障诊断中的应用

学生姓名:

院 系: 专业年级:

指导教师: 职 称:

2013年5月23 日

目 录

K-均值聚类算法在滚动轴承故障诊断中的应用............................ I 摘要................................................................ I 1 前 言............................................................. 1 1.1 研究背景........................................................ 1 1.2 研究意义........................................................ 2 1.3 本论文研究数据及内容............................................ 2 2 K-均值聚类算法.................................................... 3 .................................................................... 3 2.2 K-均值聚类算法介绍.............................................. 3 2.3 K-均值聚类算法基本思想.......................................... 4 2.4 相似性度量及聚类准则函数........................................ 4 2.6 K-均值聚类算法描述.............................................. 5 2.5 K-均值聚类算法过程.............................................. 5 3 实验结果及分析.................................................... 5 3.1 K=2时聚类结果 .................................................. 6 3.2 K=4时聚类结果 .................................................. 8 参考文献........................................................... 11 致 谢.............................................................. 12 附 录.............................................................. 13

K-均值聚类算法在滚动轴承故障诊断中的应用

姓 名:

专 业:信息与计算科学

指导教师:

摘要:滚动轴承作为旋转机械中重要的零部件,对整个机械设备的正常工作起到举足轻重的作用,然而滚动轴承又是其中极易损坏的元件之一。据粗略估计,有30%的机械故障是由滚动轴承的故障引起的,因此对滚动轴承故障的诊断对机械的正常工作有重要意义。其中聚类算法在滚动轴承中得到了广泛的应用。聚类算法是数据挖掘领域中非常重要的研究方向,其中K-均值聚类算法是一种简单快速的聚类算法。把K-均值聚类算法应用到滚动轴承故障诊断中可以快速高效的验证实验结果的正确性,做到对错误的检测,从而可以减少经济损失。本文主要运用K-均值聚类算法对实验中提取的滚动轴承故障数据进行聚类分析,以验证实验结果的正确率。

关键字:滚动轴承;故障诊断;K-均值聚类;聚类中心

The application of K-means in fault diagnosis of rolling

bearing

Name:

Major: Information and Computing Sciences Tutor:

Abstract: As the important components in rotating machinery, the rolling bearing plays a decisive role, but the rolling bearing is one of the easily damaged components. According to the rough estimate, 30% of the mechanical failure is caused by the fault of rolling bearing; therefore the diagnosis of the rolling bearing fault has important significance. The clustering algorithm has widely used in the diagnosis of the rolling bearing fault. The clustering algorithm is a very important research direction of the data mining technology, and K-means is one of the clustering algorithms, which is easy and quick. If we apply the K-means to the fault diagnosis of the rolling bearing, we can verify the experimental result fast and efficient and also can detect the error, therefore reduce the economic loss. This text mainly applies the K-means to analyze the data of the diagnosis of the rolling bearing, which are collected from the

I

experiment, to test the accuracy of the experiment.

Key words: rolling bearing; fault diagnosis; K-means clustering; cluster center

II

1 前 言 研究背景

滚动轴承是将运转的轴座与轴之间的滑动摩擦转变为滚动摩擦的,从而达到减少摩擦损失的目的,是一种精密的机械元件。滚动轴承一般由内环、外环、滚动体与保持架组成,内环与轴相配合并与轴一起旋转;外环与轴承座相配合起到支撑作用;滚动体借助于保持架均匀的将滚动体分布在内环和外环之间,其形状大小和数量直接影响着滚动轴承的使用性能和寿命;保持架能使滚动体均匀分布,防止滚动体脱落,引导滚动体旋转起润滑作用。

滚动轴承支撑转动的轴以及轴上零件,并保持轴的正常工作位置和旋转精度,滚动轴承使用维护方便,工作可靠,启动性能好,在中等速度下承载能力较高。

滚动轴承是机械应用中最为广泛的机械零件,同时,它也是机器中最容易受到破坏的元件。大部分的旋转机械的故障引起都与滚动轴承的状态有关。据不完全统计,在使用滚动轴承的旋转机械之中,大约有30%的机械故障都是由于轴承而引起的。由此可见,轴承的好坏对机器工作状态影响极大。通常,由于轴承的种种缺陷会导致机器产生振动以及噪声,甚至还会引起机器一定程度的损坏。而在一些精密机械中(精密机床主轴、陀螺等),对轴承的要求就有更高的标准,哪怕是轴承上有微米级的小缺陷,都会导致整个机器系统的精密程度遭到破坏。最早使用的轴承故障诊断方法是将听音棒接触轴承部位,完全依靠听觉来及经验判断轴承有无故障。这种方法今天仍在使用,不过已经逐步被电子听诊器来替代听棒用来提高灵敏度。后来逐步采用各式测振仪器、仪表并利用位移、速度或加速度的均方根值或峰峰值来判断轴承有无故障。这样可以减少对设备检修人员的经验的依赖,虽然这样,但还是仍然很难发现早期故障。随着对滚动轴承运动学、动力学的深化的研究,以及对轴承振动信号中频率成分和轴承零件的几何尺寸及缺陷类型的关系都有了比较清楚的了解,FFT级数的发展也使得利用频率域分析和检测轴承故障成为一种很是有效的途径。也是目前滚动轴承监测诊断的基础。

滚动轴承是一种广泛应用于国民经济和国防事业各个领域的重要的机械基础件。主要体现在以下几个方面:

(1) 在国民经济中---滚动轴承被称为“工业的关节”。 (2) 在国防事业上---滚动轴承是必备的军备物资。

(3) 在技术地位上---轴承钢是各种合金钢中要求技术指标最多而且最

严的钢种。

1

滚动轴承在长时间的摩擦运动中,由于种种原因,各个部件都会产生不同程度的故障。为此要进行故障诊断。

研究意义

由以上叙述可知,如果我们对滚动轴承产生的故障视而不见,任由出现故障的轴承运行,可想而知,一旦不及时作出相应的补救措施,那将会造成多大的经济损失。其中对故障数据进行聚类能够分清数据故障的类型,是哪个部件产生的故障。每个部件产生故障时,不同部件间相同的故障特征会表现出不同。我们对滚动轴承的每个部件提取故障特征值,以确定滚动轴承各个部件是否正常。如果某个部件出现较大故障,要及时采取措施,以免造成重大损失。由于不同部件间相同的故障特征会表现出不同,比如说内环故障数据和外环故障数据会有所不同,因此我们可以对实验提取的实验数据聚类,以确定实验数据的正确性,避免在对故障进行采取措施是出现不必要的损失。我们对故障数据聚类时,各个部件的故障数据会被聚为不同的类簇,这样就可验证实验的正确性。可见,对滚动轴承故障数据进行聚类具有重大意义。

综上所述,在机械设备中,滚动轴承是一种通用的连接和传递动力的零部件,几乎在任何大型设备中滚动轴承都起着重要作用。运用先进的技术,我们可以对轴承进行状态监测和故障诊断,可以实现从时候维修、定期维修到监测维修的转变,这样可以减少不必要的人力和物力浪费,以提高经济效益。

本论文研究数据及内容

本文对从6205型深沟球滚动轴承提取的振动数据进行聚类分析,以验证实验结果的正确率。所采集的数据均存储为* .mat 格式( MATLAB 格式文件) 。 数据文件中包含有以下数据: 1.滚动轴承正常数据; 2.滚动轴承内环故障数据; 3.滚动轴承滚动体故障数据; 4.滚动轴承外环故障数据。

针对以上数据,本文主要运用K-均值聚类算法对数据进行聚类。K-均值聚类算法是基于划分的算法,它通过进行不断的迭代进行聚类,当算法满足收敛条件时停止迭代过程,输出聚类结果。K-均值聚类算法具有思想简单、收敛快速的优点,对大量数据进行聚类具有较高的效率,因此使得其成为一种最常用的聚类算法之一。当聚类数目设置为2时,将正常数据与故障数据聚为两个类别;当聚类数目为4时,将各种状态的数据各聚为一类。给出实验的结果的正确率以验证

2

实验结果的正确性。

2 K-均值聚类算法

聚类分析是由若干模式组成的。通常,模式也就是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在同一个聚类中的模式之间比在不同一聚类中的模式之间具有更多的相似性,以此为根据进行聚类。

在自然科学和社会科学中,存在着大量的分类问题。类,就是指相似元素的集合。聚类分析也称为群分析,它是研究分类问题的一种统计分析方法。聚类分析起源于分类学,在早时的分类学中,人们主要是依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。伴随着人类科学技术的发展,人们对分类的要求越来越高,以致很多时候仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,随后又将多元分析的技术引入到数值分类学形成了聚类分析。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

聚类算法要求有可伸缩性、处理不同类型属性的能力、发现任意形状的聚类、用于决定输入参数的领域知识最小化、处理“噪声”数据的能力、对于输入记录的顺序不敏感、高纬度、基于约束的聚类、可解释性和可用性。

聚类分析的计算方法主要有如下几种: 1.划分法; 2. 层次法; 3. 密度算法; 4. 网格算法; 5. 模型算法; 6. K-MEANS; 7. K-MEDOIDS;

2.2 K-均值聚类算法介绍

K-均值聚类算法是一种数据挖掘技术,由于本算法思想简单,容易得到实现,而且对于求解大数据问题有较好的时间性能,因此K-均值聚类算法成为目前最常用的聚类算法之一。K-均值聚类算法是基于最小误差平方和,通过不断的迭代过程进行聚类,它能找到关于聚类误差的局部的最优解,在很多的聚类问题上能

3

够快速求解。

2.3 K-均值聚类算法基本思想

该算法是将含有n个数据点的数据集合Xx1,x2,...,xn划分为K个类簇Cj的问题,其中j1,2,...,K;第一次迭代时随机选取K个样本数据作为初始聚类中心,集合中其余的样本被分到K个初始聚类中心所代表的类簇Cj中,这样对每一个分配完的类簇计算新的聚类中心,Xx1,x2,...,xn就被分为K个类簇。

按照新的聚类中心进行聚类。不断进行上述过程,直到前后两次的聚类中心不再发生变化,则算法停止,否则继续进行迭代。

2.4 相似性度量及聚类准则函数

在运用K-均值聚类算法对数据集进行聚类时要选定某种距离作为样本间的相似性度量,在计算不同数据样本之间的距离时,我们可以选择不同的距离计算方法,列如欧氏距离、曼哈顿距离以及明考斯距离。选择欧氏距离作为数据样本间的相似性度量。

聚类准则函数一般采用误差平方和准则函数,用来评价聚类性能。 此算法的特点为每次进行迭代时,都要对数据集合中的样本数据进行聚类,再次计算新的聚类中心,进行下一次的迭代过程。如果在某一次迭代过程中所有的类簇没有发生变化,相应的聚类中心也没有发生变化,此时标志着聚类准则函数已经收敛,算法结束。 选择欧氏距离作为相似性度量:

对于两个数据样本:xixi1,xi2,...,xin; xjxj1,xj2,...,xjn;则他们之间的欧氏距离为:

dxi,xjnxk1ik2xjk; (2-1)

欧氏距离越小两个样本之间的相似程度越大,差异度越小;反之样本之间的相似程度越小,差异度越大。

使用误差平方和函数评价聚类性能:

给定数据集X包含K个聚类子集x1,x2,...,xk;各个聚类子集中的样本数量分别为

n1,n2,...,nk;各个聚类子集的聚类中心分别为m1,m2,...,mk;则误差平方和准则函数为:

E||pmi||2; (2-2)

i1pXik 4

2.6 K-均值聚类算法描述

1. 为中心向量M1,M2,...,Mk初始化k个种子; 2.分组:

(1) 将样本分配给距离其最近的中心向量; (2) 由这些样本构造互不相交的聚类; 3. 确定聚类中心;

用聚类各自的中心向量作为新的中心;

4.重复分组和确定聚类中心的步骤,直到算法收敛;

2.5 K-均值聚类算法过程

输入:样本数据集Xx1,x2,...,xn,聚类数目K; 输出:K个类簇Cj,j1,2,...,K; 算法流程:

1: 随机选取K个样本数据Mjxi,j1,2,...,K,i1,n;作为初始聚类中心; 2: 计算每个样本数据与Mj的距离,dxi,Mj,i1,2,...,n,j1,2,...,K; 如果有

dxi,Mjmindxi,Mj; (2-3) 成立.

则xi属于类簇Cj;并计算误差平方和E;

3: 计算新的K个聚类中心并把上次迭代过程的聚类中心保存

MoldjMj; j1,2,...,K;

Mj1/nsumCj; (2-4) 4: 判断算法是否停止;

如果MoldjMj;j1,2,...,K;则算法停止;否则转向步骤2.

3 实验结果及分析

由于篇幅原因,表3-1只列出了部分故障样本的数据量,其中1组,2组,3组样本为正常样本;4组,5组,6组样本为滚动轴承内环故障样本;7组,8组,9组样本为滚动轴承滚动体故障样本;10组,11组,12组样本为滚动轴承外环故障样本。

我们将运用K-均值聚类算法对以下12组样本数据聚类,对K值分别取不同的值,把正常数据和故障数据聚为不同的类别。这里我们令K的值分别取2和4,

5

分别对应K-均值聚类算法把实验数据聚为2个类别和4个类别。

表3-1不同故障类型样本特征量

Table 3-1 different fault types sample characteristics

特征 样本 ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) 1

2 0.1888

3

4

5

6

7

8

9

10

11

12

*(106)

3.1 K=2时聚类结果

结果显示:

用K-均值聚类算法对以上12组样本数据聚类,当K值取2时,12组样本数据被聚为两组,滚动轴承正常数据和滚动轴承滚动体故障数据被聚为一类,滚动轴承

6

内环故障数据和滚动轴承外环故障数据被聚为一类;聚类中心如表3-2。

表3-2 聚类中心 Table 3-2 clustering center

M1 M2

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10)

102 0.0479 0

*(106)

聚类结果如表3-3,表3-4所示。滚动轴承正常数据和滚动轴承滚动体故障数据聚为一类,这说明正常数据和滚动体的故障数据之间的相似程度相比其他部件之间的相似程度要更大一些。

表3-3 类簇C1 Table 3-3 cluster C1

特征 类簇 C1

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C1

C1

C1

C1

C1

*(106)

滚动轴承内环故障数据和滚动轴承外环故障数据被聚为一类,这说明内环故障数据和外环故障数据之间的相似程度相比其他部件之间的相似程度要更大一些。

7

表3-4 类簇C2 Table 3-4 cluster C2

特征 类簇 C2

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C2 347

C2

C2

C2

C2

*(106)

3.2 K=4时聚类结果

结果显示:

当K值取4时,12组样本数据按故障类型分成了四类,即正常、内环故障、外环故障、滚动体故障样本。第一类,1,2,3组样本被聚为一类;第二类,4,5,6组样本被聚为一类;第三类,7,8,9组样本被聚为一类;第四类,10,11,12组样本被聚为一类。聚类结果与实验数据完全吻合。这说明实验中所检测的数据分类没有错误。

聚类中心如表3-5,聚类结果如表3-6,表3-7,表3-8,表3-9所示。

表3-5 聚类中心 Table 3-5 clustering center

M1

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10)

0.0395

8

M2 M3 M4

0.0354

0.0479

0.0415

*(106)

表3-6 类簇C1 Table 3-6 cluster C1

特征 类簇 C1

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C1

C1

*(106)

表3-7 类簇C2 Table 3-7 cluster C2

特征 类簇 C2

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C2

C2

*(106)

9

表3-8 类簇C3 Table 3-8 cluster C3

特征 类簇 C3

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C3

C3

*(106)

表3-9 类簇C4 Table 3-9 cluster C4

特征 类簇 C4

ch(1) ch(2) ch(3) ch(4) ch(5) ch(6) ch(7) ch(8)* ch(9) ch(10) C4

C4

*(106)

综上可知,从6205型深沟球滚动轴承所提取的实验数据分类正确。

在进行的反复多次的实验中,我们对从实验中提取的四类滚动轴承故障数据,正常数据,轴承滚动体故障数据,轴承内环故障数据,轴承外环故障数据,运用K-均值聚类算法进行的多次计算中,绝大多数次的计算结果与实验提取的数据完全吻合。因此,我们可以认为实验说句是正确的,这说明实验中所检测的数据分类没有错误。

介绍了基于K-均值聚类算法在滚动轴承故障诊断中的应用,K-均值聚类算法

10

可正确地将含不同故障类型的样本集进行正确分类。用K-均值聚类算法对不同故障类型进行分类,验证了实验数据的正确性。

参考文献

[1] LLC Books. Cluster Analysis: Clustering Criteria, Data Clustering Algorithms,

Mixture Model, K-Means Clustering, Information Bottleneck Method, Min[M]. Books LLC, Wiki Series.

[2] Gina M Siemieniec. Asa and Homogeneity Hypothesis Using K-Means Cluster

Analysis[M]. Proquest, Umi Dissertation Publishing.

[3] Micheline Kamber,裴健.数据挖掘:概念与技术[M].范明,孟小峰译.原书

第3版.机械工业出版社.

[4] Toby Seqaran, Jeff Hammerbacher.数据之美[M].祝洪凯,李妹芳,锻炼译.机

械工业出版社.

[5] Pang-Ning Tan, Michael Steinbach.数据挖掘导论[M].范明,范宏建译.第二版,

人民邮电出版社,2011年.

[6] 威腾,弗兰克.数据挖掘:实用机器学习技术[M].第二版,机械工业出版社. [7] 刘国伟.MATLAB程序设计教程(第二版)[M].中国水利水电出版社. [8[M].高等教育出版社.

[9[M].第一版,机械工业出版社,2011年. [10[M].第一版,中国石化出版社,1012年.

[11] 张志涌.精通MATLAB R2011a[M].北京航空航天大学出版社.2011年. [12] [M].北京航空航天大学出版社.

[M].喻文建译.机械工业出版社,第一版,2006.

和优化K-均值算法诊断滚动轴承故障[J].计算机应用研究,2012年,第29卷第

7期.

11

致 谢

本文是在老师的悉心指导下完成的。从毕业设计题目的选择到对课题的研究和论证,再到本论文的编写以及反复修改的过程,老师给予我细心的指导和认真的解析。

在老师的指导下,我在论文写作方面的能力有所提高。老师以严谨求实,一丝不苟的治学态度和勤勉的工作态度深深感染了我,给了我巨大的启迪,鼓舞和鞭策,并成为我人生路上的学习榜样。在此,向老师表示衷心的感谢!

还要感谢我们同一小组的几位同学,在论文设计期间共同探讨问题,并指出我在设计上的误区,使我能及时发现问题,从而把设计顺利进行下去,没有你们的帮助我不可能这样顺利地结稿,在此表示深深的谢意。

12

附 录

基于EMD 和优化K-均值聚类算法诊断滚动轴承故障

摘要: 考虑到滚动轴承振动信号的非平稳特征和实际应用中典型故障样本不易获得等原因,而在实际应用中,故障程度识别和故障类型诊断一样重要,提出一种滚动轴承故障类型及故障程度识别方法。首先对原始振动信号进行EMD 分解,对含故障特征的IMF( intrinsic mode function) 分量进行信号重构,随后对重构信号进行Hilbert 包络谱分析,在提取特征量的基础上,应用优化K-均值聚类算法进行故障类型和故障程度分类。实验结果表明: 基于EMD 和优化K-均值聚类的故障类型和故障程度识别算法,可将含不同故障类型的样本集,按故障类型进行正确分类; 也可将含同种故障类型、不同故障程度的样本集,按故障程度进行正确分类。

关键词: 滚动轴承; 故障诊断; 故障程度; EMD; K-均值聚类

0 引言

滚动轴承作为机械设备中一种通用的连接和传递动力的零部件,几乎在任何大型设备中都具有重要作用。采用先进技术对轴承进行状态监测和故障诊断,可实现轴承由事后维修、定期维修到监测维修的转变,减少不必要的人力和物力浪费,为提高经济效益贡献力量。

现在已经有很多学者在轴承故障诊断和故障程度识别方法上取得了成绩,小波变换[1]、Wigner-Ville 分布[2]、Hilbert-Huang 变换( Hilbert-Huang transform,HHT) [3,4]、EMD[5 ~ 7]已经被用于滚动轴承故障诊断中,并取得了不错的效果。Wigner-Ville 分布在对多分量信号进行分析时易产生交叉项,这一缺陷限制了其广泛应用; 固定的小波基和恒定的分辨率使得小波分析没有摆脱傅里叶分析的局限。EMD 能根据信号的局部特征,自适应地将一个复杂信号分解为一系列本征模态函数IMF,每一个IMF 分量都对应真实的物理意义。与窗口傅里叶变换、Wigner-Ville、小波变换对比来说,EMD 是一种具有自适应的多分辨率分析方法,它非常适合对非线性、非平稳信号进行分析[8]。已经有许多学者将EMD 与模式识别方法结合起来应用于机械系统的故障诊断,但已有的诊断方法大多对训练样本的数量和质量有一定的要求,且大多诊断方法只对故障类型进行了分类,而对于在实际应用中至关重要的故障程度并没有太多涉及。文献[9]将EMD 与神经网络模式识别方法相结合对滚动轴承进行故障诊断,此方法需有足够数量的样本来训练神经网络,且对训练样本的质量要求较高; 文献[10]提出了一种基于经验模态分解和支持向量机的柴油机振动信号分析方法,

13

该方法也需要一定数量具有典型故障特征的训练样本,在少量训练样本的情况下,支持向量机的总体分类性能会有所降低。针对传统信号分析方法对滚动轴承振动信号等非稳定信号分析不具有自适应性,以及实际典型故障样本不易获得等原因,本文提出了一种基于经验模态分解和优化K-均值聚类的滚动轴承故障诊断方法,该方法可自适应地将样本按故障类型和故障程度进行分类,该方法具有算法简单、结果准确的优点。

文中所用数据均来自美国Case Western Reserve University电气工程实验室的滚动轴承故障模拟实验台[11],该实验台包括一个2 马力的电动机、一个扭矩传感器和一个功率测试计。待检测的轴承位于电动机的两端,驱动端轴承型号为SKF6205,风扇端轴承型号为SKF6203,轴承故障点用电火花加工而成,损伤点的直径分别为0. 1778 mm、0. 3556 mm、0. 5334mm。其中,轴承外圈的损伤点分别在时钟: 3 点钟、6 点钟、12点钟三个方向,振动数据由布置在电动机外壳上的振动加速度传感器采集得到,采样频率为12 kHz,功率和转速通过扭矩传感器/译码器测得。所采集的数据均存储为* . mat 格式( MATLAB 文件) 。

6 结束语

介绍了基于EMD 和优化K-均值聚类算法的滚动轴承故障诊断和故障程度识别新方法。通过对滚动轴承正常、内环故障、外环故障和滚动体故障实验信号的分析结果表明: 经验模态分解可去除信号噪声,提高信噪比,从而凸显故障特征; 提取的特征量可准确表征故障类型和故障程度; 优化K-均值聚类算法可正确地将含不同故障类型的样本集进行正确分类; 在对含同一类型故障、不同故障程度的样本集分类中,优化K-均值聚类算法正确地完成了不同故障程度的分类。因此,基于EMD 和优化K-均值聚类的滚动轴承故障诊断方法,可在准确提取故障特征的基础上,有效识别滚动轴承的故障类型,也可正确识别同种故障类型、不同故障程度的样本。文中所提出的方法是以故障特征频率处的幅值为特征量,在以后的研究工作中可在特征量的选取方面作进一步的有益探索。

Rolling bearing fault diagnosis based on EMD and optimize the K-means clustering algorithm

Abstract: The vibration signal is non stationary and the sample with typical fault is difficult to acquire. The severity of fault diagnosis is the same important to style diagnosis. This paper presented a novel fault diagnosis of bearings based on the characteristic fault frequency and K-means clustering. The reconstructed signal could be obtained by some set of IMF components of the vibration signal by EMD. It performed the Hilbert envelope analysis to reconstructed signal. From the power

14

spectrum of Hilbert envelope signal,it could identify the amplitude of the characteristic fault frequency and its integer multiples,which was used to diagnose the style and severity of fault. The result demonstrates that the proposed method based on EMD and K-means clustering can recognize the style and severity of bearing fault.

Key words: rolling bearing; fault diagnosis; severity of fault; EMD( empirical mode decomposition) ; K-means clustering

0 Introduction

Rolling bearings as parts of machinery and equipment in a universal connection and transmission of power in almost any large-scale equipment has an important role. The use of advanced technology of the bearing condition monitoring and fault diagnosis, can be realized bearings by post-maintenance, regular maintenance to monitor the maintenance of transformation, to reduce unnecessary waste of human and material resources, to contribute to improve economic efficiency.

Many scholars have success achieved on the bearing fault diagnosis and fault identification method, wavelet transform [1], the Wigner-Ville distribution [2], the Hilbert-Huang transform (Hilbert-Huang transform, HHT) [3,4] EMD [7] has been used in ball bearing fault diagnosis, and have achieved good results. Wigner-Ville distribution analysis of multi-component signal is easy to produce cross-term, this shortcoming limits their wider application; fixed wavelet basis and constant resolution wavelet analysis did not get rid of the limitations of the Fourier analysis. EMD according to the local characteristics of the signal, adaptive to a complex signal is decomposed into a series of intrinsic mode function IMF, each IMF component corresponds to a real physical significance. Window Fourier Transform, Wigner-Ville, wavelet transform contrast, EMD is an adaptive multi-resolution analysis method, it is very suitable for the analysis of nonlinear and non-stationary signals [8]. Many scholars on EMD and pattern recognition methods combine applied to fault diagnosis of mechanical systems, but most of the existing diagnostic methods have certain requirements for the quantity and quality of the training samples, and most of the diagnostic methods only on the type of fault classification For essential in the practical application of the degree of fault and not too involved. [9] EMD and neural network pattern recognition methods combined rolling element bearing fault diagnosis, this method requires a sufficient number of samples to train the neural network, and requires high quality training samples; [10] proposed a kinds of diesel

15

engine vibration signal analysis method based on empirical mode decomposition and support vector machine, the method also requires a certain amount of training samples with typical fault feature, in the case of a small amount of training samples, support vector machine overall classification performance will be reduced . Non-stable signal of rolling bearing vibration signal analysis for the traditional signal analysis methods do not have self-adaptability, as well as the actual samples of typical faults are not readily available, this paper presents a rolling bearing fault based on empirical mode decomposition and optimization of the K-means clustering diagnostic methods, which can adaptively sample the fault type and degree of fault classification, this method has the advantages of algorithm is simple, and accurate results.

The used data from the United States Case Western Reserve University Electrical Engineering Laboratory bench rolling bearing fault simulation [11], the bench, including a 2-horsepower motor, a torque sensor and a power test meter. Bearings are located at both ends of the motor to be detected, the drive end bearing Model SKF6205 fan end bearing Model SKF6203 bearing fault point EDM from the damage point of a diameter of 0. 1778 mm, 0. 3556 mm, 0. 5334mm. Where in the outer bearing race damage points in the clock: 3 o'clock, 6 o'clock, 12 o'clock in the three directions, the vibration data obtained by the collection of the acceleration sensors arranged on the motor housing, and the sampling frequency is 12 kHz, power, and speed by the torque sensor / decoder measured. The collected data are stored as *. mat format (MATLAB files).

6 Conclusion

Recognize the new method based on EMD and optimization of the K-means clustering algorithm ball bearing fault diagnosis and fault extent. Rolling normal, the inner ring failure, failure of the outer ring and rolling the fault experimental signal analysis results show that: the empirical mode decomposition signal noise can be removed to improve the signal-to-noise ratio, thereby highlighting the fault characteristics; extracted feature quantity can be accurately characterize the fault the type and degree of fault; optimize the K-means clustering algorithm can correctly sample set with different fault types correctly classified; K-means clustering algorithm with the same type of failure, different fault degree of sample set classification, optimization correctly completed the classification of the different degree of fault. Bearing Fault Diagnosis Method Based on EMD and optimize the

16

K-means clustering on the basis of accurately extracting characteristic effectively identify the type of roller bearing fault, but also to correctly identify the same fault types, different degree of fault sample. The proposed method is based on the amplitude of the fault characteristic frequency at the feature quantity can be useful to explore further in terms of the selection of the feature quantity, in subsequent research work.

17

因篇幅问题不能全部显示,请点此查看更多更全内容