使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于Kernel‑MCCA特征融合的齿轮故障诊断方法  PDF

  • 苏宇
  • 温广瑞
  • 徐斌
  • 张志芬
  • 石文杰
西安交通大学机械工程学院 西安,710049

中图分类号: TH17TP18

最近更新:2022-06-16

DOI:10.16450/j.cnki.issn.1004-6801.2022.03.014

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
目录contents

摘要

针对转速波动工况下齿轮故障难以辨识的问题,提出了一种基于核函数的多重集典型相关分析方法(kernel‑multiset canonical correlation analysis,简称Kernel‑MCCA),实现基于多传感信息的特征层融合,并将其应用到转速波动工况下的齿轮断齿、点蚀、磨损以及剥落故障的辨识。首先,将多传感器采集的振动信号进行小波包分解,计算能量特征矩阵;其次,利用多重集典型相关分析进行特征层融合,构建的融合特征输入到K近邻(K‑nearest neighbor,简称KNN)分类器中并输出诊断结果;最后,利用齿轮振动实验台进行实验研究。结果表明,笔者所提的特征融合方法比单传感器方法识别准确率提高了5%左右,比传统的多重典型相关分析特征融合方法识别准确率提高了2%左右,可有效解决转速波动下齿轮故障状态辨识问题。

引 言

齿轮箱作为机械设备中的一种重要传动设备,其运行状态正常与否直接关系到整个设备乃至整台机组的工作状况。有调查表明,有接近60%的齿轮箱故障是由齿轮失效引起

1。齿轮箱传动系统在工程实际现场中,往往处于非平稳运行状态,其中转速波动的情况较为常2。因此,对于转速波动工况下的齿轮故障诊断方法研究尤为重要。

现有的齿轮箱故障诊断方法大多为基于单一传感器,因其无法全面表征齿轮运行状态,导致转速波动工况下齿轮故障状态辨识准确率降低。针对齿轮箱故障诊断的信息融合技术,可采用数据层融合、特征层融合和决策层融

3。目前,齿轮箱故障诊断领域的应用研究以多分类器组合为代表的决策层融合技术研究已成为热点,而针对特征层融合方面的研究较少。特征层融合相较于决策层融合可以保留更多的原始数据的信息,相较于数据层融合进行了一定的维度压缩,避免了异类信息的粒度差异大等问题。在现有的特征融合方法中,一种是通过将多传感信息的特征矩阵进行串联形成新的特征矩阵;另一种是利用复向量将2组特征矩阵复合并联表示。这2种方法均不同程度地提高了识别准确4

典型相关分析(canonical correlation analysis,简称CCA

5旨在研究2组随机变量之间的相关性,被广泛应用于医学、气象、生物和化学等领域。孙权森4提出了基于CCA理论的特征融合方法,在高维小样本问题中使用主成分分析(principal components analysis,简称PCA)与CCA结合的方式解决协方差矩阵非奇异的问题。Carlos6提出了正则化核典型相关分析(kernel canonical correlation analysis, 简称KCCA),解决非线性空间的盲源分离问题。

CCA在融合2组变量时取得较好的效果,但是却无法融合多组特征。多重集典型相关分析可以处理多组变量。Kettenring

7给出了多重集典型相关分析(multiset canonical correlation analysis,简称MCCA)理论,该方法已被广泛应用于盲源分8、目标识9和遥感图像分10等领域。MCCA能够最大化多个传感器信息之间的互信息11,充分利用多个传感器之间的相关性信息互补,从而提高齿轮故障状态的辨识准确率。MCCA方法在处理非线性问题时效果不佳。

笔者在MCCA的基础上,将核函数引入MCCA中,提出了基于核函数的多重集典型相关分析方法,并将其应用于转速波动工况下的齿轮故障状态辨识实验。

1 原 理

1.1 典型相关分析

CCA作为一种经典的多元统计方法,旨在研究2组随机变量之间的相关

12‑13。设随机变量X=x1,x2,,xpTY=y1,y2,,yqT均服从高斯分布;pq分别为样本XY的维度;EX=EY=0E·表示期望,则

XYNμ,Σ=00,Σ11Σ12Σ21Σ22 (1)

其中:Σ为协方差矩阵,假定协方差矩阵是非奇异的,即Σ12=Σ21T

UV分别为随机变量XY的线性组合(V·代表方差);αβ分别为随机变量XY的投影矩

14

U=i=1pαixi=αTXVU=αTΣ11αV=i=1qβiyi=βTYVV=βTΣ22β (2)

定义UV的相关系数为ρ,求解投影矩阵αβ,使其相关系数具有最大值。

ρ=CorrU,V=        CovU,VVUVV=αTΣ12βαTΣ11αβTΣ22β (3)

如果式(3)中没有对αβ进行约束,显然满足相关系数最大的解有无穷多个。为了使方程有唯一解,加入约束条件αTΣ11α=βTΣ22β=1

此时,优化模型为

maxρU,V=αTΣ12βs.t.  αTΣ11α=βTΣ22β=1 (4)

求解上述模型,得到投影矩阵αβ。采取下面2种组合方式将典型相关变量组合,得到融合后的新特

15

1) 求和方式:将典型相关变量按照式(5)进行组合,获得融合特征Z

Z=αTX+βTY (5)

2) 拼接方式:将典型相关变量首位相接的组合规则进行组

16‑17

1.2 基于核函数的多重集典型相关分析

传统典型相关分析只能完成对2个特征集合的特征融合,在处理多个(3个及以上)特征集合就束手无策。因此,笔者提出一种基于核函数的多重集典型相关分析的特征融合方法来处理非线性空间的多传感信息,形成新的融合特征矩阵,从而实现故障的准确辨识。

1.2.1 MCCA基础理论

MCCA是CCA在多个变量集合的推广形式。设多个服从高斯分布的随机变量X1,X2,,Xn,其特征维数分别为mii=1,2,,n,且设定m1最小,即特征维数应满足条件m1m2mn。不失一般性,令EXi=0,即将特征矩阵进行零均值化处

14

X=X1X2XnNμ,Σ=                                000,Σ11Σ12Σ1nΣ21Σ22Σ2nΣn1Σn2Σnn (6)

假定协方差矩阵Σ是非奇异的,即Σij=ΣijT。将XT=X1T,X2T,,XnTUT=U1T,U2T,,UnT进行线性组合,得到

U1=α1TX1VU1=α1TΣ11α1U2=α2TX2VU2=α2TΣ22α2U3=α3TX3VU3=α3TΣ33α3       Un=αnTXnVUn=αnTΣnnαn (7)

式(7)求出散布矩阵

ΣU=α1TΣ11α1α1TΣ12α2α1TΣ1nαnα2TΣ21α1α2TΣ22α2α2TΣ2nαnαnTΣn1α1αnTΣn2α2αnTΣnnαn (8)

类比于2组变量间的典型相关分析中的定义方式与规则,设Ui=Uikai=aikΣU=ΣUk,其中:k=1,2,,mminmmin=minm1,m2,,mn

在传统典型相关分析中,通过求解2组组合向量之间的相关系数ρ=CorrαTX,βTY来度量2组变量之间的相关性。在多重典型相关分析中,需要同时最大化所有组合变量之间的相关性。

为最大化组合变量的相关性,采取以下函数来优化散布矩阵ΣU

1) 函数SUMCOR:最大化散布矩阵中所有元素之和,即求V=i=1nj=1naiTΣijaj的最大值;

2) 函数SSQCOR:最大化散布矩阵中所有元素的平方和,即求W=i=1nj=1naiTΣijaj2的最大值;

3) 函数MAXVAR:最大化散布矩阵的最大特征值,即求解λ1的最大值;

4) 函数MINVAR:最小化散布矩阵的最小特征值,即求解λn的最小值;

5) 函数GENVAR:最小化散布矩阵的行列式值,即求解detΣU=i=1nλi的最小值。

分别通过上述5种方式和以下4种约束对目标函数进行求解,将得到的典型相关变量通过CCA方法进行组合,得到融合后的特

18

1) 每个特征集合的投影向量应为单位向量,即需满足αiTαi=1

2) 投影向量之和应为单位向量,即i=1nαiTαi=1

3) 典型变量具有单位方差,即满足αiTΣiiαi=1

4) 典型变量方差之和为1,即i=1nαiTΣiiαi=1

1.2.2 Kernel‑MCCA

CCA和MCCA理论均服从线性空间的假定,而由于齿轮箱传动系统的齿轮发生故障时,在转速波动工况下往往表现出较强的非线性关系,导致直接使用CCA方法和MCCA方法进行特征融合时达不到理想的效果,而核函数是解决这个问题的有效途径。基于核函数的多重典型相关分析的特征融合方法的基本思想是:把低维空间的数据映射到高维空间(核空间),通过核函数在核函数空间进行多重集典型相关分析特征融合,其流程图如图1所示。

图1  Kernel-MCCA处理流程图

Fig.1  Kernel-MCCA processing flowchart

基于上述理论和方法,笔者提出的实验处理流程如图2所示。首先,采集多个传感器的齿轮转速波动工况振动数据,利用小波包能量方法提取特征;其次,通过笔者提出的基于核函数的多重集典型相关分析进行特征融

19;最后,将融合特征输入到K近邻分类器中输出诊断结果。

图2  实验处理流程图

Fig.2  Experimental processing flowchart

2 齿轮箱实验数据获取

2.1 实验方案

图3为齿轮箱实验台轴系示意图。图4为齿轮箱实验台实物图。图34所示的齿轮振动实验台为研究所自行设计,包括直流驱动电机、直流发电机、齿轮箱及控制柜。电机与减速齿轮箱之间采用刚性联轴器连接,轴II配有5个齿轮,分别用于模拟不同齿轮故障,通过换挡手柄控制轴I、轴III齿轮与轴II齿轮啮合关系。

图3  齿轮箱实验台轴系示意图

Fig.3  Schematic diagram of gearbox experiment table shaft system

图4  齿轮箱实验台实物图

Fig.4  Gear box experiment table

模拟齿轮箱在实际运转过程中常见的4种故障状态,图5为齿轮故障模拟图。

图5  齿轮故障模拟图

Fig.5  Gear failure simulation diagram

2.2 数据采集

以风力发电机为例,其正常工作时转速在1 2001 500  r/min范围内波动,笔者实验过程模拟工程实际现场转速波动工况,转速设为1 000±200 r/min,实验采集频率为8 192 Hz,采样长度为1 s。振动信号由安装在轴承座上的3个加速度传感器获得,具体安装位置如图3所示。其中:1号测点位于近电机端齿轮箱中间轴轴承座位置;2号测点位于远电机端齿轮箱中间轴轴承座位置;3号测点位于远电机端齿轮箱输出轴轴承座位置。同步采集3个测点振动加速度传感器信号。每个传感器在5种状态(正常状态、齿面剥落、齿面点蚀、断齿、齿面磨损)下采集360组数据。

3 数据验证

3.1 小波包能量特征提取

由于小波包分析能获得更高的时频分辨率,具有对非平稳信号较好的特征表征能力,因此更加适用于齿轮转速波动工况下数据的特征提

20‑21。选择适合非平稳信号特征提取的“meyer”小波基函数,根据峭度指标确定最佳分解层数为4,将信号独立地分解到16个特征频带中,计算每个特征频带的能量,得到16维特征矩阵。图6为小波包节点能量特征直方图。

图6  小波包节点能量特征直方图

Fig.6  Histogram of energy characteristics of wavelet packet nodes

当齿轮分别处于正常、磨损、断齿、点蚀以及剥落状态时,小波包节点能量特征分布的频带范围和能量百分比的大小均有差异。为更加直观地描述小波包能量特征的频带分布差异,随机选取某通道下齿轮5种状态的能量分布色谱图如图7所示。可见,当齿轮处于不同状态时,其能量分布的频带不同,能量大小也有差异。因此,可以将小波包节点能量特征作为区分齿轮5种状态的特征指标。

图7  齿轮能量分布色谱图

Fig.7  Gear failure chromatogram analysis

3.2 数据分析

采用小波包能量特征提取方法分别提取5种齿轮故障状态下3路振动传感器信号的小波包能量特征,从每种状态下的360个样本中随机抽取180个作为训练样本,合计900个训练样本,其余180个样本作为测试样本(合计900个测试样本)。利用KNN进行分类,为了排除实验偶然因素,重复实验100次。下述实验均采取上述特征提取方式、训练样本和测试样本的选取方式。

3.2.1 单一传感器特征准确率对比分析

将3个传感器信号单独进行准确率对比分析,分别提取其振动信号的小波包能量特征,输入到KNN分类器中,重复实验计算平均准确率。各传感器齿轮故障辨识准确率对比如表1所示。

表1  各传感器齿轮故障辨识准确率对比
Tab.1  Comparison of accuracy of gear identification of sensors
传感器编号准确率/%
1# 89.95
2# 86.49
3# 83.68

可见,1#传感器的辨识准确率最高,2#传感器次之,3#传感器最低。分析原因,1#传感器与2#传感器安装在故障齿轮轴(轴Ⅱ,见图3)支撑轴承的轴承座上;1#传感器安装位置距离故障齿轮啮合位置最近,受传递路径影响最小,获得的振动数据更贴近真实情况,因而1#传感器准确率最高。2#传感器安装在与1#传感器同轴的另一端支撑轴承的轴承座上,而3#传感器安装位置在高速轴(轴Ⅲ,见图3)远电机端的支撑轴承的轴承座上,安装位置距离故障齿轮啮合位置最远,受传递路径影响最大,因此准确率最低。

3.2.2 双传感器融合特征准确率对比分析

将不同传感器信号提取的特征按照特征维数方向首位相连,得到拼接后的特征矩阵的方法称为拼接法。分别将1#,2#传感器,1#,3#传感器以及2#,3#传感器信息提取到的小波包能量特征采用拼接法得到融合特征输入到KNN分类器中,为排除拼接顺序对准确率的影响,将拼接顺序交换后与交换前得到的齿轮故障辨识准确率取平均值,得到融合双传感器信息齿轮故障辨识准确率对比如表2所示。

表2  融合双传感器信息齿轮故障辨识准确率对比
Tab.2  Comparison of accuracy of gear fault identification based on dual sensor information
传感器编号准确率/%
拼接1#传感器和2#传感器 90.08
拼接1#传感器和3#传感器 89.63
拼接2#传感器和3#传感器 87.97

对比表1表2发现,采用拼接法的融合特征进行转速波动工况下的齿轮故障辨识,准确率虽有提升,但效果并不明显。这是因为拼接法只是简单地将2个传感器得到的特征进行拼接,利用多个传感器信息的同时也引入了更多的不相关信息,且未对不相关信息进行抑制,因此利用拼接后的特征进行故障辨识,其准确率提升不明显。

为了验证引入核函数的CCA算法是否对转速波动工况下的齿轮故障辨识准确率有提高,这里对比KCCA与CCA融合效果。KCCA使用的核函数为高斯核函

22,笔者分别使用CCA方法和KCCA方法融合1#和2#传感器,1#和3#传感器以及2#和3#传感器信息,将得到的融合特征输入到KNN分类器中,得到其特征融合方法效果对比如图8所示。

图8  CCA与KCCA特征融合方法效果对比

Fig.8  Effect comparison of CCA and KCCA feature fusion methods

使用KCCA方法融合2个传感器信息得到的特征进行转速波动工况下的齿轮故障状态辨识,其准确率高于使用CCA方法。合理使用核函数后的CCA方法可以有效提高齿轮转速波动工况下的故障状态辨识率。

采用CCA和KCCA特征融合算法融合各个传感器信息后的齿轮故障辨识准确率相较于单个传感器有一定程度的提升,但由于只融合了2个传感器的信息,对传感器信息综合利用不足,提升效果并不明显。受限于传统的CCA特征融合方法只能处理2个传感器信息的特点,若要充分利用多个传感器信息,必须采用一种可以处理多传感器信息的方法。

3.2.3 多传感器融合特征准确率对比分析

采用笔者提出的Kernel‑MCCA特征融合方法可实现对3个传感器的特征层融合,选用核函数为高斯核函数。将笔者提出方法与拼接法,PCA,核主成分分析(kernel principal component analysis, 简称KPCA)以及MCCA特征层融合方法进行对比,各方法融合多源信息故障辨识准确率如表3所示。

表3  各方法融合多源信息故障辨识准确率
Tab.3  The accuracy of multi‑source information fault identification in different methods
方 法准确率/%
拼接法 88.67
PCA 82.27
KPCA 83.41
MCCA 92.79
Kernel‑MCCA 94.89

采用拼接法得到的融合特征进行齿轮故障状态辨识,其准确率相较于单一传感器提升效果不明显。使用PCA和KPCA特征融合方法得到的融合特征进行齿轮故障状态辨识,其准确率并没有提升,反而相较于单一传感器有不同程度的降低。分析原因,因为PCA和KPCA方法本质上是最大化方

22,用于去除多个变量之间的相关性,以达到降低特征维度的目的。笔者所提到的数据来源是多个传感器的信息,各个传感器信息之间具有高度的相关性,去除相关性之后,有用的信息量实质上是变少了,因此无论使用PCA还是KPCA方法进行特征融合,均会丢失原始单一传感器获得的信息,其准确率会有不同程度的降低。

MCCA作为一种分析2组变量相关性的方法,可以充分利用2个传感器的之间的相关信息,最大化多组变量之间的互信息量,从而提升融合后特征的相关信息量,实现多个传感器之间的信息综合利用,实现特征融合,因此其故障状态辨识率更高。在转速波动工况下的齿轮振动数据表现出较强的非线性,MCCA方法是基于线性空间假设的,无法很好地处理非线性问题,将核函数引入到MCCA中,在处理多传感特征融合的同时具备较好地处理非线性问题的能力。

4 结 论

1) 相较于单一传感器,利用CCA,KCCA特征融合方法进行特征融合,为有效提高齿轮故障状态辨识提供了一种新思路。

2) 将MCCA理论引入特征层融合,通过多传感器信息的特征融合,解决了CCA特征融合方法无法处理的多传感特征融合问题。

3) 将核函数与MCCA算法相结合,弥补了MCCA处理非线性问题的不足,将转速波动工况下的齿轮故障状态辨识准确率提高了2%。

  

参考文献

1

刘慧玲.基于粗糙集理论的齿轮箱故障诊断研究[D].太原中北大学2013 [百度学术] 

2

邹今春沈玉娣.变工况齿轮箱故障诊断方法综述[J].机械传动2012368):124-127 [百度学术] 

ZOU JinchunSHEN YudiReview of gearbox fault diagnosis techniques under variable conditions[J]. Journal of Mechanical Transmission2012368):124-127(in Chinese) [百度学术] 

3

JIAO JYUE JPEI D. Multi-sensor information fusion method for vibration fault diagnosis of rolling bearing[J]. Materials Science and Engineering201724112034. [百度学术] 

4

孙权森曾生根王平安典型相关分析的理论及其在特征融合中的应用[J].计算机学报20059):1524-1533 [百度学术] 

SUN QuansenCENG ShenggenWANG Pinganet al. The theory of canonical correlation analysis and its application to feature fusion[J]. Chinese Journal of Computers20059): 1524-1533. (in Chinese) [百度学术] 

5

HOTELLING H. Relations between two sets of variates[J]. Biometrika1936283/4): 321-327. [百度学术] 

6

CARLOS AJAK S. A regularized kernel CCA contrast function for ICA[J]. Neural Networks2008212/3): 170-181. [百度学术] 

7

KETTENRING J R. Canonical analysis of several sets of variables[J]. Biometrika1971583): 433-451. [百度学术] 

8

LI XADALI TANDERSON M. Joint blind source separation by generalized joint diagonalization of cumulant matrices[J]. Signal Processing20119110): 2314-2322. [百度学术] 

9

陈惠红刘世明基于多重集典型相关的深度特征融合及SAR目标识别方法[J].电子测量与仪器学报2019339):57-63 [百度学术] 

CHEN HuihongLIU Shiming. Fusion of deep features via multiset canonical correlations analysis with application to SAR target recognition[J]. Journal of Electronic Measurement and Instrumentation2019339): 57-63(in Chinese) [百度学术] 

10

LIN DXU X. A novel method of feature extraction and fusion and its application in satellite images classification[J]. Remote Sensing Letters201569): 687-696. [百度学术] 

11

潘瑜徐丽燕王静基于多重集典型相关分析的图像融合方法[J].航天返回与遥感2011323):69-76 [百度学术] 

PAN YuXU LiyanWANG Jinget al. An image fusion method based on multi-set canonical correlation analysis[J]. Spacecraft Recovery & Remote Sensing2011323): 69-76. (in Chinese) [百度学术] 

12

吕卓纹王一斌邢向磊加权CCA多信息融合的步态表征方法[J].智能系统学报2019143):449-454 [百度学术] 

LV ZhuowenWANG YibinXING Xiangleiet al. A gait representation method based on weighted CCA for multi-information fusion[J]. CAAI Transactions on Intelligent Systems2019143): 449-454. (in Chinese) [百度学术] 

13

杨静高希占边界监督多重集典型相关分析[J].聊城大学学报(自然科学版)2019323):13-22 [百度学术] 

YANG JingGAO Xizhan. Marginal supervised multiset canonical correlation analysis[J]. Journal of Liaocheng University (Natural Sciences)2019323): 13-22. (in Chinese) [百度学术] 

14

NIELSEN A A. Multiset canonical correlations analysis and multispectral, truly multitemporal remote sensing data[J]. IEEE Trans Image Process, 2002113): 293-305. [百度学术] 

15

JING XLI SLAN Cet al. Color image canonical correlation analysis for face feature extraction and recognition[J]. Signal Processing2011918): 2132-2140. [百度学术] 

16

HAGHIGHAT MABDEL-MOTTALEB MALHALABI W. Fully automatic face normalization and single sample face recognition in unconstrained environments[J]. Expert Systems with Applications2016471): 23-34. [百度学术] 

17

HAGHIGHAT MABDEL-MOTTALEB MALHALABI W. Discriminant correlation analysis: real-time feature level fusion for multimodal biometric recognition[J]. IEEE Transactions on Information Forensics and Security2016119): 1984-1996. [百度学术] 

18

LIU WYANG XTAO Det al. Multiview dimension reduction via Hessian multiset canonical correlations[J]. Information Fusion201841119-128. [百度学术] 

19

HE JYANG SPAPATHEOU Eet al. Investigation of a multi-sensor data fusion technique for the fault diagnosis of gearboxes[J]. Journal of Mechanical Engineering Science201923313): 4764-4775. [百度学术] 

20

GUO JSHI ZLI Het al. Early fault diagnosis for planetary gearbox based wavelet packet energy and modulation signal bispectrum analysis[J]. Sensors2018189): 2908-2908. [百度学术] 

21

SOUILEM NELAISSI IMESSAOUD H. On the use of KPCA pre-filtering for KCCA method[J]. The International Journal of Advanced Manufacturing Technology2017919): 4331-4340. [百度学术] 

22

CORREA N MEICHELE TADALI Tet al. Multi-set canonical correlation analysis for the fusion of concurrent single trial ERP and functional MRI[J]. Neuro Image2010504): 1438-1445. [百度学术]