摘要
针对转速波动工况下齿轮故障难以辨识的问题,提出了一种基于核函数的多重集典型相关分析方法(kernel‑multiset canonical correlation analysis,简称Kernel‑MCCA),实现基于多传感信息的特征层融合,并将其应用到转速波动工况下的齿轮断齿、点蚀、磨损以及剥落故障的辨识。首先,将多传感器采集的振动信号进行小波包分解,计算能量特征矩阵;其次,利用多重集典型相关分析进行特征层融合,构建的融合特征输入到K近邻(K‑nearest neighbor,简称KNN)分类器中并输出诊断结果;最后,利用齿轮振动实验台进行实验研究。结果表明,笔者所提的特征融合方法比单传感器方法识别准确率提高了5%左右,比传统的多重典型相关分析特征融合方法识别准确率提高了2%左右,可有效解决转速波动下齿轮故障状态辨识问题。
关键词
齿轮箱作为机械设备中的一种重要传动设备,其运行状态正常与否直接关系到整个设备乃至整台机组的工作状况。有调查表明,有接近60%的齿轮箱故障是由齿轮失效引起
现有的齿轮箱故障诊断方法大多为基于单一传感器,因其无法全面表征齿轮运行状态,导致转速波动工况下齿轮故障状态辨识准确率降低。针对齿轮箱故障诊断的信息融合技术,可采用数据层融合、特征层融合和决策层融
典型相关分析(canonical correlation analysis,简称CCA
CCA在融合2组变量时取得较好的效果,但是却无法融合多组特征。多重集典型相关分析可以处理多组变量。Kettenrin
笔者在MCCA的基础上,将核函数引入MCCA中,提出了基于核函数的多重集典型相关分析方法,并将其应用于转速波动工况下的齿轮故障状态辨识实验。
CCA作为一种经典的多元统计方法,旨在研究2组随机变量之间的相关
(1) |
其中:为协方差矩阵,假定协方差矩阵是非奇异的,即。
设和分别为随机变量和的线性组合(代表方差);和分别为随机变量和的投影矩
(2) |
定义和的相关系数为,求解投影矩阵和,使其相关系数具有最大值。
(3) |
如果
此时,优化模型为
(4) |
求解上述模型,得到投影矩阵和。采取下面2种组合方式将典型相关变量组合,得到融合后的新特
1) 求和方式:将典型相关变量按照
(5) |
2) 拼接方式:将典型相关变量首位相接的组合规则进行组
传统典型相关分析只能完成对2个特征集合的特征融合,在处理多个(3个及以上)特征集合就束手无策。因此,笔者提出一种基于核函数的多重集典型相关分析的特征融合方法来处理非线性空间的多传感信息,形成新的融合特征矩阵,从而实现故障的准确辨识。
MCCA是CCA在多个变量集合的推广形式。设多个服从高斯分布的随机变量,其特征维数分别为,且设定最小,即特征维数应满足条件。不失一般性,令,即将特征矩阵进行零均值化处
(6) |
假定协方差矩阵是非奇异的,即。将和进行线性组合,得到
(7) |
由
(8) |
类比于2组变量间的典型相关分析中的定义方式与规则,设,,,其中:。
在传统典型相关分析中,通过求解2组组合向量之间的相关系数来度量2组变量之间的相关性。在多重典型相关分析中,需要同时最大化所有组合变量之间的相关性。
为最大化组合变量的相关性,采取以下函数来优化散布矩阵。
1) 函数SUMCOR:最大化散布矩阵中所有元素之和,即求的最大值;
2) 函数SSQCOR:最大化散布矩阵中所有元素的平方和,即求的最大值;
3) 函数MAXVAR:最大化散布矩阵的最大特征值,即求解的最大值;
4) 函数MINVAR:最小化散布矩阵的最小特征值,即求解的最小值;
5) 函数GENVAR:最小化散布矩阵的行列式值,即求解的最小值。
分别通过上述5种方式和以下4种约束对目标函数进行求解,将得到的典型相关变量通过CCA方法进行组合,得到融合后的特
1) 每个特征集合的投影向量应为单位向量,即需满足;
2) 投影向量之和应为单位向量,即;
3) 典型变量具有单位方差,即满足;
4) 典型变量方差之和为1,即。
CCA和MCCA理论均服从线性空间的假定,而由于齿轮箱传动系统的齿轮发生故障时,在转速波动工况下往往表现出较强的非线性关系,导致直接使用CCA方法和MCCA方法进行特征融合时达不到理想的效果,而核函数是解决这个问题的有效途径。基于核函数的多重典型相关分析的特征融合方法的基本思想是:把低维空间的数据映射到高维空间(核空间),通过核函数在核函数空间进行多重集典型相关分析特征融合,其流程图如

图1 Kernel-MCCA处理流程图
Fig.1 Kernel-MCCA processing flowchart
基于上述理论和方法,笔者提出的实验处理流程如

图2 实验处理流程图
Fig.2 Experimental processing flowchart

图3 齿轮箱实验台轴系示意图
Fig.3 Schematic diagram of gearbox experiment table shaft system

图4 齿轮箱实验台实物图
Fig.4 Gear box experiment table
模拟齿轮箱在实际运转过程中常见的4种故障状态,

图5 齿轮故障模拟图
Fig.5 Gear failure simulation diagram
以风力发电机为例,其正常工作时转速在范围内波动,笔者实验过程模拟工程实际现场转速波动工况,转速设为,实验采集频率为,采样长度为1 s。振动信号由安装在轴承座上的3个加速度传感器获得,具体安装位置如
由于小波包分析能获得更高的时频分辨率,具有对非平稳信号较好的特征表征能力,因此更加适用于齿轮转速波动工况下数据的特征提

图6 小波包节点能量特征直方图
Fig.6 Histogram of energy characteristics of wavelet packet nodes
当齿轮分别处于正常、磨损、断齿、点蚀以及剥落状态时,小波包节点能量特征分布的频带范围和能量百分比的大小均有差异。为更加直观地描述小波包能量特征的频带分布差异,随机选取某通道下齿轮5种状态的能量分布色谱图如

图7 齿轮能量分布色谱图
Fig.7 Gear failure chromatogram analysis
采用小波包能量特征提取方法分别提取5种齿轮故障状态下3路振动传感器信号的小波包能量特征,从每种状态下的360个样本中随机抽取180个作为训练样本,合计900个训练样本,其余180个样本作为测试样本(合计900个测试样本)。利用KNN进行分类,为了排除实验偶然因素,重复实验100次。下述实验均采取上述特征提取方式、训练样本和测试样本的选取方式。
将3个传感器信号单独进行准确率对比分析,分别提取其振动信号的小波包能量特征,输入到KNN分类器中,重复实验计算平均准确率。各传感器齿轮故障辨识准确率对比如
可见,1#传感器的辨识准确率最高,2#传感器次之,3#传感器最低。分析原因,1#传感器与2#传感器安装在故障齿轮轴(轴Ⅱ,见
将不同传感器信号提取的特征按照特征维数方向首位相连,得到拼接后的特征矩阵的方法称为拼接法。分别将1#,2#传感器,1#,3#传感器以及2#,3#传感器信息提取到的小波包能量特征采用拼接法得到融合特征输入到KNN分类器中,为排除拼接顺序对准确率的影响,将拼接顺序交换后与交换前得到的齿轮故障辨识准确率取平均值,得到融合双传感器信息齿轮故障辨识准确率对比如
对比
为了验证引入核函数的CCA算法是否对转速波动工况下的齿轮故障辨识准确率有提高,这里对比KCCA与CCA融合效果。KCCA使用的核函数为高斯核函

图8 CCA与KCCA特征融合方法效果对比
Fig.8 Effect comparison of CCA and KCCA feature fusion methods
使用KCCA方法融合2个传感器信息得到的特征进行转速波动工况下的齿轮故障状态辨识,其准确率高于使用CCA方法。合理使用核函数后的CCA方法可以有效提高齿轮转速波动工况下的故障状态辨识率。
采用CCA和KCCA特征融合算法融合各个传感器信息后的齿轮故障辨识准确率相较于单个传感器有一定程度的提升,但由于只融合了2个传感器的信息,对传感器信息综合利用不足,提升效果并不明显。受限于传统的CCA特征融合方法只能处理2个传感器信息的特点,若要充分利用多个传感器信息,必须采用一种可以处理多传感器信息的方法。
采用笔者提出的Kernel‑MCCA特征融合方法可实现对3个传感器的特征层融合,选用核函数为高斯核函数。将笔者提出方法与拼接法,PCA,核主成分分析(kernel principal component analysis, 简称KPCA)以及MCCA特征层融合方法进行对比,各方法融合多源信息故障辨识准确率如
采用拼接法得到的融合特征进行齿轮故障状态辨识,其准确率相较于单一传感器提升效果不明显。使用PCA和KPCA特征融合方法得到的融合特征进行齿轮故障状态辨识,其准确率并没有提升,反而相较于单一传感器有不同程度的降低。分析原因,因为PCA和KPCA方法本质上是最大化方
MCCA作为一种分析2组变量相关性的方法,可以充分利用2个传感器的之间的相关信息,最大化多组变量之间的互信息量,从而提升融合后特征的相关信息量,实现多个传感器之间的信息综合利用,实现特征融合,因此其故障状态辨识率更高。在转速波动工况下的齿轮振动数据表现出较强的非线性,MCCA方法是基于线性空间假设的,无法很好地处理非线性问题,将核函数引入到MCCA中,在处理多传感特征融合的同时具备较好地处理非线性问题的能力。
1) 相较于单一传感器,利用CCA,KCCA特征融合方法进行特征融合,为有效提高齿轮故障状态辨识提供了一种新思路。
2) 将MCCA理论引入特征层融合,通过多传感器信息的特征融合,解决了CCA特征融合方法无法处理的多传感特征融合问题。
3) 将核函数与MCCA算法相结合,弥补了MCCA处理非线性问题的不足,将转速波动工况下的齿轮故障状态辨识准确率提高了2%。

参考文献
刘慧玲.基于粗糙集理论的齿轮箱故障诊断研究[D].太原:中北大学,2013. [百度学术]
邹今春,沈玉娣.变工况齿轮箱故障诊断方法综述[J].机械传动,2012,36(8):124-127. [百度学术]
ZOU Jinchun,SHEN Yudi.Review of gearbox fault diagnosis techniques under variable conditions[J]. Journal of Mechanical Transmission,2012,36(8):124-127.(in Chinese) [百度学术]
JIAO J, YUE J, PEI D. Multi-sensor information fusion method for vibration fault diagnosis of rolling bearing[J]. Materials Science and Engineering,2017, 241: 12034. [百度学术]
孙权森,曾生根,王平安, 等.典型相关分析的理论及其在特征融合中的应用[J].计算机学报, 2005(9):1524-1533. [百度学术]
SUN Quansen, CENG Shenggen, WANG Pingan, et al. The theory of canonical correlation analysis and its application to feature fusion[J]. Chinese Journal of Computers, 2005(9): 1524-1533. (in Chinese) [百度学术]
HOTELLING H. Relations between two sets of variates[J]. Biometrika, 1936, 28(3/4): 321-327. [百度学术]
CARLOS A, JAK S. A regularized kernel CCA contrast function for ICA[J]. Neural Networks, 2008, 21(2/3): 170-181. [百度学术]
KETTENRING J R. Canonical analysis of several sets of variables[J]. Biometrika, 1971, 58(3): 433-451. [百度学术]
LI X, ADALI T, ANDERSON M. Joint blind source separation by generalized joint diagonalization of cumulant matrices[J]. Signal Processing, 2011, 91(10): 2314-2322. [百度学术]
陈惠红,刘世明.基于多重集典型相关的深度特征融合及SAR目标识别方法[J].电子测量与仪器学报,2019,33(9):57-63. [百度学术]
CHEN Huihong, LIU Shiming. Fusion of deep features via multiset canonical correlations analysis with application to SAR target recognition[J]. Journal of Electronic Measurement and Instrumentation, 2019, 33(9): 57-63.(in Chinese) [百度学术]
LIN D, XU X. A novel method of feature extraction and fusion and its application in satellite images classification[J]. Remote Sensing Letters, 2015, 6(9): 687-696. [百度学术]
潘瑜,徐丽燕,王静,等.基于多重集典型相关分析的图像融合方法[J].航天返回与遥感,2011,32(3):69-76. [百度学术]
PAN Yu, XU Liyan, WANG Jing, et al. An image fusion method based on multi-set canonical correlation analysis[J]. Spacecraft Recovery & Remote Sensing, 2011, 32(3): 69-76. (in Chinese) [百度学术]
吕卓纹,王一斌,邢向磊,等.加权CCA多信息融合的步态表征方法[J].智能系统学报,2019,14(3):449-454. [百度学术]
LV Zhuowen, WANG Yibin, XING Xianglei, et al. A gait representation method based on weighted CCA for multi-information fusion[J]. CAAI Transactions on Intelligent Systems, 2019, 14(3): 449-454. (in Chinese) [百度学术]
杨静,高希占.边界监督多重集典型相关分析[J].聊城大学学报(自然科学版), 2019,32(3):13-22. [百度学术]
YANG Jing, GAO Xizhan. Marginal supervised multiset canonical correlation analysis[J]. Journal of Liaocheng University (Natural Sciences), 2019, 32(3): 13-22. (in Chinese) [百度学术]
NIELSEN A A. Multiset canonical correlations analysis and multispectral, truly multitemporal remote sensing data[J]. IEEE Trans Image Process, 2002, 11(3): 293-305. [百度学术]
JING X, LI S, LAN C, et al. Color image canonical correlation analysis for face feature extraction and recognition[J]. Signal Processing, 2011, 91(8): 2132-2140. [百度学术]
HAGHIGHAT M, ABDEL-MOTTALEB M, ALHALABI W. Fully automatic face normalization and single sample face recognition in unconstrained environments[J]. Expert Systems with Applications, 2016, 47(1): 23-34. [百度学术]
HAGHIGHAT M, ABDEL-MOTTALEB M, ALHALABI W. Discriminant correlation analysis: real-time feature level fusion for multimodal biometric recognition[J]. IEEE Transactions on Information Forensics and Security, 2016, 11(9): 1984-1996. [百度学术]
LIU W, YANG X, TAO D, et al. Multiview dimension reduction via Hessian multiset canonical correlations[J]. Information Fusion, 2018, 41: 119-128. [百度学术]
HE J, YANG S, PAPATHEOU E, et al. Investigation of a multi-sensor data fusion technique for the fault diagnosis of gearboxes[J]. Journal of Mechanical Engineering Science, 2019, 233(13): 4764-4775. [百度学术]
GUO J, SHI Z, LI H, et al. Early fault diagnosis for planetary gearbox based wavelet packet energy and modulation signal bispectrum analysis[J]. Sensors, 2018, 18(9): 2908-2908. [百度学术]
SOUILEM N, ELAISSI I, MESSAOUD H. On the use of KPCA pre-filtering for KCCA method[J]. The International Journal of Advanced Manufacturing Technology, 2017, 91(9): 4331-4340. [百度学术]
CORREA N M, EICHELE T, ADALI T, et al. Multi-set canonical correlation analysis for the fusion of concurrent single trial ERP and functional MRI[J]. Neuro Image, 2010, 50(4): 1438-1445. [百度学术]