摘要
针对变工况条件下轴承训练数据集和测试数据集存在分布差异,导致智能诊断模型泛化能力不足,且需针对不同任务分别建模问题,提出一种基于多尺度混合域特征提取(multi⁃scale mixed domain feature extraction,简称MMDFE)和领域自适应(domain adaptation, 简称DA)的滚动轴承智能故障诊断方法。首先,引入变分模态分解提取多尺度混合域特征,构建完备的特征空间;其次,通过随机森林算法实现特征的降维和优选,消除冗余信息;然后,应用优选后的特征结合流形嵌入式分布对齐方法实现不同领域数据的分布对齐及跨域诊断;最后,采用不同工况下的数据集进行验证,并与传统的智能诊断方法和迁移学习方法进行对比,结果表明,所提方法可以准确有效实现跨域诊断。
轴承作为旋转机械中的关键部件,恶劣的工作条件易使轴承发生故障。为了避免重大经济损失和灾难性故障,研究先进的智能故障诊断算法具有重要意
变分模式分解(variational mode decomposition,简称VMD)作为一种自适应分解方
尽管智能故障诊断方法取得了较大成功,但都基于一个假设:有足够的带标签数据训练智能诊断模型。在工程实际中,上述假设往往得不到满足。迁移学习为解决以上问题提供了一种思
笔者提出了一种基于多尺度混合域特征的领域自适应方法。利用VMD方法提取滚动轴承的多尺度混合域特征,充分表征了滚动轴承的内部信息。基于随机森林算法实现特征选择并排序。结合流形嵌入式分布对齐的领域自适应方法,实现不同工况下滚动轴承的跨域故障诊断。
为充分表征轴承的振动信号,从时域、频域、时频域和复杂度等中提取特征集。通过统计方法分别提取了15个时域特征,包括平均值、均方值、方差、标准差、方根幅值、平均幅值、均方幅值、峰值、峰峰值、波形指标、峰值指标、脉冲指标、裕度指标、偏斜度和峭度。在频域,提取了12个频域特征参
(1) |
(2) |
(3) |
其中:为信号的功率谱;为信号的角频率。
在时频域提取了信号的8维小波包能量谱特
(4) |
其中:为对振动信号使用小波包分解后各个节点的重构信号。
复杂性测度主要对信号本身的分布特征和复杂程度进行分析,熵作为一种复杂性度量,广泛用于时间序列分析。当机械系统发生故障时,导致系统具有非线性特性,从而增加系统响应的复杂性,而熵测度恰恰适合量化这种动态变化,从而达到区分不同系统状态的目的。笔者在此基础上进一步提取了排列
VMD将信号分成一系列具有稀疏特性的本征模态函数(intrinsic mode functions,简称IMF),其本质相当于将维纳滤波器概括为具有窄带特性的自适应频带。因此,VMD分解信号可以看作是一个约束变分问题,通过搜索约束变分模型的最优解来实现信号的自适应分解。约束变分模型为
(5) |
其中:为分解后的各个IMF;为IMF的中心频率。
为了更有效地解决约束变分难题,该方法引入了拉格朗日乘法算子和二次惩罚参数。因此,约束变分问题可以重新整理为
(6) |
其中:为原始信号。
(7) |
(8) |
当IMF和中心频率更新时,根据
重复执行更新过程,直到满足等
(9) |
其中:取值为1×1
随机森林算法采用集成学习中套袋法的思想,将多个决策分类器进行组合,借助套袋法增加样本空间,进而建立多个分类回归树(classification and regression trees,简称CART)作为决策树。每个决策树会对样本进行分类,最后将每个决策树的结果进行集成,模型的输出使用投票法进行表决,从而得出最终结论。

图1 随机森林算法示意图
Fig.1 Schematic diagram of the random forest algorithm
在随机森林算法中有2个特征重要性指标,分别是Gini指标下降量和袋外错误率(out⁃of⁃bag error,简称OOB)的误分率增加量(mean decrease accuracy,简称MDA)。通过随机改变某特征值来测试CART树的OOB误差,使用2次测试OOB误差的平均值来表征特征的重要程度,其误差差值下降越多,说明该特征越重要。
(10) |
其中:和分别为改变某特征值前后的OOB误差。
流形嵌入式分布对齐是一种自适应分布适配方法,该方法首先通过流形特征变换将原始特征空间的特征映射到Grassmann流形空间中,以此降低领域之间的数据漂移;其次,通过引入自适应因子来动态衡量边缘分布和条件分布的相对重要性;最后,通过结构风险最小化(structural risk minimization,简称SRM)原则学习分类器。MEDA概念图如

图2 MEDA概念图
Fig.2 A conceptual diagram of MEDA
假设为流形特征变换的函数,最终域不变的分类器可以表示为
(11) |
其中:为的平方范数;为动态对齐方式;为利用拉普拉斯正则化的流形最近点的相似几何特性;,,为正则化参数。
在进行流形特征映射时首先将子空间嵌入到流形G中,则原始特征的d维子空间可以认为是流形G上对应的点。令以及,然后找到一条从到的测地线,将原始特征空间映射到流形特征空间中。
(12) |
通过,将原始特征空间的特征映射到流形空间。引入自适应因子来衡量边缘分布和条件分布的重要性,表示为
(13) |
其中:为自适应因子;代表类别;表示适配边缘分布;表示适配条件分布。
借助MMD计算分布差异,自适应分布适配可以表示为
(14) |
采用A⁃distance估计不同分布的距离。对于边缘分布差异,计算源域、目标域之间的A⁃distance,记为。对于条件分布差异,首先将目标域聚为C类,其次计算源域和目标域中来自同一个类别的数据的A⁃distance,取其均值记为,则自适应因子可以表示为
(15) |
最后,基于结构风险最小化原则在流形变换后的特征空间上学习分类器即可。
为了提高滚动轴承在多变工况下的故障诊断精度,提出了一种基于多尺度混合域特征提取和领域自适应的滚动轴承智能诊断算法框架,

图3 所提方法流程图
Fig.3 Flowchart for the proposed method
1) 采用加速度传感器采集滚动轴承在不同工况下的原始振动信号,分别构建源域和目标域样本集。
2) 使用VMD对信号进行分解,对原始信号和分解后各阶的IMFs分别进行时域、频域、时频域、复杂度等特征指标的提取,构建可以表征信号状态信息和内在属性完备的多尺度混合域特征集,随后对特征集进行归一化处理。
3) 构建RF模型,使用OOB误差计算特征向量的重要性,并根据上述各个特征的重要程度进行排序和优选,实现特征降维,消除冗余信息。
4) 将经过步骤3优选后的特征首先进行流形特征变换,以此减小不同领域间的数据漂移。通过自适应适配源域样本和目标域样本的边缘分布和条件分布,运用结构风险最小化原则学习分类器,即可实现不同工况下的滚动轴承跨域诊断。
为研究所提方法的泛化能力和优越性,使用西安交通大学的风力涡轮机传动系统诊断模拟平台采集不同负载下的轴承振动数据,并与传统的智能诊断方法以及传统迁移学习算法进行比较,以显示所提方法的有效性和优越性。
风力涡轮机传动系统故障诊断模拟平台如

图4 风力涡轮机传动系统故障诊断模拟平台
Fig.4 Wind turbine drive train fault diagnosis simulator

图5 实验轴承的3种故障情况
Fig.5 Three fault conditions of the experimental bearing
实验中由于负载的变化可以通过改变电流加以控制,因此电流分别设置为:0,0.4,0.8以及1.2 A,分别模拟不同程度的负载。直流电机的转速为2 kr/min。振动信号由BK加速度计收集,灵敏度为10.23 mV/g。振动信号采集卡使用DT9837,采样数为20 480,采样频率为20 480 Hz。
以实验台上采集到的转速为2 kr/min时的4个不同负载下的振动信号作为分析数据集(A,B,C,D),每个数据集分别包括正常状态(normal state,简称NS)、内圈故障(inner race fault,简称IF)、外圈故障(outer race fault,简称OF)以及滚动体故障(ball fault,简称BF)样本共400个。其中,每类样本100个,每个样本有2 400个采样点。实验台变负载数据集如
数据集 | 轴承 类型 | 故障类型 | 标签 | 样本 数量 | 工况 |
---|---|---|---|---|---|
A | ER⁃16K | NS | 1 | 4×100 |
负载0 (2 kr/min) |
IF | 2 | ||||
OF | 3 | ||||
BF | 4 | ||||
B | ER⁃16K | NF | 1 | 4×100 |
负载1 (2 kr/min) |
IF | 2 | ||||
OF | 3 | ||||
BF | 4 | ||||
C | ER⁃16K | NF | 1 | 4×100 |
负载2 (2 kr/min) |
IF | 2 | ||||
OF | 3 | ||||
BF | 4 | ||||
D | ER⁃16K | NF | 1 | 4×100 |
负载3 (2 kr/min) |
IF | 2 | ||||
OF | 3 | ||||
BF | 4 |

图6 4种工况下滚动轴承的原始振动信号
Fig.6 The raw vibration signal of rolling bearing in four working conditions
将所提的方法应用于实验室的变负载数据集中。从原始振动信号中提取包括时域、频域、时频域和复杂度特征在内的特征集。使用VMD分解原始振动信号,经VMD分解后的原始信号和各阶IMF的波形和频谱如

图7 VMD结果
Fig.7 Results of VMD
使用RF训练模型,通过OOB误差对多尺度混合域的特征重要性进行排序。由于篇幅限制,根据特征重要性排序的前15维特征直方图如

图8 根据特征重要性排序的前15维特征直方图
Fig.8 Sorted histogram according to the importance of top 15 dimensions features
为了确定在RF优选后待输入的特征维数,按照特征重要程度逐渐增加特征维数并输入到SVM中进行识别,在12个迁移数据集上进行测试,取各准确率的平均值。随着输入特征维数的增加,平均识别率逐渐升高。当输入前34维特征时,平均识别率达到74.11%,之后随着输入维数的继续增加,识别率均有所降低,但也稳定在72.5%左右。分析其原因,可能是添加了重要性低的特征后,特征集存在冗余和干扰,并产生了负迁移。因此,确定最优的特征子集为前34维特征。
针对变负载数据集使用MEDA方法进行跨领域的故障诊断。对于每个样本,获取上述方法所提的优选特征(34维),对其进行流形特征变换(10维),以期减小源域和目标域之间的领域差异。通过自适应分布对齐以及简单分类器K最近邻(K⁃nearest neighbor,简称K⁃NN)的学习,其中k=1,最终实现跨领域故障诊断。
以任务B→C为例,所提方法的准确率为96.5%。所提方法在数据集B上的混淆矩阵如

图9 所提方法在数据集B上的混淆矩阵
Fig.9 Confusion matrix of proposed method on dataset B

图10 领域自适应在数据集B(源域)和数据集C(目标域)上的可视化结果
Fig.10 Visualization result of cross process domain adaptation on dataset B (source domain) and dataset C (target domain)
任务 | SVM | TCA | GFK | JDA | TJM | 所提 方法 |
---|---|---|---|---|---|---|
A→B | 72.75 | 71.50 | 60.50 | 77.25 | 82.50 | 89.00 |
A→C | 71.00 | 63.50 | 65.75 | 68.25 | 74.75 | 71.25 |
A→D | 78.75 | 65.75 | 72.50 | 69.50 | 76.50 | 87.00 |
B→A | 67.75 | 71.75 | 63.75 | 80.75 | 73.75 | 92.25 |
B→C | 91.50 | 92.75 | 90.50 | 94.50 | 95.50 | 96.50 |
B→D | 89.00 | 91.75 | 85.00 | 93.50 | 96.50 | 96.75 |
C→A | 54.25 | 67.00 | 56.25 | 75.25 | 74.00 | 91.50 |
C→B | 93.50 | 94.75 | 95.00 | 94.25 | 96.50 | 96.75 |
C→D | 94.00 | 94.50 | 92.50 | 93.50 | 94.75 | 97.25 |
D→A | 35.75 | 53.50 | 34.75 | 51.75 | 54.50 | 79.75 |
D→B | 67.00 | 85.00 | 73.50 | 86.50 | 89.50 | 94.00 |
D→C | 94.50 | 91.50 | 91.25 | 91.25 | 94.00 | 91.00 |
均值 | 74.11 | 78.60 | 73.44 | 81.35 | 83.56 | 90.25 |
标准差 | 0.172 8 | 0.139 9 | 0.175 2 | 0.129 2 | 0.126 1 | 0.750 6 |
排序 | 5 | 4 | 6 | 3 | 2 | 1 |
1) 提出了一种多尺度混合域特征提取器。特征提取器集成了先进的信号处理方法,可以更完整地表征信号,能够在复杂环境中发挥强大的非线性提取能力。
2) 提出了一种基于随机森林的特征优化器,不仅减小了特征维数,消除了冗余信息,还给出了特征的重要性程度,可了解不同特征对诊断和识别的贡献,从而选择敏感的特征子集进行诊断。
3) 引入一种基于流形嵌入分布对齐的领域自适应方法,以解决轴承在不同工况下的跨领域诊断难题。通过提出的框架设计及变负载实验,证明了与传统的智能诊断方法和迁移学习方法相比,该方法的有效性和优越性。
4) 所提出方法是根据经验确定VMD算法的关键参数,未来可通过群体智能优化算法求解最优参数。此外,该方法还可以应用于齿轮箱、转子、电动机和液压设备的故障诊断。
参 考 文 献
雷亚国, 贾峰, 孔德同,等. 大数据下机械智能故障诊断的机遇与挑战[J]. 机械工程学报, 2018,54(5):94-104. [百度学术]
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era[J]. Journal of Mechanical Engineering, 2018,54(5):94-104. (in Chinese) [百度学术]
YAN X, JIA M. A novel optimized SVM classification algorithm with multi-domain feature and its application to fault diagnosis of rolling bearing[J]. Neurocomputing, 2018, 313:47-64. [百度学术]
YAN R, LIU Y, GAO R X. Permutation entropy: a nonlinear statistical measure for status characterization of rotary machines[J]. Mechanical Systems and Signal Processing, 2012, 29:474-484. [百度学术]
DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3): 531-544. [百度学术]
张西宁,张雯雯,周融通,等.基于多维缩放和随机森林的轴承故障诊断方法[J].西安交通大学学报, 2019, 53(8):1-7. [百度学术]
ZHANG Xining, ZHANG Wenwen, ZHOU Rongtong,et al. Bearing fault diagnosis method based on multiple dimensional scaling and random forest[J]. Journal of Xi'an Jiaotong University, 2019, 53(8):1-7. (in Chinese) [百度学术]
DIBAJ A, ETTEFAGH M M, HASSANNEJAD R, et al. A hybrid fine-tuned VMD and CNN scheme for untrained compound fault diagnosis of rotating machinery with unequal-severity faults[J]. Expert Systems with Applications, 2021, 167: 114094. [百度学术]
吴东升,杨青,张继云,等.基于VMD-LMD-CNN的集合型故障诊断方法[J]. 轴承, 2020(10):57-63. [百度学术]
WU Dongsheng, YANG Qing, ZHANG Jiyun, et al. Ensemble fault diagnosis method based on VMD-LMD-CNN[J]. Bearing, 2020(10):57-63. (in Chinese) [百度学术]
PAN S J, YANG Q. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010,22(10): 1345-1359. [百度学术]
GONG B, SHI Y, SHA F, et al. Geodesic flow kernel for unsupervised domain adaptation[C]∥2012 IEEE Conference on Computer Vision and Pattern Recognition. Washington, D.C.:IEEE Computer Society,2012: 2066-2073. [百度学术]
LONG M, WANG J, DING G, et al. Transfer joint matching for unsupervised domain adaptation[C]∥2014 IEEE Conference on Computer Vision and Pattern Recognition. Washington, D.C.:IEEE Computer Society,2014: 1410-1417. [百度学术]
PAN S J, TSANG I W, KWOK J T, et al. Domain adaptation via transfer component analysis[J]. IEEE Transactions on Neural Networks, 2011, 22(2): 199-210. [百度学术]
LONG M, WANG J, DING G, et al. Transfer feature learning with joint distribution adaptation[C]∥2013 IEEE International Conference on Computer Vision. Washington, D.C.:IEEE Computer Society,2013: 2200-2207. [百度学术]
WANG J, FENG W, CHEN Y, et al. Visual domain adaptation with manifold embedded distribution alignment[C]∥Proceedings of the 26th ACM International Conference on Multimedia.[S.l.]: Association for Computing Machinery,2018:402-410. [百度学术]
YU C, WANG J, CHEN Y, et al. Transfer learning with dynamic adversarial adaptation network[C]∥2019 19th IEEE International Conference on Data Mining. Washington, D.C.:IEEE Computer Society,2019: 778-786. [百度学术]
GUO L, LEI Y, XING S, et al. Deep convolutional transfer learning network: a new method for intelligent fault diagnosis of machines with unlabeled data[J]. IEEE Transactions on Industrial Electronics, 2019,66(9): 7316-7325. [百度学术]
WEN L, GAO L, LI X. A new deep transfer learning based on sparse auto-encoder for fault diagnosis[J]. IEEE Transactions on Systems Man Cybernetics-Systems, 2019, 49(1): 136-144. [百度学术]
雷亚国, 何正嘉, 訾艳阳. 基于混合智能新模型的故障诊断[J]. 机械工程学报, 2008, 44(7):112-117. [百度学术]
LEI Yaguo, HE Zhengjia, ZI Yanyang. Fault diagnosis based on novel hybrid intelligent model[J].Chinese Journal of Mechanical Engineering, 2008, 44(7):112-117. (in Chinese) [百度学术]
王冬云, 张文志, 张建刚. 小波包能量谱在滚动轴承故障诊断中的应用[J]. 轴承, 2010(11): 32-36. [百度学术]
WANG Dongyun, ZHANG Wenzhi, ZHANG Jiangang. Application of wavelet packet energy spectrum in rolling bearing fault diagnosis[J]. Bearing, 2010(11): 32-36. (in Chinese) [百度学术]
CHEN P, TANIGUCHI M, TOYOTA T, et al. Fault diagnosis method for machinery in unsteady operating condition by instantaneous power spectrum and genetic programming[J]. Mechanical Systems and Signal Processing, 2005,19(1): 175-194. [百度学术]
BANDT C, POMPE B. Permutation entropy: a natural complexity measure for time series[J]. Physical Review Letters, 2002,88(17): 174102. [百度学术]
PINCUS S M. Approximate entropy as a measure of system-complexity[J]. Proceedings of the National Academy of Sciences of the United States of America, 1991, 88(6): 2297-2301. [百度学术]
LABATE D, la FORESTA F, MORABITO G, et al. Entropic measures of eeg complexity in alzheimer's disease through a multivariate multiscale approach[J]. IEEE Sensors Journal, 2013,13(9): 3284-3292. [百度学术]
CHEN W, WANG Z, XIE H, et al. Characterization of surface EMG signal based on fuzzy entropy[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2007,15(2): 266-272. [百度学术]
VAN DER MAATEN L, HINTON G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008(9):2579-2605. [百度学术]