使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

数据不平衡分布下燃气调压器故障识别方法  PDF

  • 尹孟伟 1
  • 王勇 1
  • 王超群 2
1. 上海电力大学计算机科学与技术学院 上海,201306; 2. 上海航天能源股份有限公司 上海,201201

中图分类号: TH138.52TP206.3TP306.3

最近更新:2025-04-27

DOI:10.16450/j.cnki.issn.1004-6801.2025.02.019

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
目录contents

摘要

针对燃气调压器故障识别中不平衡数据影响模型识别能力的问题,提出一种一维卷积神经网络(one‑dimensional convolutional neural network,简称1D‑CNN)与注意力机制(squeeze‑and‑excitation,简称SE)相结合的改进深度卷积神经网络(SE‑1DCNN)方法。首先,使用一维卷积核提取故障特征;其次,在交替的卷积层后添加SE模块用于通道加权,选择性地保留所需的重要信息特征,并抑制弱相关的特征;最后,使用类平衡损失函数代替交叉熵损失函数来抵消不平衡分布给网络造成的影响。实验结果表明,根据真实环境中采集的不平衡故障数据,所提改进模型与其他故障识别模型相比有更好的故障识别能力,准确率高达98.17%。

引 言

调压器是天然气输配过程中降压、稳压的设备,其运行状况直接影响着燃气输配系统的安全。当前,对调压器的故障诊断多以定时检查为主,导致运行维护困难。随着物联网技术的发展,大量的调压站被改造成为数字调压站,调度中心能采集到调压器运行参数的各种时序数据,用于监测调压器的健康程度,这为实现调压器故障智能诊断提供了数据基础。文献[

1]通过搭建概率神经网络实现燃气调压器4种不同的故障类型诊断,具有一定的实际应用价值。文献[2]提出稀疏自编码与支持向量机(support vector machine, 简称SVM)相结合实现调压器的故障类型分类。文献[3]将具有自适应噪声的完全集成经验模态分解和模糊C‑均值聚类相结合,实现了3种典型的调压器故障状态的分类。文献[4]提出了基于粒子群优化的核主元分析法与学习向量量化神经网络的故障诊断方法。虽然这些数学算法与机器学习相结合的诊断方法在特定的场景取得了一定成效,但其故障识别准确率很大程度上受制于人工故障特征提取的完整性。

随着物联网技术的发展,各种传感器装设在重要机械设备中以监测其运行状态,由此获得了蕴含丰富信息的时序数据,这些数据为基于深度神经网络实现数据驱动的机械智能故障诊断打下了基础。深度学习技术在特征提取和适应性学习方面显示出强大的能

5,在语音识6和计算机视7等领域迅速发展。对比传统机器学习,深度学习不需要人工参与特征工程提取且具有更强的适应性和学习能力。因此,为了实现调压器故障智能诊断代替人工判断,减少企业运行维护压力,迫切需要一种高效、准确的故障诊断识别方法。

1 问题分析

在基于深度学习理论的调压器故障识别方面,文献[

8]提出一种改进一维卷积神经网络与SVM分类器相结合的方法对6种故障进行分类,虽然取得了不错的识别准确率,但有以下两点不足:①其实验数据集来自调压器检测线中实时采集的压力数据,不能完全模拟调压器在真实环境中的运行状态,并且人工划分了平衡的调压器故障数据集,进行训练和测试,未考虑不平衡数据问题;②通过使用一维卷积神经网络直接从原始信号中提取判别特征之后,并未对信息进行处理而直接进行故障分类,对调压器故障数据样本不同波段的特征提取一视同仁,但在判别故障状态时,多以出口压力运行在稳压精度之外的波段为主要判别指标,忽略了设备本身运行的特征,导致模型识别准确率不高。在真实的工作环境中,调压器长时间处于正常状态运行,传感器所采集的数据中正常状态占极大比例而故障数据只有极少比例,并且各故障类型的数据比例也不尽相9。调压器的不同状态数据符合长尾分10,即正常状态的数据样本较多而故障状态的样本相对较少。数据的不平衡会使模型过分学习正常状态样本特征,对比例较少的故障状态数据欠拟合而导致识别错误。

针对以上问题,笔者提出一种结合注意力机制的改进一维卷积神经网络的调压器故障识别方法,并采用真实环境中健康状况不同的调压器出口压力数据。此模型为了最大程度地保留出口压力信号的时序特征,首先,采用一维卷积神经网络进行特征提取;其次,在卷积层之后加入SE模块,自适应地重新校准通道特征响应,选择性地强调重要信息特征,并抑制弱相关的特征;最后,使用类平衡损失函数代替交叉熵损失函数以消除数据不平衡对模型造成的影响。通过以上措施,提高了数据不平衡分布下模型对燃气调压器故障识别的准确率。

2 故障识别模型结构

2.1 卷积神经网络模型

CNN是一种多级前馈神经网络,通常由卷积层、池化层和全连接层构成。卷积层的功能是对输入数据进行特征提取,然后将结果传递到非线性激活函数中产生下一层的特征图。卷积神经网络从k-1层到k层的前向传播可以表示为

xjk=fiMjxik-1wijk+bjk (1)

其中:xjkk层卷积的输出值;Mj为所选取的特征图;xik-1k-1的输出值;wijkk层的权值;bjkk层的偏置值;f为激活函数。

f用来对卷积计算的输出值实现非线性变换,得到输入的非线性表示,从而提高网络的特征学习能力。因为ReLU函数只存在线性关系,其计算速度比sigmoid函数和tanh函数更快,并且当输入为正时不存在梯度饱和问题,所以目前的CNN结构中常用ReLU为激活函数,其公式为

fx=max0,x(x0)0(x<0) (2)

池化层的作用是进行空间合并,在保持最重要信息的同时降低特征图的维度,以减少网络中的参数和计算量,同时也抑制过拟合且起到二次提取特征的作用。本研究采用最大池化方法,因为在一维时序任务中最大池化的性能要好于平均池

11,其公式为

yil+1j=maxxijk      (kDj) (3)

其中:yil+1j为经过池化后第l+1层的第i个特征图中的元素;Dj为第j个池化区域;xijk为第l层第i个特征图在池化核范围内的元素。

全连接层的作用是将提取到的特征结合在一起进行非线性激活,输出各分类的概率分布再进行分类,其表达式为

p(yj)=exp (yj)/k=1mexp (yk) (4)

其中:p(yj)为神经元经过softmax的概率输出,即输出层第j个神经元的输出值;m为目标分类的数量,即燃气调压器故障类型的数量。

2.2 Squeeze‑and‑Excitation模块

Squeeze‑and‑Excitation模块是一个计算单元,设Ftr为传统的卷积结构,XU分别为Ftr的输入和输出,V=[v1v2,,vc]表示学习到的一组卷积核,vc为第C个卷积核的参数。可以将Ftr的输出写成U=[u1,u2,,uc],其中

uc=vc*X=s=1cvcs*xs (5)

其中:*表示卷积;vcsvc的一个单通道,作用于对应通道X

因为输出是由所有通道的和产生的,所以通道依赖性被隐式地嵌入到vc中,但这些依赖性与卷积操作捕获的空间相关性混合在一起,而SE模块就是为了抽离这种混杂,使得模型直接学习到通道特征关系,其目的是在进入下一层卷积操作之前,通过Squeeze和Excitation操作为各个通道赋予不同的权重。SE模块结构如图1所示。

图1  SE模块结构

Fig.1  Squeeze‑and‑excitation module

2.2.1 挤压

卷积操作只是提取了局部空间的特征,但无法获得通道之间的相关信息。针对此问题,提出挤压操作,采用全局平均池化将一个通道上整个空间特征编码为一个全局特征;也可以采用更复杂的策略,但此时更加强调整体的信息。Fsq(.)为求平均值的策略,由于本研究处理的为一维时序信号,所以Fsq(.)的公式为

zc=Fsquc=1Hi=1Huci      (zRc) (6)

其中:uci为卷积之后得到的多个特征图U的第C个特征图的第i个元素;zc为整个特征向量的元素相加取平均。

2.2.2 激励

为了利用挤压操作后得到能够描述全局的特征,通过激励来全面获取通道之间的关系,将上面的特征融合起来。因为需要允许多通道特征,所以使用一个全连接层来学习各个通道之间的关系,就可以得到每个通道的权重,其公式为

s=Fexz,W=σgz,W=σW2ReLUW1z (7)

其中:W1Rcrc W2Rcrcs为得到的通道权重,s[0,1];σ为sigmoid激活函数。

激励操作相当于是第1个全连接层起到降维作用,降维系数r是个超参数,使用ReLU函数激活后通过下一个全连接层恢复原始的维度。将学习到的各个通道的权重(s[0,1])乘以U上的原始特征,即

  X˜=Fscaleuc,sc=sc uc (8)

其中:X˜为重新校准后的特征图;Fscaleuc,sc为特征映射uc和标量sc之间的对应通道乘积。

3 改进的SE‑1DCNN故障识别模型

3.1 类平衡损失函数

传统分类任务所采用的数据集一般是由人工构建各类别样本数量相等的均衡数据集,然而从实际中采集的数据集往往服从长尾分布。数据集的不平衡会导致网络在提取拥有大量样本的正常状态特征时过拟合,而尾部故障种类的样本量不足以支撑网络学习比较鲁棒的泛化特征,从而降低分类精度。

针对此问题,目前常用的方法是重采

12与重加13。重采样分为过采14和欠采15。过采样通过复制一些少数类样本减少样本数量上的差距,但是复制的样本没有引入新的特征信息,本质上只是引入了冗余数据,无法使模型的效果变好。欠采样通过减少多数样本的数量来缩小不同样本数量之间的差距,这可能使得模型捕捉不到一些关键特征,也没有使模型的训练效果变好。重加权的方法通常是对Loss函数进行改进以解决不平衡数据的问题,这类方法实现方便且效果显著。

为解决不平衡数据分类问题,文献[

16]提出类平衡损失函数(class‑balanced loss,简称CBLoss),利用有效样本量En对损失函数反向加权。对于不同种类的故障样本,第j类的有效样本量Enj可以由下列公式求得

Enj=(1-βjnj)/(1-βj) (9)
βj=(Nj-1)/Nj (10)

其中:nj为第j类故障样本数量;Nj为第j类故障样本的有效样本数。

为了平衡第j类故障的损失,引入一个反比因子1Enj ,因此类平衡损失函数可以表示为

CBp,y=1EnyLp,y=1-βy1-βynyLp,y (11)

其中:nyy类的样本数量;Lpy)为常用的损失函数。

笔者将损失函数softmax cross‑entropy loss与CBLoss相结合(即CBsoftmax)作为损失函数解决不平衡数据问题。对于标签y类且每类有ny个训练样本的任务,CBsoftmax计算公式为

CBsoftz,y=-1-βy1-βynylog exp Zyj=1cexp Zy (12)

3.2 SE‑1DCNN网络结构及参数

燃气调压器调压设备的老化和损耗都是随着运行时间逐渐演化的过程,因此通过压力传感器采集到的原始调压器出口压力信号一般为一维时间序列数据。文献[

17]提出改进CNN的滚动轴承变工况故障识别,将一维时序数据处理成二维图像进行识别,但是这种处理方法割裂了时序数据的连续依赖性,导致模型难以捕捉到振动信号的时间序列特性。通过采集运行在居民区的调压器出口压力信号,可知其数据特征为一天一个运行周期。改进模型为保留输入调压器出口压力的时间序列的连续依赖性,直接使用一维卷积核对一天的调压器出口压力信号进行卷积操作,避免了割裂时间序列的连续依赖性,充分学习到原始数据的时间序列特征。

通过研究燃气调压器的运行机制与结构参数,并结合其出口压力数据可知,故障类型的判别多以超出稳压精度范围的波段形态为主要判别指标,其他波段虽有影响但作用较少。因此,在卷积操作之后加入SE结构,为各个通道进入下一层卷积之前赋予不同的权重系数。在此识别过程中更加重视提取超出稳压精度范围的特征信息,并抑制对判别影响较小的稳压精度范围之内的特征信息。同时,在交替的卷积层后加入批量规范

18(batch normalization,简称BN)层,在激活函数之前用于重新调整数据分布。BN可以重新参数化大多数深度神经网络,通过归一化方法将任意神经元的分布拉回标准正态分19。因此,在SE‑1DCNN中添加BN层可以减少网络对参数初始化的依赖,并消除数据的分布差异,增加网络的泛化能力。

使用CBsoftmax损失函数代替交叉熵损失函数,利用各类的有效样本量来对损失函数重加权,加权的损失函数可抵消数据不平衡分布给网络造成的影响。

笔者提出的基于SE‑1DCNN的故障识别方法网络结构如图2所示。模型主要分为1DCNN部分、SE模块以及分类输出部分,损失函数采用CBsoftmax损失函数,梯度下降采用Adam优化器,输入信号为燃气调压器不同运行状态的出口压力数据。1DCNN部分通过一系列的一维卷积层来提取出口压力信号时间序列特征,并通过MaxPooling操作逐渐降低特征图维度。SE结构部分放在第2层卷积操作之后,经过2层卷积可以充分捕获全局特征,通过SE块之后,赋予通道不同的权值,提取出该模块中更重要、更关键的信息,忽略不相关特征,从而提高模型识别精度。最后,通过softmax层分类输出该出口压力信号来表示调压器的运行状态。模型结构参数如表1所示。

图2  基于SE‑1DCNN的故障识别方法网络结构

Fig.2  Network structure of fault identification method based on SE‑1DCNN

表1  模型结构参数
Tab.1  Model structure parameters
层数类型激活函数输出尺寸卷积核大小过滤器数量步长可训练参数数量
0 Input 288×1
1 1D conv Without bias ReLu 305×1 18×1 64 1 1 152
2 Max‑pooling 152×64 2×1 64 2 0
3 1D conv Without bias ReLu 160×32 9×1 32 1 288
4 SE Sigmoid 160×32
5 Max‑pooling 80×32 2×1 32 2 0
6 1D conv ReLu 84×4 5×1 4 1 20
7 SE Sigmoid 84×4
8 Max‑pooling 32×4 2×1 4 2 0
9 Dense ReLu 20 2 580
10 Dense Softmax 5 105

4 实验分析

本研究实验软件环境为python3.8+tensorflow2.0+ PyCharm,硬件环境为Intel Core i5‑9300H CPU @2.40GHz + NVIDIA GeForce GTX 1650。

4.1 数据集

本实验数据为上海某燃气公司从现场采集的燃气调压器出口压力数据,包含用气低峰出口压力高、用气高峰出口压力低、关闭压力高、内漏和正常共5种运行状态。该采集系统每隔5 min采集1次调压器的出口压力,将预处理后的调压器出口压力数据分割成时间长度为24 h的样本(即每组样本288个数据点)。将收集到的故障样本按照一定的比例建立平衡(数据集A)、不平衡训练集(数据集B)、平衡测试集(数据集D)、不平衡测试集(数据集C)。状态标签及各数据集样本数如表2所示。

表2  状态标签及各数据集样本数
Tab.2  Status tags and sample numbers of each data set
状态标签训练集样本数测试集样本数
数据集A数据集B数据集C数据集D
正常 300 500 180 100
用气高峰出口压力低 300 50 120 100
用气低峰出口压力高 300 50 120 100
关闭压力高 300 50 120 100
内漏 300 50 120 100

燃气调压器出口压力是衡量其运行状况的核心指标。在正常运行时,出口压力应该在设定压力为基准的稳压精度上、下限压力范围内波动,因此在判断故障类型时,主要以超出稳压精度压力上、下限的波段形态为依据,来区分故障类型,实现各种故障的标签化,构建实验所需数据集。燃气调压器常见故障类型如图3所示。

  

  

  

  

  

图3  燃气调压器常见故障类型

Fig.3  Common fault types of gas regulators

图3(a)可看出,调压器用气高峰时段出口压力出现两大波谷,波动范围较大,且出现了超过标准稳压精度范围的低频波动,说明其处于用气高峰出口压力低的故障状态;由图3(b)可看出,调压器用气低峰时段出口压力过高,且出现了超过标准稳压精度范围的低频波动,表现出用气低峰出口压力高的故障状态;由图3(c)可看出,调压器在夜间关闭之后出口压力仍然有增加的趋势,且关闭时超过调压器的关闭压力值,表现出调压器关闭压力高的故障状态;由图3(d)可看出,调压器在用气低峰时段出口压力有不断升高的趋势,甚至超过了关闭压力值时仍在增加,表现出调压器内漏的故障状态;由图3(e)可看出,调压器出口压力在设定的稳压精度范围内波动较平稳,在一天当中的任何时刻均可保持出口的稳定性,表明调压器处于正常运行状态。

4.2 SE结构对模型分类结果的影响

挤压和激励操作可以看成赋予各个通道不同的权重系数,从而使得模型重视所需的重要特征而忽略不相关的特征。实验过程中随着CNN网络层数的加深,最终分类的效果不增反降,甚至在训练集上的准确率也停滞不前。对于燃气体调压器,基本可从超出设定压力基准的稳压精度上、下限数据就能判断调压器是否有故障。文献[

20]在不增加网络层数的情况下,直接将SE模块应用于现有的网络结构中,提高了模型的泛化能力。

为了验证SE模块提升SE‑1DCNN分类能力的有效性,笔者对添加和未添加SE模块的SE‑1DCNN在不平衡数据上进行了实验。SE模块对分类的影响如图4所示。可以看出,添加SE模块的SE‑1DCNN无论是宏精确度、宏召回率还是宏F1分数与准确率,均明显高于未添加SE模块的SE‑1DCNN。这说明通过SE模块可以调整通道特征在分类过程的重视程度,消除弱相关特征的影响,确保模型在不平衡数据下的有效性。

图4  SE模块对分类的影响

Fig.4  The impact of SE modules on classification

4.3 CBLoss函数实验验证

CBLoss损失函数在图像分类中能够提升网络对于不平衡数据集的分类性能,为了验证其在处理一维时序出口压力信号中的有效性,笔者将使用CBsoftmax损失函数的SE‑1DCNN与使用交叉熵函数的SE‑1DCNN在数据集B上进行测试,其诊断结果对比如图5所示。

  

  

图5  交叉熵函数与CBsoftmax函数诊断结果对比

Fig.5  Comparison of cross entropy function and CBsoftmax function diagnosis results

图5可以看出,2种网络在多样本正常状态的类别上表现几乎一致,故障识别率达到99%,这说明CBsoftmax损失函数对SE‑1DCNN模型在多样本识别上的影响甚微。在拥有较少样本的类别中,尤其是用气高峰出口压力低和用气低峰出口压力高状态时,使用CBsoftmax函数训练的SE‑1DCNN模型明显优于使用交叉熵函数训练的网络,这说明CBsoftmax函数利用各类别的有效样本量对损失函数进行重加权,能够有效消除样本数的分布差异,降低样本数的不平衡分布对网络故障识别的影响,在保留SE‑1DCNN模型对多样本类高识别的同时能显著提升其对较少样本类的识别能力。

4.4 故障识别模型实验效果对比

为验证本方法在故障识别精度上的优势,选用相同的不平衡数据集使用不同的算法模型进行了5组对比实验,每次模型运行10次,迭代次数均为80次。对比实验结果如表3所示。实验1采用本研究所提的SE‑1DCNN模型;实验2采用文献[

10]提出的1‑MsCNN‑SVM模型,该模型采用多尺度卷积核与SVM相结合以达到识别效果;实验3单独使用1DCNN模型;实验4单独使用2DCNN模型;实验5使用2DCNN添加SE模块的模型。实验结果表明,本研究所提的SE‑1DCNN模型在燃气调压器故障识别准确率上表现最好,准确率达到了98.17%。

表3  对比实验结果
Tab.3  Compare the experimental results
实验序号模型名称训练集平均准确率/%测试集平均准确率/%平均训练时间/s
1 SE‑1DCNN 98.63 98.17 50.68
2 1‑MsCNN‑SVM 95.72 95.51 70.92
3 1DCNN 88.32 88.13 45.32
4 2DCNN 85.57 85.39 27.41
5 SE‑2DCNN 87.64 87.45 34.53

对比实验1和实验2可以发现,在真实环境采集到的不平衡故障数据集上,SE‑1DCNN模型在精度和训练速度方面都有更好的表现,通过加入SE模块,对现有卷积核提取出的特征图赋予权重,用来区分不同波段的重要程度,比单纯增加卷积核重复提取特征信息更加有效。对比实验3和实验4可以看出,一维卷积网络在处理一维燃气调压器出口压力信号方面比二维卷积网络更具优势。对比实验1和实验5可以发现,相对于二维卷积网络,改进后的一维卷积网络结构保留下更多的时间序列特征,从而提高了模型的识别精度。

不同模型识别准确率和损失值对比分别如图67所示。实验结果表明,采用添加SE模块的1DCNN模型,在不增加卷积核数量的情况下能更加有效地提取故障识别特征,提高了故障识别精度。通过CBsoftmax损失函数利用各类别的有效样本量对损失函数进行重加权,能够消除样本数的分布差异,降低样本数的不平衡分布对网络故障识别能力造成的影响,提高模型在数据不平衡分布下燃气调压器故障识别能力,证明了所提出的模型改进方案的有效性。

图6  不同模型识别准确率对比

Fig.6  Comparison of recognition accuracy of different models

图7  不同模型损失值对比

Fig.7  Comparison of loss values of different models

5 结束语

针对数据的不平衡分布对网络识别能力的影响,提出了改进的SE‑1DCNN的深度学习算法,并用于燃气调压器的智能化故障识别。所提方法改进了传统CNN模型的结构,引入注意力机制赋予通道权重,并在交替的卷积层后加入BN层,使用类平衡损失函数替换交叉熵函数。实验结果表明:SE模块可以更高效地提取出最关键的特征信息,同时忽略弱相关特征,提升了模型的识别能力;类平衡损失函数可以消除样本分布差异,提高模型对较少样本类的识别能力;与其他模型相比,所提SE‑1DCNN模型可以明显提高在不平衡数据下的故障识别能力。然而,所提模型仍需要人工构建一定量的居民用户故障样本数据集进行训练,还不能完全适应实际中其他类型用户(如工业、商业等)燃气调压器故障诊断模式。

参考文献

1

安允王亚慧章富城. 基于概率神经网络的燃气调压器故障诊断模型[J]. 现代电子技术20194217): 109113. [百度学术] 

AN YunWANG YahuiZHANG Fucheng. Gas pressure regulator fault diagnosis model based on probabilistic neural network[J]. Modern Electronics Technique20194217): 109113.(in Chinese) [百度学术] 

2

郭裕祺朱大令何心. 基于自编码器的调压器在线故障诊断方法[J]. 煤气与热力2020401): 2023, 45. [百度学术] 

GUO YuqiZHU DalingHE Xin. On‑line fault diagnosis method of voltage regulator based on autoencoder[J]. Gas & Heat2020401): 2023, 45.(in Chinese) [百度学术] 

3

TIAN SBIAN X YTANG Z Pet al. Fault diagnosis of gas pressure regulators based on CEEMDAN and feature clustering[J]. IEEE Access20197132492132502. [百度学术] 

4

王莹王亚慧安允. 基于PSO‑KPCA‑LVQ的燃气调压器故障诊断[J]. 现代电子技术20204324): 6771. [百度学术] 

WANG YingWANG YahuiAN Yun. Gas pressure regulator fault diagnosis of based on PSO‑KPCA‑LVQ[J]. Modern Electronics Technique20204324): 6771.(in Chinese) [百度学术] 

5

HINTON G ESALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science20063135786): 504507. [百度学术] 

6

HINTON GDENG LYU Det al. Deep neural networks for acoustic modeling in speech recognition: the shared views of four research groups[J]. IEEE Signal Processing Magazine2012296): 8297. [百度学术] 

7

KRIZHEVSKY ASUTSKEVER IHINTON G E. ImageNet classification with deep convolutional neural networks[C]∥Proceedings of the 25th International Conference on Neural Information Processing Systems-Volume 1. NY, USACurran Associates Inc.201210971105. [百度学术] 

8

杜小磊陈志刚张楠. 基于同步挤压S变换和深度学习的轴承故障诊断[J]. 组合机床与自动化加工技术20195): 9093, 97. [百度学术] 

DU XiaoleiCHEN ZhigangZHANG Nanet al. Faults diagnosis of bearings based on synchrosqueezed S transform and deep learning[J]. Modular Machine Tool & Automatic Manufacturing Technique20195): 9093, 97.(in Chinese) [百度学术] 

9

盛永健黄子龙刘晨. 基于改进卷积神经网络的燃气调压器故障识别研究[J]. 现代制造工程20214): 132138. [百度学术] 

SHENG YongjianHUANG ZilongLIU Chenet al. Research on fault identification of gas pressure regulator based on improved convolutional neural network[J]. Modern Manufacturing Engineering20214): 132138.(in Chinese) [百度学术] 

10

LESSMEIER CKIMOTHO J KZIMMER Det al. Condition monitoring of bearing damage in electromechanical drive systems by using motor current signals of electric motors: a benchmark data set for data‑driven classification[C]∥European Conference of the Prognostics and Health Management Society. Bilbao, SpainPrognostics and Health Management Society2016117. [百度学术] 

11

JIA FLEI Y GLU Net al. Deep normalized convolutional neural network for imbalanced fault classification of machinery and its understanding via visualization[J]. Mechanical Systems and Signal Processing2018110349367. [百度学术] 

12

KANG BXIE SROHRBACH Met al. Decoupling representation and classifier for long‑tailed recognition[DB/OL]. (2019‑02‑19) [2022‑01‑20]. https:∥arxiv.org/abs/1910.09217. [百度学术] 

13

CAO K DWEI CGAIDON Aet al. Learning imbalanced datasets with label‑distribution‑aware margin loss[C]∥Proceedings of the 33rd International Conference on Neural Information Processing System. NY, USACurran Associates Inc201915671578. [百度学术] 

14

陈志郭武. 不平衡训练数据下的基于深度学习的文本分类[J]. 小型微型计算机系统2020411): 15. [百度学术] 

CHEN ZhiGUO Wu. Text classification based on depth learning on unbalanced data[J]. Journal of Chinese Computer Systems2020411): 15.(in Chinese) [百度学术] 

15

张立强李洋侯正阳. 深度学习与遥感数据分析[J]. 武汉大学学报(信息科学版)20204512): 18571864. [百度学术] 

ZHANG LiqiangLI YangHOU Zhengyanget al. Deep learning and remote sensing data analysis[J]. Journal of Wuhan University (Information Science Edition)20204512): 18571864.(in Chinese) [百度学术] 

16

CUI YJIA M LLIN T Yet al. Class‑balanced loss based on effective number of samples[C]∥2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Long Beach, CA, USAIEEE201992609269. [百度学术] 

17

赵小强张亚洲. 改进CNN的滚动轴承变工况故障诊断[J]. 西安交通大学学报202112): 111. [百度学术] 

ZHAO XiaoqiangZHANG Yazhou. Improved CNN based fault diagnosis of rolling bearings under variable working conditions[J]. Journal of Xi'an Jiaotong University202112): 111.(in Chinese) [百度学术] 

18

IOFFE SSZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift[DB/OL]. (2015‑03‑02) [2021‑11‑12]. https:∥arxiv.org/abs/1502.03167. [百度学术] 

19

BJORCK JGOMES CSELMAN B. Unders-tanding batch normalization[DB/OL]. (2018‑11‑30) [2022‑02‑22]. https:∥arxiv.org/abs/1806.02375. [百度学术] 

20

HU JLi SSUN G. Squeeze‑and‑excitation networks[C]∥IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USAIEEE201871327141. [百度学术]