Pytorch 研究メモ (10) - CWRU ベアリング データセットは元の .mat ファイルのサンプリングと重複します

1. 問題の導入

最近、データセットの強化について言及した論文を読みました。強化された手法はオーバーラップサンプリングであり、その手法については次のように説明されています。
ここに画像の説明を挿入

3. 重複サンプリングの原理

オーバーラップ サンプリングの原理は 1Dconv の原理と似ています。主なパラメータはウィンドウ サイズとストライドです。論文の例で検証されています: ( 60000 − 2048 ) / 1 + 1 = 57953 (60000-2048) /
ここに画像の説明を挿入
1+ 1= 579536 0 0 0 02 0 4 8 / 1+1=5 7 9 5 3
式は次のとおりです。
ここに画像の説明を挿入

3. 重複サンプリングを実現するために、損失 0.007 の直接内円断層ファイル 105.mat を例にとります。

CWRU データセットのファイル説明は次のとおりです。
ここに画像の説明を挿入

ここに画像の説明を挿入
ここに画像の説明を挿入
105.mat ファイルのドライブ エンド ベアリング障害データ データには合計 121265 ポイントがあり、ウィンドウ サイズは 1024、ストライドは 512 で、切り捨てられます。上記の式を使用して、取得できるサンプルの合計数を見積もると、次のようになります。 : ( 121265 −
1024 ) / 512 + 1 = 235 (121265-1024) / 512+1=2351 2 1 2 6 51 0 2 4 / 5 1 2+1=2 3 5

コードは以下のように表示されます

 '''
 # For 12k Drive End Bearing Fault Data
 from scipy.io import  loadmat
    axisname="105.mat"
    label=1
    stride=512
    signal_size=1024
    filename=r'C:\Users\Administrator\Desktop\cwru\12k Drive End Bearing Fault Datat'+'\\'+axisname
    axis = ["_DE_time", "_FE_time", "_BA_time"]
    datanumber = axisname.split(".") #将105.mat分割为105与mat取105
    if eval(datanumber[0]) < 100:
        realaxis = "X0" + datanumber[0] + axis[0]  #可组成X105_DE_time
    else:
        realaxis = "X" + datanumber[0] + axis[0]
      
    fl = loadmat(filename)[realaxis]
    data = []
    lab =[]
    n=(int)((fl.size-signal_size)/stride+1)
    start, end = 0, 0
    #贴标签,使用重叠采样,采样数量为 (点数-采样窗口大小)/步长+1
    for i in range(n):
        start = i * stride
        end = signal_size + i * stride
        data.append(fl[start:end])
        lab.append(label)

おすすめ

転載: blog.csdn.net/qq_23345187/article/details/122039020