TimesNet が結果を再現した

再生環境:RTX3090、22312GBビデオメモリ、torch=1.8.1+cu111、
ネットワーク構造やハイパーパラメータを変更せずに直接トレーニング。結果は次のとおりです。

classification_EthanolConcentration_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.30038022813688214

classification_FaceDetection_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el3_dl1_df256_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.677639046538025

classification_Handwriting_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.33294117647058824

classification_Heartbeat_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.7365853658536585

classification_JapaneseVowels_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9675675675675676

classification_PEMS-SF_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.8728323699421965

classification_SelfRegulationSCP1_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el3_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9146757679180887

classification_SelfRegulationSCP2_TimesNet_UEA_ftM_sl96_ll48_pl96_dm64_nh8_el3_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.5333333333333333

classification_SpokenArabicDigits_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df32_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.9872669395179627

classification_UWaveGestureLibrary_TimesNet_UEA_ftM_sl96_ll48_pl96_dm32_nh8_el2_dl1_df64_fc1_ebtimeF_dtTrue_Exp_0  
accuracy:0.85

精度は約 71.3% で、論文に掲載された精度 (73.6) よりもはるかに悪いです。
ここに画像の説明を挿入
劣悪なデータセットのうち 3 つは次のとおりです。

一、エタノール濃度 0.30038022813688214

ここに画像の説明を挿入

EthanolConcentration は、44 個の異なる本物のウイスキーボトル内の水とエタノール溶液の生のスペクトルのデータセットです ~\cite{large2018detecting}。エタノールの濃度はそれぞれ35%、38%、40%、45%でした。スコッチ ウイスキーの法定最低アルコール度数は 40% であり、多くのウイスキーはこのアルコール度を維持しています。生産者は、ラベルに記載されている内容と密接に関連したレベルのアルコールがスピリッツに含まれていることを確認する必要があります。分類問題は、任意のボトルに入っているサンプルのアルコール濃度を決定することです。データは、各インスタンスが同じボトルおよび溶液のバッチからの 3 つの反復測定値で構成されるように配置されました。各濃度 (バッチ) に対して 3 つの溶液を調製し、各ボトルとバッチの組み合わせを 3 回測定しました。各測定値は、ボトルを持ち上げ、光源とビームスプリッターの間に置き、スペクトルを保存することで構成されます。スペクトルは、使用した単一の StellarNet BLACKComet-SR 分光計の最大波長範囲 (226nm ~ 1101.5nm、サンプリング周波数 0.5nm) にわたって、1 秒の積分時間で記録されました。ボトルのラベル、エンボス加工、継ぎ目を避ける以外には、個々のボトルの読み取り値をできるだけ正確に取得するための特別な試みは行われておらず、繰り返しの読み取りごとにボトル内の正確な経路が正確に再現されることもありませんでした。これは、疑わしい蒸留酒の一括検査を実施するオペレーターの潜在的な将来の状況を再現するためです。@inproceedings{large2018detecting, title={振動分光法と機械学習による偽造アルコールの非侵襲的検出}、著者={Large、James and Kemsley、E Kate and Wellner、Nikolaus and Goodall、Ian and Bagnall、Anthony}、title={ Asia知識発見とデータ マイニングに関する太平洋会議}、ページ = {298–309}、年 = {2018}、組織 = {Springer}}

原因分析:

  • まず、シーケンスの長さが非常に長い
  • 第二に、データセットは視覚化されておらず、異なる種類の元のスペクトルデータセット間に違いがあるかどうかを分析することは不可能です(データセットは 4 つのカテゴリであり、分類効果はほとんどありません。つまり、ネットワークは何も学ばなかった)
  • 第三に、データセットは大きくありません(トレーニングセットは261ですが、ucrは元々ディープラーニングに使用されていません。これは一般的な問題です)。

2. 手書き 0.33294117647058824

ここに画像の説明を挿入
ここに画像の説明を挿入

UCR が作成した 26 文字のアルファベットを被験者が書いている間にスマートウォッチから取得された動きのデータセット。150 のトレーニング ケースと 850 のテスト ケースがあります。6 つの次元は、3 つの加速度計の値と 3 つのジャイロスコープの読み取り値です。[1] M. Shokoohi-Yekta、B. Hu、J. Wang、および E Keogh (2017) DTW を多次元の場合に一般化するには、適応的なアプローチが必要です。データ マイニングと知識発見 (31) 1、p. 1.31

原因分析:

  • まず、トレーニング セットが比較的小さい
  • 第二に、関連性がない可能性があります (26 分類、精度は約 0.3、分類の影響はほとんどありません)。

三、自主規制SCP2 0.5333333333333333

ここに画像の説明を挿入

BCI II コンペティションのデータセット 1b: 遅い皮質電位の自己調節。テュービンゲン大学によって提供されたデータセット。データセットは、人工的に蘇生された ALS 患者から採取されました。被験者は、皮質電位が記録されている間、コンピューター画面上でカーソルを上下に動かすように依頼されました。記録中、被験者は遅い皮質電位(Cz-Mastoids)の聴覚および視覚フィードバックを受けました。皮質陽性により、画面上のカーソルが下に移動します。皮質の陰性によりカーソルが上に移動します。各トライアルは 8 秒間続きます。各試行の 0.5 秒から 7.5 秒の間、​​画面の上部 (ネガティブな場合) または下部 (ポジティブな場合) にある強調表示されたターゲットが視覚的および聴覚的にタスクを提示しました。また、タスク(上または下)は 0.5 秒で音を鳴らします。視覚的なフィードバックは 2 秒から 6.5 秒まで表示されます。トレーニングとテストのためにトライアルごとにこの 4.5 秒の間隔のみが提供されます。256 Hz のサンプリング レートと 4.5 秒のレコード長により、トライアルごとにチャネルごとに 1152 サンプルが得られました。試験構造の概要: 期間: 8 秒、試験間の間隔なし。タスクのレンダリング: 0.5 秒から 7.5 秒。フィードバック期間: 2.0 秒から 6.5 秒まで EEG データは次の場所から取得されました: チャンネル 1: A1-Cz (10/20 システム) (A1 = 左乳様突起); チャンネル 2: A2-Cz; チャンネル 3: 前頭部 2 cm C3 まで チャネル 4: C3 頭頂葉 2 cm; チャネル 5: 垂直眼球運動検出用 vEOG アーチファクト チャネル; チャネル 6: C4 前部 2 cm; チャネル 7: C4 頭頂葉 2 cm。EEG値はEOGに対して補正されていませんでした。トレーニング データは、同じ日に記録され、ランダムに並べられた 200 回のトライアル (クラスごとに 100 回) で構成されています。次元は 7 つあり、系列の長さは 1152 です。テストデータには 180 回分のテストデータが含まれています。このテストデータは、列車データの後に記録されました(同日)。180 件の試験はクラス 0 またはクラス 1 に属しました。このデータセットに分類タスクに役立つ情報が含まれているかどうかは不明であることに注意してください。結果に対する見方はそうではないことを示唆しています。最高のものには 45.5% の誤差があります。参考文献: Birbaumer, N.、Flor, H.、Ghanayim, N.、Hinterberger, T.、Iverson, I.、Taub, E.、Kotchoubey, B.、Kubler、

scp1と比べるとかなり劣ります。
ここに画像の説明を挿入

データセット Ia: 遅い皮質電位の自己調節。テュービンゲン大学によって提供されたデータセット。実験の説明: データセットは健康な被験者から採取されました。被験者は、皮質電位が記録されている間、コンピューター画面上でカーソルを上下に動かすように依頼されました。記録中、被験者は遅い皮質電位(Cz-Mastoids)の視覚的フィードバックを受けました。皮質陽性により、画面上のカーソルが下に移動します。皮質の陰性によりカーソルが上に移動します。各トライアルは 6 秒間続きます。各試行中、0.5 秒目から試行の終了まで、ネガティブまたはポジティブを示すために画面の上部または下部でターゲットが強調表示されてタスクが視覚的に提示されます。視覚的なフィードバックは 2 秒目から 5.5 秒目まで表示されます。トレーニングとテストのためにトライアルごとにこの 3.5 秒の間隔のみが提供されます。256 Hz のサンプリング レートと 3.5 秒のレコード長により、トライアルごとにチャネルごとに 896 サンプルが得られました。トライアル構造の概要: 期間: 6 秒、トライアル間隔なし タスクプレゼンテーション: 0.5 秒から 6.0 秒まで フィードバック期間: 2.0 秒から 5.5 秒まで データ: アンプ: PsyLab EEG8 A/D コンバーター: コンピューター ボード PCIM-DAS1602/16 ビット振幅範囲: +/-1000 µV サンプリング レート: 256 S/s 以下の場所から取得された EEG データ: チャンネル 1: A1-Cz (10/20 システム) (A1 = 左乳様突起) チャンネル 2: A2-Cz チャンネル 3 : C3 の前面 2 cm チャネル 4: C3 の上部 2 cm チャネル 5: C4 の前面 2 cm チャネル 6: C4 の上部 2 cm すべての値はマイクロボルト単位です。トレーニング データは、2 つの異なる日に記録され、ランダムに混合された 268 回のトライアルで構成されています。合計 268 件のトライアルのうち、168 件は 1 日目のもので、残りの 100 件は 2 日目のものでした。データは 2 つのトレーニング ファイル Traindata_0.txt と Traindata_1.txt から取得されます。各インスタンスには、長さ 896 (上部 EEG チャネル) の 6 つの次元があります。カテゴリ ラベルはネガティブまたはポジティブです。テストデータは全部で293個あり、ラベルはゲーム後に公開されます。結果 15 エントリ、中央値エラー 17.8%、最良のテスト データ エラー率 11.3% (約 33 個が不正解)。参考文献: Birbaumer, N.、Flor, H.、Ghanayim, N.、Hinterberger、

原因分析:

  • scp2 は患者から取得され、scp1 は正常な人から取得され、それが違いを引き起こした可能性があります

おすすめ

転載: blog.csdn.net/weixin_44907625/article/details/129585620