モデリングにおける2020年中国大学院数学コンテストにおけるCの質問の分析

2020中国大学院数学モデリングコンテストC問題
EEG信号分析とリハビリエンジニアリングのための識別モデル
背景と意味
脳は人体の高レベルの神経活動の中心であり、何億ものニューロンがあり、それらを相互に接続しています。人体情報を送信して処理します。EEG信号は、発生方法に応じて、誘発EEG信号と自発EEG信号に分けることができます。誘発された脳の電気信号は、脳に潜在的な変化を引き起こす特定の外部刺激によって形成される脳の電気的活動です。自発的な脳の電気信号は、特別な外部刺激なしに脳によって自発的に生成される脳の電気的活動を指します。
(1)誘発脳波信号(P300ブレインコンピューターインターフェイス)
人間の脳は、日常生活の中で知覚、思考、運動、言語などの機能を制御し、末梢神経を媒体としてさまざまな部位に指示を出します。したがって、末梢神経や筋肉が損傷すると、脳の指示の伝達経路が遮断され、人体は正常に脳の指示の出力を完了できなくなり、外界との通信や制御ができなくなります。研究によると、末梢神経が機能しなくなっても、人間の脳は正常に機能し、命令を発行する情報の一部はいくつかの経路で表される可能性があります。脳とコンピュータのインターフェース技術は、末梢神経や筋肉組織で構成される出力経路の通常の通信システムに依存することなく、脳と外部補助装置との間の通信を実現することを目的としています。
P300のイベント関連電位は、誘発された脳波信号の一種で、小さな確率刺激の発生から約300ミリ秒後に現れる正の波のピーク(ベースラインに対して上昇傾向を示す波)です。個人差によりP300の発生時間も異なり、図1に刺激後約450ミリ秒のP300波形を示します。内因性の構成要素として、P300電位は刺激の物理的特性に影響されず、知覚または認知的精神活動に関連し、注意、記憶、知性などの処理プロセスに密接に関連しています。P300ベースの脳コンピューターインターフェイスの利点は、ユーザーが複雑なトレーニングなしでより高い認識精度を得ることができ、安定した時間ロックと高い時間精度特性を備えていることです。

図1 P300波形図
(2)自発的脳波信号(Sleep EEG)
睡眠は身体の休息とエネルギー蓄積の重要な部分であり、睡眠の質は人々の身体的および精神的状態にも大きな影響を与えます。睡眠の質を改善し、睡眠に関連する疾患が健康に及ぼす影響を減らす方法は、ますます注目されています。睡眠中に収集される脳波信号は、自発的な脳波信号です。自発的睡眠EEG信号は、身体自身の状態の変化を反映する可能性があり、関連する疾患の診断と治療の重要な基礎でもあります。
スリーププロセスは、動的に変化する複雑なプロセスです。国際睡眠病期分類の解釈基準R&Kでは、睡眠過程のさまざまな状態が分けられています。覚醒期間を除いて、睡眠サイクルは2つの睡眠状態、つまり非急速眼球運動期間と急速眼球運動期間によって交互に循環します。非急速眼球運動段階では、浅い状態から深い状態への段階的な睡眠状態の変化に応じて、睡眠段階I、睡眠段階II、睡眠段階IIIおよび睡眠段階IVにさらに分けられ、睡眠段階IIIおよび睡眠段階IVを組み合わせて深い睡眠にすることができます限目。図2は、さまざまな睡眠段階に対応するEEG信号の時系列を上から下に示しています。これらは、覚醒、睡眠I、睡眠II、深い睡眠、急速な眼球運動です。図2から、EEG信号の特性は睡眠段階によって異なることがわかります。EEG信号に基づく自動ステージングは​​、専門家や医師の手作業による負担を軽減し、睡眠の質を評価し、睡眠関連疾患を診断および治療するための重要な補助ツールです。

(a)地味な期間

(b)睡眠段階I

©睡眠段階II

(d)深い睡眠期間

(e)急速な眼球運動フェーズ
図2各睡眠段階の睡眠EEG信号の時系列
サブジェクトタスク
このコンテストには、2つの添付ファイル(データファイル)と4つのタスクタスクが含まれます。具体的な手順は次の通りです。
別紙1:実験データインタフェースP300脳-コンピュータが
提供して実験データインタフェースP300脳とコンピュータ5人の健康成人被験者(S1-S5)のを、平均年齢は20歳です。実験の過程で、各参加者(被験者)は集中する必要があります。P300ブレインコンピューターインターフェイス実験の設計は次のとおりです。各参加者は、図3に示すように、36文字で構成される文字マトリックスを観察できます。文字マトリックスは行または列(合計6行と6列)にあります。実験の各ラウンドの設計プロセス:最初に、図3の文字マトリックスの上に表示される灰色の文字「A」などの「ターゲットキャラクター」を見るように被験者に促します。次に、ランダムな順序で毎回キャラクターマトリックスの点滅モードに入ります。文字マトリックスの1行または1列を点滅させ、点滅時間は80ミリ秒、間隔は80ミリ秒です。最後に、すべての行と列が1回点滅すると、実験が終了します。被験者が「ターゲットキャラクター」を見ているプロセスでは、ターゲットキャラクターの行または列が点滅するとP300電位がEEG信号に表示され、他の行と列が点滅するとP300電位が表示されません。上記の実験手順は、1ラウンド、合計5ラウンドの繰り返しです。

図3文字マトリックスインターフェイス

各被験者のP300 EEGデータには、4つのファイルが含まれています。これらのファイルは、
train_data:トレーニングデータ、
train_event:トレーニングデータのイベントラベル、
test_data:テストデータ、
test_event:テストデータのイベントラベルです。
トレーニングデータには既知の12個のターゲットキャラクター(char01 char12)のデータが含まれ、テストデータには10個の認識されるターゲットキャラクター(char13 char22)のデータが含まれます各文字マトリックスシンチレーション実験では、EEGデータテーブルに20列が含まれています(各列は1つの記録チャネルを表し、記録チャネルには順番に番号が付けられています。表1は記録チャネルの識別子で、図5は記録チャネルの場所に対応しています)、 EEGデータテーブルの行はサンプルポイントデータを表し、サンプリング周波数は250 Hzです。信号取得デバイスは、参照電極と接地電極を備えています。つまり、記録チャネルの信号は、アクティブ電極と参照電極の差です。

表1取得チャネルの
識別子識別子チャネルの
名前識別子チャネルの
名前
1 Fz 11 CP5
2 F3 12 CP6
3 F4 13 Pz
4 Cz 14 P3
5 C3 15 P4
6 C4 16 P7
7 T7 17 P8
8 T8 18 Oz
9 CP3 19 O1
10 CP4 20 O2

図5
トレーニングデータファイルのEEG取得チャネルタグは、実験データに対応する同じサブテーブル形式であり、サブテーブルの名前は「charXX(Y)」、対応する文字のシーケンス番号に対応するXX、Yは実際のターゲットキャラクター。サブテーブルの内容には2つの列が含まれ、最初の列はラベル、2番目の列はサンプリングポイント番号です。実験の各ラウンドの開始ラベルは、ターゲット文字に対応する識別子(「A」の「101」などの詳細については、文字マトリックスの36文字の識別子が表2に示されています)であり、その後に点滅する行または列の識別子が続きます。 (詳細については、図6を参照してください。たとえば、 "2"は2行目を表し、 "9"は3列目を表します)、1回の実験の終了ラベルは "100"です。トレーニングデータのイベントラベルファイルでは、最初の行にターゲットキャラクターのIDと対応するサンプリングポイントのシリアル番号が示され、その後にランダムに点滅する行と列のIDと対応するサンプリングポイントのシリアル番号が続きます。 「100」の識別子が終了し、合計5回繰り返されます。
テストデータのラベルファイルもサブテーブルの形式の実験データに対応し、サブテーブルの名前は「charXX」、XXは対応する文字のシリアル番号に対応します。テストデータのイベントタグファイルでは、一行目に認識対象文字の識別子を一律「666」で表記しています。EEG信号を解析すると、P300電位が現れる行と列が得られ、対象文字の認識結果を決定します。
表2文字マトリックスの識別子
A 101 B 102 C 103 D 104 E 105 F 106
G 107 H 108 I 109 J 110 K 111 L 112
M 113 N 114 O 115 P 116 Q 117 R 118
S 119 T 120 U 121 V 122 W 123 X 124
Y 125 Z 126 1 127 2 128 3129 4130
5 131 6132 7133 8134 9 135 0 136

図6行/列の識別子
付録2:睡眠脳波データ
夜間睡眠中にさまざまな健康な成人から採取した3000の睡眠脳波機能サンプルとそのラベルを提供します。最初の列は「既知のラベル」で、番号を使用してさまざまな睡眠段階を示します。覚醒(6)、急速な眼球運動(5)、睡眠I(4)、睡眠II(3)、深い睡眠期間(2); 2番目から5番目の列は、「アルファ」、「ベータ」、「シータ」、「デルタ」を順番に含む、元の時系列から計算された特性パラメーターで、「8- 13Hz」、「14-25Hz」、「4-7Hz」、および「0.5-4Hz」エネルギー範囲の周波数範囲。特性パラメータの単位はパーセントです。
上記の添付資料に記載されているデータソースと実験データに基づいて、次の質問を検討してください。
質問1:脳とコンピューターのインターフェースシステムでは、ターゲットの分類精度だけでなく、特定の情報伝送速度も保証する必要があります。できるだけ少ないラウンドを使用して(ラウンドが5以下である必要がある)テストデータを使用して、付録1に記載されたデータに基づく方法を設計または採用し、付録1の5つのテストセットのうち10を見つけてください。識別されるターゲット、および特定の分類と識別プロセスが与えられます。これは、いくつかの方法と比較して、設計方法の合理性を示すことができます。
問題2:収集された元のEEGデータが大量にあるため、そのような信号はより冗長な情報を含むようにバインドされます。図5と表1によると、20のEEG信号取得チャネルでは、無関係または冗長なチャネルデータはシステムの複雑さを増すだけでなく、分類と認識の精度とパフォーマンスにも影響します。付録1に示すデータを分析し、チャネル選択アルゴリズムを設計して、各サブジェクトの分類に役立つチャネル名の組み合わせを作成してください(チャネルの組み合わせの数は20未満または10より大きい必要があり、各サブジェクトが選択しますチャネルは異なる場合があります。具体的なチャネル名を図5と表1に示します。チャネル選択の結果に基づいて、すべての被験者により適した一連の最適なチャネル名の組み合わせをさらに分析し、特定の分析プロセスを提供します。参加者が最適なチャネルの組み合わせを選択できるようにするために、テストデータ(char13〜char17)の結果がコンテストの質問に表示されます。その文字は、M、F、5、2、およびIです。
質問3:P300ブレインコンピューターインターフェイスシステムでは、モデルをトレーニングするためのラベル付きサンプルの取得に長い時間がかかることがよくあります。トレーニング時間を短縮するために、付録1に示すデータに従って適切な量のサンプルをラベル付きサンプルとして選択し、残りのトレーニングサンプルをラベルなしサンプルとして選択してください。2番目の質問で得られた最適なチャネルの組み合わせのセットに基づいて学習方法を設計してください、そして質問2のテストデータ(char13〜char17)を使用してメソッドの有効性を検証し、設計された学習メソッドを使用してテストセット(char18〜char22)で識別される残りのターゲットを見つけます。
質問4:付録2に記載されている機能サンプルに基づいて、可能な限り少数のトレーニングサンプルに基づいて比較的高い予測精度が得られる睡眠ステージング予測モデルを設計し、トレーニングデータとテストデータを提供してください特定の分類と認識プロセスを説明するために選択方法と割り当て比率が使用され、予測効果は分類パフォーマンス指標と組み合わせて分析されます。
注:質問1を調査する場合、質問2で提供された5つのテストデータの結果は既知の条件として使用できません。この条件を使用すると、不正行為と判断されます。

(つづく...)

おすすめ

転載: blog.csdn.net/Dujing2019/article/details/108640086