論文の読書 --- 「教師なし ECG 分析: レビュー」

トピック

教師なし ECG 分析 - レビュー

まとめ

        心電図 (ECG) は、心臓の異常を検出するための最も標準的な技術です。ECG 異常の自動検出は、臨床医が心臓モニターが毎日生成する膨大な量のデータを分析するのに役立ちます。教師あり機械学習モデルをトレーニングするための、心臓専門医がラベル付けした異常な ECG サンプルの数が限られているため、ECG 分析のための教師なし学習手法の必要性が高まっています。教師なし学習は、心臓専門医が提供するラベルを必要とせずに、ECG サンプルをさまざまな異常カテゴリに分類することを目的としています。これは ECG クラスタリングとして知られるプロセスです。異常検出に加えて、ECG クラスタリングは最近、感情、心理的障害、代謝レベルなど、身体と精神全体に関する個人間のパターンを反映する貴重な情報を明らかにしました。ECG クラスタリングは、データの不均衡の問題など、教師あり学習システムが直面する特定の課題にも対処し、生体認証システムを強化できます。教師あり ECG システムに関するレビュー記事はいくつかありますが、教師なし ECG 解析技術に関する包括的なレビューはまだ不足しています。この研究では主に、過去 10 年間にわたる ECG クラスタリング技術の主な発展をレビューします。最近の機械学習および深層学習アルゴリズムとその実用的な応用に重点が置かれています。私たちはこれらの技術を批判的にレビューおよび比較し、その用途と限界について議論し、将来の研究の方向性を提供します。このレビューでは、ECG クラスタリングについての深い洞察が提供され、特定のアプリケーションに適切なアルゴリズムを採用するために必要な情報が提供されます。

導入

        心電図 (ECG) は心臓の電気活動を示します。これは集中治療室だけでなく、日常的なモニタリングやウェアラブルモニターでも定期的に記録され、毎日大量のデータが生成されます。心臓専門医が提供する ECG データセットとラベルを使用して、心拍を正常およびいくつかの異常なカテゴリに分類する、教師あり機械学習に基づく多数のシステムが開発されています [1] ~ [5]。ただし、心臓専門医は、一般的な心臓の異常を示すために、膨大な量の ECG データのごく一部を分析してラベルを付けることしかできません。さらに、ほとんどのラベル付き ECG データセットは、病院や診療所などの管理された環境で取得されており、さまざまな生理学的および病理学的状態で発生する可能性のある多様な ECG パターンと比較して、非常に限られたサンプルが含まれています。たとえば、ストレス下にある人や糖尿病を患っている人から取得された ECG データのパターンは、通常の状態で取得されたものとは異なることが示されています [6]、[7]。したがって、最近、心臓専門医によって提供されたラベルなしで ECG データを分析するためのいくつかの教師なし学習方法が提案されています。これは ECG クラスタリングとして知られるプロセスです。

        ただし、教師なし ECG 解析の必要性は、心臓専門医が提供するラベルの不足だけが原因ではありません。実際には、患者間および患者内の ECG パターンと構造が存在し、それが発見されれば、心血管系および身体と精神全体に関する貴重な情報がさらに明らかになる可能性があります。これらの関係を発見することで、さまざまな健康状態や心と体の状態の複雑なメカニズムや重要なバイオマーカーが明らかになり、最終的には医師がきめ細かい治療法を決定できるようになります。特に、これらのパターンは複雑でデータ量が多いため、視覚的に識別することはできませんでした。ただし、これらのパターンはクラスタリング技術によって自動的に識別できます。たとえば、ECG クラスタリングは、特に精神生理学分野の研究者が、さまざまな感情状態 (悲しみや感情的ストレスなど)、脳障害 (てんかんなど)、無気力状態に関連する隠れた ECG パターンを発見するのに役立ちました [6] 。 [8]、[9]。ECG クラスタリングにより、研究者は、糖尿病 [7]、夜間低血糖 [10]、塞栓性脳卒中 [11]、アテローム性動脈硬化症 [12] など、さまざまな健康状態を持つ患者の重大な心臓異常や代謝の違いを特定することもできます。

        より広範な知識発見システムの一部として適用されることに加えて、クラスタリング技術、特にオートエンコーダ [13]、[14] や敵対的生成ネットワーク [15] などの深層学習ベースの教師なし手法は、次のような問題の一部を克服するためにも使用されています。不均衡なデータ問題への対処 [16] や個別化された ECG 分類器の低レベル自動化 [17] ~ [19] など、ECG 教師あ​​り学習システムが直面する課題。さらに、ECG クラスタリングは、生体認証 [20] ~ [23]、ECG セグメンテーション [24]、[25]、および腹部 ECG からの胎児 ECG の抽出 [26] に適用されています。

        現在までに、いくつかの研究で ECG 分析の教師あり学習手法がレビューされています [2]–[4]、[27]–[30]。ただし、著者の知る限り、この研究は教師なし ECG 分析システムの最初の包括的かつ批判的なレビューです。この研究では、臨床/医療アプリケーションにおける教師なし ECG 解析システムと、従来のモデルから最新の深層学習モデルまで、これらのシステムで採用されている関連する機械学習手法をレビューします。包括的なレビューを行うために、IEEEEXplore、ScienceDirect、Google Scholar、Scopus、PubMed データベースを含む複数のプラットフォームを検索し、有名な引用指数によってランク付けされた有名な雑誌や会議で過去 10 年以内に発表された研究のほとんどを選択しました。これらの最近の研究について議論し、比較し、その限界を概説し、将来の方向性を示します。これにより、研究者は必要な情報を簡単に入手し、特定のアプリケーションに適切なアルゴリズムを選択できるようになります。

心電図 (ECG) クラスタリング

        一般的な心電図 (ECG) クラスタリング パイプラインには、クラスタリング アルゴリズムを適用する前に、いくつかのデータ準備と前処理のステップが含まれています。このセクションでは、ノイズ除去、セグメンテーション、特徴エンジニアリングなど、ECG データを効率的にクラスタリングするためのデータ準備手法を簡単に説明します。次に、深層学習アプローチを含む従来のクラスタリング アルゴリズムと最先端のクラスタリング アルゴリズムを徹底的にレビューし、重要な比較を行います。

ECG クラスタリングのためのデータ準備

        ノイズ除去、セグメンテーション、および特徴エンジニアリングに使用される手法は、教師あり学習システムで使用される手法と主に重複しています。ここでは、これらの手法、特に ECG クラスタリングに合わせた手法を簡単に紹介します。興味のある読者は、[2] ~ [4] で詳細な情報を参照してください。

        1) ノイズ除去とアーティファクトの除去: このステップは、患者の呼吸、皮膚の伸び、電力線の干渉、筋肉の収縮による歪みの影響を軽減することを目的としています。ECG ノイズ除去システムは通常、移動平均フィルター、周波数選択フィルター、ウィーナー フィルター、適応フィルター、および離散ウェーブレット変換に基づいています [31]。ECG ノイズ除去方法の詳細については、[31] を参照してください。

        2) セグメンテーション: ノイズ除去された ECG 信号は通常、心拍を自動的に認識することによって準周期単位にセグメント化されます。心拍は、心臓の心房 (心房と心室) の脱分極 (収縮期) と再分極 (拡張) を表す、P 波、QRS 波、T 波と呼ばれるいくつかの電波で構成されています [32]。

        ほとんどの ECG クラスタリング研究では、QRS 群のピークである R ピークが検出され、信号に沿った 2 つの連続する R ピーク間の間隔、つまり心周期全体がセグメンテーションの単位として考慮されます。セグメンテーションのために ECG 信号の他の特徴点を考慮した研究はほとんどありません [33]–[35]。ECG サイクルの PR、ST、および TP セグメントの異常な形態は、心筋虚血、低カリウム血症、心房細動などの一般的な心臓疾患を示している可能性があることを考慮すると [32]、セグメンテーションに他の ECG 特徴点を追加すると、クラスタリング結果を改善できます。セグメント化のために ECG 信号内の心周期を識別する代わりに、特徴点を識別せずに信号を一定の時間間隔に分割する研究もあります [36]、[37]。セグメンテーションを実行しない ECG クラスタリング手法もあります [38]、[39]。これらの方法は、生理学的特徴点を特定することなく、ECG 信号から直接特徴を抽出します。

        3) 特徴エンジニアリング: このステップは、下流の教師なし学習タスクを促進するために ECG セグメントの最も有益な特徴を取得することを目的としています。ここでは、従来の ECG 特徴エンジニアリング手法を簡単に紹介します。より最近の深層学習手法については、セクション II-C で説明します。

        専門の医師は通常、P 波、QRS 波、および T 波のタイミングと振幅特性を検査して、心臓病を診断します。ただし、心臓の異常は側頭領域で常に目に見えるとは限りません[40]。パワースペクトル分析と時間周波数分析(ウェーブレット変換など)によって得られる ECG 信号の周波数情報は、このギャップを埋めることができます。ウェーブレット変換では、入力 ECG とウェーブレットと呼ばれる一連の有限永続関数間の相関が ECG 特徴とみなされます [36]、[41]。興味のある読者は、時間領域、電圧領域、および周波数領域における特徴量エンジニアリング手法の詳細について、次のソース [3]、[4]、[29]、[30] を参照してください。

        最近では、ホタル アルゴリズムや粒子群最適化など、自然にヒントを得た群ベースの最適化手法も特徴エンジニアリングに使用されています [42]、[43]。これらの方法では、考えられる多数の特徴の中で、分類またはクラスタリングのパフォーマンスの点で最も優れた性能を発揮する特徴を検索します。たとえば、Kora [42] は、ECG 信号上の各点を特徴の可能性として考慮しています。彼女は、Firefly アルゴリズムを使用して、ECG セグメントを正常と心筋梗塞のカテゴリに分類するために使用されるニューラル ネットワークの精度を最大化する点を探します。自然にインスピレーションを得た特徴量エンジニアリング手法の詳細については、次の情報源 [44] ~ [46] を参照してください。

        最後に、ECG のセグメント化された単位がクラスター化され、各グループには、事前定義された類似性尺度に従って、対応する固有ベクトルが他のグループの固有ベクトルよりも互いに類似しているセグメントが含まれます。

クラスタリングアルゴリズム

        クラスタリングでは、2 つの ECG セグメント間の距離を測定する類似性 (または非類似性) の尺度が重要です。既存のさまざまな類似性尺度の中でも、ユークリッド距離、コサイン係数、および動的タイムワーピング距離 [47] は、ECG クラスタリングで広く使用されている 3 つの尺度です。前者の 2 つは通常、時間的および形態学的特徴またはウェーブレット係数によって表される ECG 単位間の類似性を測定するために使用されます。動的タイムワーピングは、長さが異なる 2 つの時系列間の類似性を測定する方法です。ここでは、ECG クラスタリングのための従来のクラスタリング アルゴリズムを簡単に紹介します。最近の深層学習ベースのクラスタリング アルゴリズムについては、セクション II-C で説明します。ECG 解析用に提示されたアルゴリズムの長所と限界についてはセクション II-D で説明し、表 I にまとめます。

medoid に基づくクラスタリング

        medoid ベースのクラスタリング手法は、ECG セグメントを、これらのグループの medoid との類似性に基づいてさまざまなグループに分割します。中心点は、対応するグループの代表的なセグメントとみなされます。K 平均法は、最もよく知られている medoid ベースのクラスタリング アルゴリズムであり、クラスター medoid をそのクラスターの中心にある ECG セグメント (またはその固有ベクトル) の平均とみなします。教師なし ECG 解析では、K 平均のバリエーションには、ファジー C 平均 [48]、親和性伝播 [49]、および最大最小クラスタリング [50] が含まれます。これらのアルゴリズムは中心点の取得が異なります。たとえば、類似性伝播は、ECG セグメント間の類似性を伝えるメッセージを交換することによって中心点を取得します。medoid に基づくクラスタリング アルゴリズムは通常、実装が簡単で、計算コストが低くなります。ただし、これらは一般に、ノイズ、外れ値、高次元の特徴空間の処理には適していません。

階層的クラスタリング

        階層的クラスタリングでは、各 ECG セグメントを独立したクラスターとして扱い、(データセット全体を含む) クラスターが 1 つだけ残るまで、最も類似したクラスターをマージします。階層的クラスタリング アルゴリズムは一般に、medoid ベースのクラスタリング アルゴリズムよりも計算コストが高くなりますが、これらの方法は結果として得られる樹状図が独特であり、クラスター間の階層関係を視覚化し、Yu 博士の説明に役立ちます [51]。

分散ベースのクラスタリング

        このタイプのクラスタリング アルゴリズムの目的は、ECG セグメントが各クラスターに属する確率を見つけることです。ガウス混合モデル (GMM) は、よく知られた分布ベースのクラスタリング アルゴリズムであり、レビューされた研究 [36]、[37] で広く採用されています。GMM は、複数のガウス分布によって ECG セグメントが生成されることを前提としています。つまり、各クラスターは、平均とその平均の周囲の標準偏差を持つガウス分布によって定義されます。ディリクレ過程 GMM は、初期クラスター数 (つまり、データ空間内のガウス成分) を必要としない GMM の変形です [52]。DPGMM は、クラスターの事前分布を推定する反復アルゴリズムである変分ベイジアン推論を通じて、クラスターの数を自動的に学習します。分布ベースのクラスタリング アルゴリズムは、ノイズや外れ値の処理に適していますが、通常は高い計算コストがかかります。DPGMM は GMM よりも計算コストが高いことに注意してください。

密度ベースのクラスタリング

        密度は通常、事前に定義された半径内のデータ ポイントの数として定義されます。密度ベースのクラスタリングでは、クラスタをデータ空間内の高密度の領域として見ます。DBSCAN [53] と自己組織化マップ (SOM) [54] は、ECG クラスタリングに使用されているよく知られた密度ベースのクラスタリング アルゴリズムです。DBSCAN は、領域の密度が事前定義されたしきい値を超えた場合、その領域をクラスターとみなします。ノイズと外れ値は効果的に処理されますが、結果として得られるクラスターは、半径としきい値の選択に大きく依存します。自己組織化マップ (SOM) は、ECG セグメント間の特定のトポロジを想定して、入力セグメントを 2 次元グリッドにマッピングするニューラル ネットワークの一種です。結果として得られるメッシュは、高密度領域で曲がったり、歪んだりします [54]。SOM は、解釈可能な 2 次元グリッド内のクラスターの構成を提供しますが、高い計算コストがかかります。

スペクトルクラスタリング

        スペクトル クラスタリングは、クラスタリング問題をグラフ セグメンテーション問題 [55] に変換します。ここでの目標は、サブグラフを接続するエッジの重みの合計が最小になるようにグラフをサブグラフに分割することです。ECG クラスタリングでは、ECG セグメントはノードとして考慮され、それらの間の類似性はノードを接続するエッジの重みとして表現されます [56]。スペクトル クラスタリングは高次元の特徴空間を効果的に処理できますが、高い計算コストとスペース コストが発生します [47]。  

群れインテリジェンスに基づくクラスタリング

        群知能モデルは、クラスタリング問題を最適化タスクとして扱います。その目標は、クラスタ内の電気記録図セグメント間の全体的な類似性を最大化することです。たとえば、アリのコロニー クラスタリング アルゴリズム [57] では、アリのグループが 1 つの ECG セグメントから別の ECG セグメントにランダムに移動し、それらの類似性に基づいてセグメントに値 (つまり、フェロモン) を割り当てます。次に、クラスターは、類似度の値が事前定義されたしきい値を超えるセグメントとして識別されます。粒子群最適化 [58] と人工蜂コロニー [59] は、ECG クラスタリング用の他の群知能ベースのアルゴリズム [41]、[60]、[61] です。群インテリジェンスに基づくクラスタリング アルゴリズムは、最適なクラスター ソリューションを検索する際に局所的な最適解を回避でき、高品質のクラスターを実現します。ただし、これらのアルゴリズムの確率的な性質により、特に大規模なデータセットでは、多くの場合、高い計算コストが発生します。

最大マージンクラスタリング

        Maximum Margin Clustering (MMC) [62] は、サポート ベクター マシン (SVM) を利用して、ラベルのないデータに対してクラスタリングを実行します。具体的には、ラベル付けされたセグメントに対して SVM を実行することによって得られる分離を最大化する、一連の ECG セグメントのラベルを見つけます。MMC の主な欠点は、非凸整数問題を解くための計算コストの高いステップです [34]。

アンサンブルクラスタリング

        アンサンブル クラスタリングでは、1 つ以上のクラスタリング アルゴリズムを複数回実行した結果が結合されて、個別のクラスタリング アルゴリズムで得られるものよりも一貫性の高いデータ クラスタが得られます。たとえば、Abawajy ら [38] は ECG クラスタリングのために K 平均法と GMM の結果を統合し、Aidos ら [63] はそれぞれ異なる K 値を持つ 200 回の K 平均法実行のアンサンブルを構築しました。

順列分布クラスタリング

        このアルゴリズムは、順列分布の違いを分析して時系列間の類似性を見つけることによって時系列をクラスター化するように特別に設計されています。これは、時系列埋め込み内のさまざまな連続パターンの頻度をカウントすることで実現されます [64]。

深層学習に基づくクラスタリング

        深層学習に基づくクラスタリング アルゴリズムは最近大きな注目を集めており、多くのタスクにおいて従来の機械学習アルゴリズムよりも優れたパフォーマンスを達成しています [65]。従来のクラスタリング アルゴリズムに対するこれらのアルゴリズムの主な利点は、従来の特徴量エンジニアリングのステップをスキップし、クラスタリングに最適な特徴セットを自動的に学習できることです。深層学習ベースのクラスタリング手法は、そのアーキテクチャに応じて 3 つのカテゴリに分類されます [65]: (1) オートエンコーダ、(2) フィードフォワード ネットワーク、および (3) 深層生成モデル。カテゴリごとに、ECG クラスタリングの最近の進歩を紹介し、ECG クラスタリングのパフォーマンスのさらなる向上を約束する最先端のアルゴリズムを紹介します。

ディープオートエンコーダー

        オートエンコーダーは、入力データを低次元の特徴ベクトルに変換するニューラル ネットワークであるエンコーダーと、その後にこの低次元の特徴ベクトル ネットワークから元の入力を再構築するニューラル ネットワークであるデコーダーで構成されます。エンコーダとデコーダは、再構成損失、つまり元の入力とデコードされた出力の差を最小限に抑えるために同時にトレーニングされます。ディープ クラスタリング ネットワーク [13] とディープ エンベディング ネットワーク [14] は、ECG 分析 [66]–[68] に使用されている 2 つの一般的なオートエンコーダベースのクラスタリング アルゴリズムです。これらのアルゴリズムの背後にある考え方は、ネットワークのトレーニング時に再構築損失に加えてクラスタリング損失を導入することです。ディープ クラスタリング ネットワークでは K 平均損失が導入され、ディープ エンベディング ネットワークでは、データのローカル構造を保存し、表現の関連性をチェックするために、局所性とグループ スパース性の保存という 2 つの制約が導入されます。これらのアルゴリズムのいくつかの応用については、セクション III-A でさらに詳しく説明します。

ディープフィードフォワードネットワーク

        このグループのアルゴリズムでは、ディープ ネットワークをトレーニングするときにのみクラスタリング損失が発生します。ネットワーク アーキテクチャは、完全接続、畳み込み、または両方の組み合わせにすることができます。ネットワークの重みは、ランダムに初期化することも、事前学習済みネットワーク上で制限付きボルツマン マシンを使用して微調整することもできます [69]。Deep Adaptive Clustering (DAC) [70] は、一般的なディープ フィードフォワード クラスタリング ネットワークです。これは、バイナリ ペアワイズ分類法でトレーニングされた単層畳み込みニューラル ネットワーク (CNN) です。簡単に説明すると、まず CNN を使用して入力サンプルをワンホット エンコードされたベクトルにマッピングします。次に、サンプルのすべてのペア間のコサイン距離を計算します。グラウンド トゥルースの類似性は不明であるため、適応学習アルゴリズム、つまり適応潜在変数学習 [71] を使用して、推定された類似性に基づいて CNN の重みをトレーニングします。DAC はもともと画像クラスタリング用に提案され、いくつかの困難な画像データセットで優れたパフォーマンスを達成しました。CNN アーキテクチャにいくつかの変更を加えることで、将来の可能性として DAC を ECG 分析に使用することもできます。

深い生成モデル

        変分オートエンコーダ (VAE) [72] と敵対的生成ネットワーク (GAN) [15] は、近年最も人気のあるディープ生成モデルです。VAE は、オートエンコーダーによって学習された潜在表現が、事前に定義された分布 (通常はガウス分布の混合) に従うことを強制します。VAE ベースのクラスタリング アルゴリズムである変分深度埋め込み (VDE) は、ECG 分析に使用されています [74]。このアルゴリズムは、特徴空間が自動的に学習される、従来の GMM クラスタリング アルゴリズムの深層学習バージョンとみなすことができます。

        Generative Adversarial Networks (GAN) は、本物のデータに基づいて偽のデータのセットを生成し、偽のデータの配布が本物のデータと同様になるようにすることを目的としています。つまり、GAN は 2 つのサブモジュールで構成されます。(1) 偽のデータを生成するために使用される Generator、および (2) Generator によって生成された偽のデータを本物のデータから区別するために使用される Discriminator。生成器と弁別器の間のミニマックス ゲームがナッシュ均衡に達するような G と D のパラメーターのセットを学習します。

        CatGAN [75] は、GAN に基づく一般的なクラスタリング アルゴリズムです。これにより、ディスクリミネーターはトレーニング データを (単なる偽のデータと実際のデータではなく) 事前に定義された数のクラスに分類する必要が生じますが、ジェネレーターによって生成されたサンプルの分類には自信がありません。CatGAN のバリアントである ClusterGAN は、最近、他の多くの深層学習ベースのクラスタリング アルゴリズムの中でも優れたパフォーマンスを実証し、さまざまなクラスタリング タスクで優れたパフォーマンスを発揮します [76]。これらのアルゴリズムは ECG 解析には適用されていないため、ECG 解析への応用は将来の研究の方向性となる可能性があります。

        クラスタリングに加えて、深層生成ベースのアルゴリズムは、取得したクラスターから新しいサンプルを生成する方法を学習することもできます。最近、いくつかの研究では、教師付き ECG 異常分類における永続的なデータの不均衡問題の 1 つに対処するために、GAN を使用して新しい心拍データを生成しています [18]、[19]。セクション III-E では、これらの方法の応用について説明します。

心電図解析におけるクラスタリングアルゴリズムの比較

        表 I は、さまざまな ECG クラスタリング アルゴリズムの比較を示しています。クラスタリング アルゴリズムがノイズや外れ値に対処できるかどうかは、ECG クラスタリングにおいて重要な要素です。これは、公開されているほとんどの ECG データセットには外れ値が存在し、クラスタリング結果の構造に悪影響を与える可能性があるためです。

        クラスタリング アルゴリズムの時間計算量も重要な要素です。ECG のリアルタイム分析が必要なアプリケーション (集中治療室環境など) では、高品質のクラスターが生成される可能性は高くても、計算コストのかかるクラスタリング アルゴリズムは実行可能な選択肢ではない可能性があります。K 平均法、ファジィ C 平均法、最大最小アルゴリズムは計算コストが低くなりますが、外れ値を処理する能力は、DBSCAN、GMM、階層クラスタリング、スペクトル クラスタリング、深層学習ベースなどの計算コストが高いアルゴリズムよりも劣ります。クラスタリング。これらのアルゴリズムの中で、DBSCAN は計算コストが最も低くなりますが、ハイパーパラメータ (近傍半径と近傍内の最小点数) の選択に影響を受けます。さらに、DBSCAN は、データ空間の固有の密度が不均一な場合には適用できません。

        効率的な ECG クラスタリング アルゴリズムを選択する場合、任意の形状 (つまり、非凸形状) のクラスターを見つけて高次元の特徴空間を処理することも重要な要素です。K 平均法などの距離ベースのクラスタリング アルゴリズムは、ほとんどの場合、凸形状のクラスターを見つけることができますが、ECG データセット内のクラスターは任意の形状をとる可能性があります。密度ベースおよび深層学習ベースのクラスタリング アルゴリズムは、非凸形状のクラスターを効率的に見つけることができますが、距離ベースのクラスタリング アルゴリズムよりも計算コストが高くなります。

        通常、多くの特徴が ECG から抽出され、トレーニング ECG サンプルの数が制限されているため、ECG 分析の特徴空間は通常高次元になります。グラフベースおよび深層学習ベースのクラスタリング アルゴリズムでは、通常、高い計算コストがかかります。特に、深層学習ベースのアルゴリズムは、従来のアルゴリズムよりも高次元データの処理に効果的ですが、深層学習手法ではトレーニングに大量のデータが必要です。

        上記の考慮事項に加えて、一部のクラスタリング アルゴリズムは、視覚化のための独自の機能を提供します。たとえば、階層クラスタリングはクラスター間の階層関係を視覚化する樹状図を提供し、自己組織化マップはデータセット内の特定のトポロジを視覚化する 2 次元グリッドを提供します。クラスタリング アルゴリズムとその長所と短所の詳細については、[47]、[65]、[77] を参照してください。

応用分野

        これまで、図 1 に示すように、教師なし ECG 解析研究を 6 つのアプリケーション領域に分類してきました。最も成熟したアプリケーションは心拍クラスタリングです。これは、大量の ECG データ内の心拍を簡潔で理解しやすい構成にします。最近の革新的な研究の方向性は、心臓血管系と体全体および精神全体との関係を探ることにあります。教師なし ECG 分析は、教師あり異常検出および ECG ベースの認証システムのパフォーマンスを向上させるためにも使用されています。

 ハートビートクラスタリング

        心拍クラスタリングの有効性は通常、心臓専門医のラベルが付いた ECG データセットで測定されます。結果として得られる各クラスターには、1 つのラベルに属するハートビートのみが含まれることが期待されます。分類メトリクス (精度や感度など) と類似性メトリクス (Jaccard 係数や正規化された相互情報量など) は、成功メトリクスとして広く使用されています。Jaccard 係数と正規化された相互情報量の値は 0 から 1 の範囲であり、値が大きいほど、識別されたクラスターが真のラベルとよく一致することを示します。シルエット スコアは、真のクラスターを必要としない、広く使用されているもう 1 つの尺度です。シルエット スコアは、サンプルが他のクラスターとどの程度類似しているかを測定し、範囲は -1 から 1 で、値が高いほどサンプルがそのクラスターによく一致し、他のクラスターから分離されていることを示します。

        ECG クラスタリング手法の評価に使用されるデータセットには、MIT-BIH 不整脈データセット、Physikalisch-Technische Bundesanstalt (PTB) データセット、サンクトペテルブルク心臓技術研究所 12 誘導不整脈 (CTAD) データセット、UCR 不整脈データセット、および BIDMC うっ血性心不全データセットが含まれます。中でも、MIT-BIH 不整脈データセットは、最も一般的に使用されるデータセットの 1 つです。

        多くの研究の中で、Lagerholm らは、ウェーブレット係数で表される QRS 群を 25 のクラスターに分類する効率的な心拍クラスタリング システムを設計し、自己組織化マップを使用して高精度 (98.5%) の結果を得ました。自己組織化マップを使用することで、データセット内の特定の位相情報を保存する近傍マップ (2D グリッドなど) が提供され、最終的には心臓専門医による解釈が容易になります。

        アリのコロニークラスタリング、ミツバチの群れクラスタリング、最大マージンクラスタリング、ガウス混合モデル、階層的クラスタリング、K 平均法、親クラスタリング、伝播などのさまざまなクラスタリングおよび最適化手法を採用することで、ECG クラスタリングの精度を向上させることに多くの研究が焦点を当てています。ディープオートエンコーダーネットワーク。これらのアルゴリズムの中で、Balouchestani と Krishnan によって提案されたクラスタリング システムは、MIT-BIH データセットで最高の精度 (99.98%) を達成しました。彼らは、K 平均法、圧縮センシング理論、K 特異値分解に基づく方法を使用して、心拍を 5 つのグループ (正常、上部心室異所性、心室異所性、融合、および分類不能) に分類しました。

        これらの深層学習研究の有望な結果にもかかわらず、前処理アルゴリズムや専門家による分析を必要とせずに不均衡なデータの問題を自動的に処理できる、より高度なクラスタリング アルゴリズムが依然として必要とされています。この点に関して、ClusterGAN などの深い生成モデルに基づくアルゴリズムをさらに調査することができ、少数のクラスターから新しいサンプルを生成する方法を学習できます。今後の研究では、Zheng らが収集したデータセットや Wagner らが収集したデータセットなど、大規模な公開 ECG データセットに深層学習ベースのクラスタリング アルゴリズムを適用することにも焦点を当てる必要があります。

        臨床的な観点から見ると、いくつかの研究では、記号化を使用した革新的な ECG クラスタリングが実行されています。彼らは、最大-最小クラスタリング アルゴリズムを使用して心拍をクラスタリングし、識別された各クラスターにシンボルを割り当てることにより、ECG 信号をシンボルの文字列に変換しました。記号表現の下で、不規則な活動を表すエントロピー増大のサブシーケンスを検索します。彼らの方法は、心臓専門医が見落としていた心房の異所性リズムシーケンスを検出することに成功した。同様に、研究をリスク階層化に拡張し、急性冠症候群の治療後90日以内に同様の治療を受けたにもかかわらず死亡リスクが高い患者を特定することに成功した。心臓の臨床モニタリングの観点から見ると、12 誘導 ECG は、患者の体の 10 個の異なる位置に電極を取り付けて電気活動を記録する標準的な臨床プロトコルです。12 誘導 ECG から特徴を取得するには、通常、各誘導から抽出された特徴が連結されます。ただし、この表現では通常、12 個の信号の相対位置を保存できません。この問題に対処するために、He らはテンソル分解手法を使用しました。彼らは、各誘導を通じて記録された ECG をウェーブレット係数 W ∈ RV × L として表現しました。ここで、V と L はそれぞれ誘導の数とウェーブレット係数を示します。次に、テンソル化によって、W は W' ∈ RI1×I2×I3 に分解されます。ここで、I1、I2、I3 はそれぞれ記録された信号、サンプリング時間、ウェーブレット周波数サブバンドを表します。彼らは、混合ガウス モデルを使用して、12 誘導 ECG のテンソル表現を、正常な ECG と異常な ECG に対応する 2 つのクラスターに分離しました。彼らのシステムは、2 つの 30 分間の 12 誘導 ECG 記録で構成される CTAD データセットのサブセットで、0.93 という高い Jaccard 係数を達成しました。

 心電図と精神状態

        精神状態、気分、精神障害は、多くの場合、自律神経系 (ANS) に関連しています。自律神経系と心臓の間には、心臓の洞房結節 (SA 結節) を介した双方向の相互作用があります [8]、[115]、[116]。心臓のペースメーカーとしても知られる洞房結節は、心筋を刺激して収縮させて血液を送り出す電気インパルスを生成します[32]。近年、ECG クラスタリングは、精神生理学などの分野の研究者が、さまざまな精神状態に関連する隠れた ECG パターンを発見するのに役立ちました。

        これらの研究で使用されるデータセットは通常、さまざまな感情状態にある健康な個人、または精神障害のある患者から得られた心電図 (ECG) 信号とインピーダンス心電図 (ICG) 信号で構成されます。特徴エンジニアリング段階は、抽出された一連の ECG 特徴とインピーダンス心電図特徴の組み合わせに依存します。ここでは、結果として得られるクラスターの品質を評価する代わりに、各クラスターの ECG (およびインピーダンス心電図) の特徴と個人の精神状態との相関関係を測定するために、t 検定などの統計的仮説検定が実行されることがよくあります。あのクラスターの中で。さまざまな精神状態をグラウンド トゥルース ク​​ラスターとして扱い、アンケートを通じて手動で特定するか、脳波 (EEG) 信号をクラスター化することで自動的に特定します。したがって、NMI [105] や Jaccard 係数 [104] など、識別されたクラスターとグラウンド トゥルース ラベル間の類似性を測定するメトリクスを使用して、これらの研究の信頼性を向上させることができます。
        このセクションでは、この研究方向における新しい研究をレビューします。検討した研究の概要を表 3 に詳しく示します。レビューされた研究では、さまざまな心理状態についてさまざまなプライベート データセットが使用されていたため、これらのクラスタリング手法は相互に比較されませんでした。ただし、使用されているクラスタリング アルゴリズム、特徴量エンジニアリング、実験プロトコルの観点から既存の研究を批判的にレビューし、将来の研究の方向性を示します。

        最近、Hoemann ら [98] は、心肺活動と感情の繊細さの関連性を調査するために、67 人の参加者から取得した毎日の心電図 (ECG) およびインピーダンス心電図 (ICG) 信号をクラスター化しました。感情の粒度は、感情を正確に区別する個人の能力を表します。感情の粒度の低下は、統合失調症、自閉症、うつ病などの精神疾患と関連している[98]。Hoemann らは、ディリクレ過程ガウス混合モデルを使用して、データ内の最適なクラスター数を見つけました。彼らは、ECG と ICG を使用して、さまざまなレベルの感情的なニュアンスを識別できることを発見しました。

        Leal et al. [8] は、発作を予測し、患者が発作に備えるのに十分な時間を確保できるようにするために、ECG クラスタリングによっててんかん患者の ECG 時間間隔特性と前てんかん間隔 (つまり、発作前の短い時間) との関係を研究しました。発作、切迫てんかん。彼らは、てんかん患者の ECG から抽出された時間間隔に対して K 平均法、DBSCAN、混合ガウス モデルのクラスタリングを実行し、てんかん前間隔を表す他のクラスターから明確に分離されたクラスターがあるかどうかを確認しました。研究者らは、このようなクラスターが発作の 41% に存在し、発作の 2 ~ 9 分前の間隔に存在することを発見しました。Babaeian と Mozumdar [9] は、ウェアラブル デバイスによって収集された ECG をクラスタリングすることによってドライバーの眠気を検出するシステムを提案しました。彼らは、時間間隔特徴の密度ベースのクラスタリングを実行し、覚醒、眠気、睡眠状態に関連する 3 つのクラスターを発見しました。

        Carreiras ら [86] は、ECG クラスタリングによって困難な数学的問題を解決しながら、個人の注意力の低下を検出することを目的としていました。注意欠陥を検出することは、注意力の欠如が悲惨な結果をもたらす可能性がある、手術や運転などの注意を必要とする作業において重要です。彼らの研究は、ヘッドセットを介して EEG を取得するよりも、ウェアラブル デバイスを介して ECG を取得する方が便利であるという事実に触発されました。彼らは、24 人の被験者からの数学の問題を解く際に取得した ECG および EEG 信号のコンセンサス クラスタリングを実行しました。これには、異なる距離測定を使用した階層アルゴリズムの複数回の実行が含まれます。彼らの結果は、ECG データセットで見つかったクラスターと EEG データセットで見つかったクラスターの間に強い相関関係があることを示し、ECG がさまざまな注意レベルの検出に役立つことを示唆しています。別の発見では、ECG クラスターの数が EEG データセットで見つかったものよりも多く、詳細な分析のためのより正確な情報が得られる可能性があることが示されました。同様に、Wang et al. [117] は、ドライバーの手のひらから得られた ECG を分析することによって得られたクラスターと、EEG を分析することによって得られたクラスターの間に強い相関関係があることを示しました。彼らは、EEGではなくドライバーの手のひらから収集されたECGを使用して、ドライバーの注意力のさまざまなレベルを識別できる可能性があることを示唆しています。

        ECG クラスタリングのもう 1 つのアプリケーションは感情検出です。その目標は、クラスタリングを通じて喜びや悲しみなどのさまざまな感情状態を自動的に識別することです。Wan-Hui et al. [118] は、ECG 信号の周波数領域の特徴の方が、時間領域の特徴よりも喜びと悲しみを区別できることを発見しました。Zheng et al. [95]は、ファジー C 平均法クラスタリング アルゴリズムを使用して、ECG を感情的ストレスと非感情的ストレスの 2 つのクラスターに分類し、これら 2 つのクラスターを区別する際の時間間隔特徴の重要な役割を示しました。Medina [119] は、数学の問題を解く際に 25 人の被験者から得られた ECG に対して、K 平均法とスペクトル クラスタリングを含むアンサンブル クラスタリングを実行しました。彼らのシステムは、同様のレベルの感情を持つ被験者をうまくグループ化しました。

        革新的な研究で、Kupperら[6]は、数学の問題を解いたり、2人の聴衆の前でプレゼンテーションをしたりするなど、ストレスの多い活動をしている744人の若者を対象に、感情的ストレスと心肺活動との関係を調査しました。彼らは、参加者からタスク前およびタスク内の ECG および ICG 信号を取得しました。彼らは、分散クラスタリングを使用して、自律神経バランスと安静時最高血圧レベルが異なる参加者の 5 つのクラスターを発見しました。この結果は、喫煙、定期的な身体活動、肥満指数 (BMI) がこれらのクラスターと関連していないことも示しました。さらに、男性は、ストレスの多い作業を行うときに、収縮期血圧が上昇し、心拍出量が増加するクラスターに属する可能性が高くなりました。
        Gonzalez-Vel´azquez ら [120] は、クラスタリングによって感情的な食事行動と ECG の関係を研究しました。彼らは、52 人の若者の ECG に対して K 平均法クラスタリング (K=2) を実行し、個人を感情的な食事行動のあるグループとないグループに 2 つに分けました。彼らは、感情的な食事行動は太りすぎの人(BMI > 85パーセンタイル)でより一般的であることを発見しました。さらに、高周波成分は肥満者の RR 時系列で有意に大きかった。 

        ディープラーニング技術の成功に触発されて、Oskooei ら [99] は最近、100 人の消防士訓練生の RR 時系列で畳み込みオートエンコーダーを訓練し、訓練実施中に重大なストレスにさらされているグループを特定しました。彼らは、オートエンコーダーによって学習された潜在表現に DBSCAN を適用し、2 つのクラスターを発見しました。小さいクラスターは、著しく大きなストレスを示した消防士に対応します。彼らはさらに、このタスクでは K 平均法を適用してもストレスにさらされている訓練生のグループを見つけることができないことを示しています。

        さまざまな統計的仮説検定を使用して、ECG 特性とさまざまな心理状態の間の重要な関係を推測できます。レビューされた研究のほとんどは、正規母集団分布を仮定する t 検定を使用しました。ただし、収集されたデータセットが小さく、この分布に適合しない可能性があるため、この仮定にはさらなる検証が必要です。フリードマンの検定 [121] やスピアマンの順位相関 [122] などのノンパラメトリック検定は、正規性の仮定に依存しないため、このアプリケーションでさらに調査できます。

        さらに、ほとんどの研究における ECG 特徴エンジニアリング段階は、RR 間隔と心拍数に限定されています。したがって、PRおよびQT間隔、電圧および周波数領域の特徴などの他のECG特徴と、さまざまな心理状態との間の関係を調査するという満たされていないニーズが存在します。さらに、使用されるクラスタリング アルゴリズムは、従来の K 平均法、階層的クラスタリング、混合ガウス モデル、および DBSCAN に限定されています。特に、深層学習ベースのクラスタリング アルゴリズムは、この目的には使用されていません。ECG とさまざまな心理状態の関係を発見するための信頼できる深層学習アルゴリズムを開発およびトレーニングするには、より大規模なデータセットが必要です。

        最後に、前述したように、ほとんどの研究では、さまざまな感情やさまざまな程度の心理的障害などのさまざまな精神状態を、グラウンド トゥルースのクラスターとして扱います。これらのクラスターの数は、使用されるほとんどのクラスター化アルゴリズムで事前の知識が必要です。ただし、いくつかの研究では、DP-GMM [52] や DBSCAN [53] など、そのような事前知識を必要としないアルゴリズムが使用されています。彼らは、グラウンド トゥルースが示唆するよりも多くの ECG クラスターを取得します。一般に、クラスターの数が増加すると、異なる ECG モダリティ間の分離が向上しますが、専門家がクラスター化の結果を解釈することが困難になる可能性があります。今後の作業は、ECG クラスターの最適な数を見つけることに重点を置く必要があります。

心電図と身体状態

        この研究方向の焦点は、ECG異常、血圧状態、代謝指標、人口統計などを含むクラスタリングを通じてさまざまな臨床表現型を発見し、さまざまな疾患を持つ患者間の違いを研究することです。いくつかの研究は、同様の心電図パターンを持つ患者のサブグループにおける根底にあるメカニズムと顕著なバイオマーカーを明らかにすることを目的としていますが、視覚的な手段でそれを行うことはほぼ不可能です。

        これらの研究で使用されるデータセットには、さまざまな病状 (糖尿病、動脈硬化、塞栓性脳卒中など) や慢性的な習慣 (喫煙など) を持つ個人からの ECG および血圧信号が含まれることがよくあります。ECG をクラスター化した後、各クラスター内の主要な ECG パターンを決定します。次に仮説検定が実行され、このパターンがクラスターによって表される疾患 (または疾患の重症度レベル) に関連しているかどうかが確認されます。このようなアプリケーションではグラウンド トゥルース ク​​ラスターが不明なことが多いため、シルエット係数など、クラスター内とクラスター外の類似性を測定するメトリクスを使用して、これらの分析の信頼性を向上させることができます。ここでは、この研究分野におけるいくつかの革新的な研究をレビューします。検討された研究の概要を表 IV に示します。

        Wangらは、脊髄損傷患者の起立性心血管調節不全の予測に対する心拍数と血圧の影響を研究した。彼らは、平らに横たわり、受動的に座位に戻った状態で、207 人の被験者 (対照 48 人) から得られた ECG 信号と血圧信号の階層的クラスタリングを実行しました。最良のシルエット係数を使用したクラスタリング結果により、被験者は 8 つのグループに分割されました。彼らは、心拍数、収縮期血圧および拡張期血圧が、SCI集団における心血管調節不全の有病率を特定するのに有効であることを発見した。

        Tsengらは、ECG、糖尿病、肥満、高血圧、喫煙習慣の関係を研究した。彼らは、PTB データセット内の 268 人の被験者からの ECG を使用して、時間間隔の特徴に対して K 平均法クラスタリングを実行し、患者を 8 つのグループに分類しました。その結果、ほぼすべての糖尿病患者が同じグループに割り当てられ、糖尿病と心電図との間に強い関連があることが示唆されました。ただし、喫煙、高血圧、肥満の患者はすべてのクラスターに分布しており、これらの症状と ECG の時間間隔特性との間の相関が弱いことを示しています。

        Hernandezらは、心電図と身体活動能力の関係を研究した。彼らは、67 人の男性被験者から安静時、サイクリング時、回復状態の心電図を取得しました。心電図の取得中に、ウェアラブル体組成計は腹腔内に蓄積された脂肪の量を記録しました。彼らは、時間間隔とウェーブレット抽出された特徴に階層的クラスタリングを適用し、樹状図を分析することでデータ空間を適切に分離する 4 つのクラスター ソリューションを発見しました。次に、K 平均法 (K=4) を適用して、次の 4 つのグループを見つけました: (1) 身体的労働能力が高い個人、(2) 身体的労働能力が低い若い個人、(3) 高齢者、身体的労働能力が低い個人(4) 身体的作業能力が低く、腹部脂肪が多い高齢者。

        Lattanziらは、原因不明の塞栓性脳卒中患者127人を対象に、ECG異常、人口動態、代謝マーカー、喫煙習慣との関連を研究した。心房細動や高血圧など、心臓専門医によって特定された心臓の異常がクラスタリングに使用されました。彼らは階層的クラスタリングを実行し、患者の 3 つのサブグループを発見しました: (1) 卵円孔開存症および後部循環梗塞を有する若い男性、(2) 高血圧、大脳卒中、左心房性心疾患、糖尿病および複数の血管領域病変を有する男性、(3) )脂質異常症、同側の脆弱性頸動脈狭窄プラーク、および前方循環野梗塞を有する喫煙患者。

        Hyunらは、ECGと血圧およびアテローム性動脈硬化症との関連を研究した。彼らは、コンセンサス クラスタリング手法を適用して、989 人の患者から得られたホルター信号と血圧信号をクラスタリングしました。彼らは 16 個のクラスターを発見し、そのうち 2 個にはアテローム性動脈硬化のリスクが高い患者がかなりの割合で含まれていました。糖尿病、BMI、総コレステロールなどの代謝指標は、両方のクラスターで有意に高かった。特に、年齢は一般にすべてのクラスターに関連しています。

        Porumbらは、血糖値の低下を予測するために、夜間低血糖症(睡眠中の血糖値低下)の被験者から得たECGに対して畳み込みオートエンコーダーを学習させた。彼らは、t 分布確率的最近傍埋め込み法を使用して、学習した潜在表現をクラスタリングして視覚化し、オートエンコーダーが低血糖値時に記録された ECG と正常血糖値時に記録された ECG を効果的に分離したことを示しました。彼らは潜在表現を畳み込みニューラル ネットワークへの入力として取得し、ECG を正常血糖値と低血糖値に分類するために専門家が提供したラベルに基づいてネットワークをトレーニングしました。彼らの研究は、夜間低血糖を経験した8人の被験者において90パーセントの精度を達成しました。

         この研究分野では、階層的クラスタリング アルゴリズムが広く使用されています。このアルゴリズムは初期クラスターの数を必要とせず、結果として得られるクラスターを階層的に視覚化します。この視覚化は、研究者が各部分集団内の根底にあるメカニズムとバイオマーカーを特定するのに非常に役立ちます。自己組織化マップ [54] と t 分布確率的近傍埋め込み [125] は、データ空間内のトポロジーを視覚化するための 2D および 3D マップを提供する他のよく知られたアルゴリズムです。これら 2 つのアルゴリズムはデータのローカル構造とグローバル構造を保存するため、このアプリケーションの適切な候補となります。

        さらに、レビューされた研究で使用されたクラスタリング アルゴリズムは、K 平均法と階層的クラスタリングに限定されていました。これらの研究によって収集されたデータセットは、公的に利用可能なデータセット (MIT-BIH など) よりも大幅に大きいため、深層学習ベースのクラスタリング アルゴリズムを適用すると、結果をさらに向上させることができます。

        最後に、ECG と精神状態の関係を調査する研究と同様に、抽出された ECG 特徴も RR 間隔と心拍数に限定されていました。したがって、他の時間領域、電圧領域、周波数領域の機能を研究して適用する必要があります。

ECG ベースの生体認証と識別

        生体認証は、主に指紋や顔などの個人の生理的特徴に基づいて本人確認を行うプロセスです。指紋や顔の模様は、物理的特徴が露出しやすいため、外部からの攻撃に対して脆弱です。ただし、心臓の電気活動の基本的な生体認証が隠蔽されているため、ECG ベースの認証システムはなりすましが困難です。

        ECG ベースの認証システムの課題の 1 つは、個人内のばらつきです。これは、さまざまな個人の身体的および精神的状態の違いに起因し、認証の失敗につながる可能性があります。いくつかの研究は、クラスター分析を通じて個人内変動に対する ECG ベースの認証システムの堅牢性を向上させることを目的としています。このアイデアは、個人の ECG (または心拍) を、さまざまな精神状態または生理学的状態にある個人など、さまざまな条件下のクラスターに分割し、クラスターの中心などのクラスターに関する情報を、パフォーマンスを実行するための教師あり学習方法として使用することです。認証の追加機能。このアプリの研究のほとんどは、さまざまなレベルの感情またはストレスで記録された ECG データセットを使用しました。結果として得られるクラスターの品質を評価する代わりに、感度、特異度、F1 スコアなどの分類メトリックを使用して、下流の監視付き認証タスクのパフォーマンスを評価します。このアプリケーションではグラウンド トゥルース ク​​ラスターがほとんど利用できないため、シルエット スコアなどのクラスター間およびクラスター内の類似性を評価するメトリクスをさらに使用して、これらの研究の信頼性を向上させることができます。

        最新の研究の例として、Zhou ら [23] はガウス混合モデル クラスタリングを使用して、エージェントのストレス下での認証システムの堅牢性を向上させました。特に、被験者の心電図をストレスのレベルが異なるいくつかのグループに分けました。これらのクラスターの中心は、畳み込みオートエンコーダーによって学習された ECG の潜在表現と組み合わされて、認証を実行するサポート ベクター マシンに入力特徴ベクトルとして提供されます。彼らは、23 人の健康な被験者を対象にさまざまなストレス条件下でシステムをテストし、平均認識率 95%、平均 F1 スコア 0.97 を達成しました。

        認証と同様に、バイオメトリック識別は、事前に識別されたテンプレートのデータベースに対するバイオメトリック特性に基づいて個人を識別するプロセスです。ECG ベースの認識システムでは、一致を見つけるために特定の ECG とデータベースに保存されているすべてのテンプレート ECG を相互照合する必要があるため、通常、高い計算コストがかかります。クラスタリングは、テンプレート ECG をクラスタリングすることにより、このようなシステムの計算コストを削減するのに役立ちます。識別中に、特定の ECG 信号に最も類似したクラスターの中心のみが検索されます。Neehal et al. [126] は、K 平均法を使用して、50000 ECG データベース内のテンプレートを 5 つのクラスターに分割しました。認識中に最も類似したクラスターのみを検索することで、認識時間を 79.26% 短縮しました。同様のアプローチの下で、Sufi et al. [127] は、圧縮された ECG データに基づく認識システムを提案しました。ワイヤレス心臓血管モニタリングでは、圧縮された ECG データが必要になることがよくあります。ただし、何百万もの圧縮された ECG 信号を解凍するには時間がかかります。この問題に対処するために、Sufi らは、テンプレート ECG データベースから圧縮された ECG 信号を直接クラスター化するガウス混合モデルに基づくシステムを設計しました。

        これらの研究で使用されるクラスタリング アルゴリズムは、主に K 平均法と GMM によって制限されます。したがって、DBSCAN [53] や深層学習ベースの方法など、ECG クラスタリングのための他のクラスタリング アルゴリズムについてさらなる研究が必要です。ECG ベースの識別システムのデータセットは非常に小さい (n < 30) ため、個人内変動に対する堅牢性をさらに高めるには、さまざまなレベルの感情またはストレスで記録された ECG のより大規模なデータセットが必要です。ECG と他の生理学的信号の同期を検出できるクラスタリング アルゴリズムを開発するための研究も必要です [128]。

監視付き異常分類の改善

        知識の発見に加えて、クラスタリングと深層学習ベースの教師なし技術も、ECG 分類システムのパフォーマンスを向上させ、課題を克服するために使用できます。このアプリケーションでは、識別されたクラスターの品質が評価されることはほとんどありません。代わりに、感度、特異度、F1 スコアなどの分類メトリックが、下流の分類タスクのパフォーマンスを評価するためによく使用されます。ただし、グラウンド トゥルース ク​​ラスターは既知であるため、前述の分類メトリックと、NMI や Jaccard 係数などの類似性メトリックを使用して、クラスタリング段階のパフォーマンスを評価し、これらの研究の信頼性を向上させることができます。MIT-BIH データセットは、この研究分野で広く使用されています。このデータセットは比較的小さいため、今後の研究では、Zheng ら [112] や Wagner ら [113] によって収集されたデータセットなど、より大きなデータセットの使用にも焦点を当てる必要があります。

        ECG 異常を正確に分類する際の永続的な課題は、深刻なデータの不均衡の問題です。公開されている ECG データセットで心臓専門医によって提供されるラベルは、圧倒的に正常な心拍であるためです。たとえば、MIT-BIH データセットでは、ラベル付き心拍の 75% 以上が正常カテゴリに属しますが、ラベル付き心拍の 1% 未満が 4 つの異常カテゴリ (心室細動、結節逃避、心房性期外拍、心房性期外拍) に属します。そして心室脱出。この不均衡なデータは、少数クラスを検出する際の分類器のパフォーマンスの低下につながります。この問題を克服するためのよく知られた手法はアンダーサンプリングです。これは、トレーニング セットのバランスをとるために、多数派のクラスからサンプルがランダムに削除されるものです [129]。ただし、この手法では、分類タスクに重要な関連情報が失われる可能性があります。アンダーサンプリング中の情報損失を減らすために、Carrillo-Alarcón et al. [16] は、自己組織化マップを使用して MIT-BIH データセット内の多数クラスごとにハートビートをクラスター化しました。

        深層学習に基づく教師なし技術も、異常分類システムの自動化とパフォーマンスを強化するために使用されています。[131] は、貪欲な教師なしアルゴリズムを使用して各層の重みを初期化することにより、ディープ ニューラル ネットワーク分類器のパフォーマンスを向上させました。各隠れ層は、制限されたボルツマン マシン [69] として扱われ、エネルギー ベースの潜在モデルをトレーニングするためのよく知られた教師なしアルゴリズムであるコントラスト発散アルゴリズム [132] を使用して最適化されます。次に、グラウンド トゥルース ラベルと予測の間のクロスエントロピー損失を最小限に抑えることで、ネットワーク全体が微調整されます。彼らは、MIT-BIH データセットに対する 3 つの患者固有の実験と 1 つの患者に依存しない実験を使用して、その方法を評価しました。彼らのシステムは、MIT-BIH の 3 人の個人に対してそれぞれ 93.1%、94.7%、99.9% の精度を達成しました。患者に依存しない実験では、彼らのシステムは目に見えない患者に対しても良好な一般化を示しましたが、精度は 91.8% と低かったです。

        患者固有の ECG 分類子 (特定の患者の ECG でトレーニングおよび微調整された分類子) は、ECG の一般的なプールでトレーニングされた分類子と比較して優れたパフォーマンスを示しています。Zahi et al. [17] は、患者固有の正常な心拍に合わせて分類器を再調整することで、MIT-BIH での分類パフォーマンスを向上できることを示しました。患者固有の分類器はパフォーマンスは優れていますが、微調整のために ECG の一部に手動でラベルを付ける必要があるため、自動化のレベルは低くなります。この問題に対処するために、Zahi et al. [17] は、正常な ECG 心拍を自動的に識別する教師なしの方法を提案しました。彼らは、隣接する心拍との類似性に基づいて心拍をクラスター化し、クラスター内で最も高い平均類似性を示した心拍を正常なものとして特定しました。次に、特定された正常な心拍に基づいて深層分類器を微調整しました。彼らのシステムは、心室性と上室性の異所性心拍という 2 つの異常カテゴリの検出に優れており、それぞれ 97.4 パーセントと 98.6 パーセントという高い精度を達成しました。

        近年では、敵対的生成ネットワーク (GAN) [15] も、患者固有の分類器の自動化を改善するために使用されています。このアイデアは、GAN のジェネレーターを利用して、新しい患者固有の正常な心拍を生成することです。Zhou ら [18] は、心室および上室性の異所性心拍のより正確なトレーニングと分類のために、GAN で生成された正常な心拍を使用して MIT-BIH データセットを強化し、全体の精度 97% を達成しました。同様に、Golany ら [19] は、各患者からのラベルのない ECG データの最初の数分間で GAN をトレーニングし、正常な心拍を生成しました。不整脈の分類に畳み込みニューラル ネットワークを使用した Zhou ら [18] とは対照的に、彼らは長期短期記憶ニューラル ネットワーク [133] を使用し、同様の良好なパフォーマンスを達成しました。

        深層学習ベースの教師なし特徴抽出技術も、手作りの特徴を使用する分類器と比較して、教師あり分類システムのパフォーマンスを向上させます。たとえば、Nurmaini et al. [68] は、教師なし特徴抽出技術として CNN ベースのディープ オートエンコーダを不整脈分類用のディープ ニューラル ネットワークと組み合わせました。彼らのシステムは、MIT-BIH データセット全体で 0.92 という高い F1 スコアを達成しました。

        教師なし学習と教師あり ECG 分類を組み合わせるもう 1 つの利点は、転移学習の使用です [134]。中心となるアイデアは、大規模なデータセットでトレーニングされたモデルのパラメーターを、不正確なラベルが含まれているか、一部のラベルが欠落している可能性がある、より小さなデータセットでの分類のために別のモデルに転送することです。Weimann ら [135] は、Icential11K データセット [137] (11,000 人の患者を含む公的に利用可能な最大の ECG データセット) で深層残差ネットワーク分類器 [136] をトレーニングし、その後、Physionet/CinC 2017 で発表され、ネットワークを微調整しました。心房細動検出用のデータセット [138]。Jang et al. [139] は、200 万を超える ECG サンプルで畳み込みオートエンコーダーを事前トレーニングしました。次に、10,000 個の 12 誘導 ECG を含む別のデータセットでネットワークを微調整して、11 の不整脈カテゴリを検出し、F1 スコア 0.857 を達成しました。

その他の用途

        ここで説明したアプリケーションとは別に、ECG クラスタリングは他のいくつかの興味深いアプリケーションでも使用されています。Xia et al. [24] は、ECG クラスタリングを使用して QRS 検出システムの精度を向上させました。中心的な考え方は、ECG において、相互に切り詰められた点のペア間の線の絶対的な傾きが、他の点のペア間で切り詰められた線の絶対的な傾きよりも大幅に高いということです。K 平均法により、ポイント ペア間の絶対的な傾きに基づいて、すべてのポイント ペアが 2 つのクラスターに分割されます。彼らは、クラスターには主に QRS 領域に属する点のペアが含まれていることを発見しました。これらの点のうち、振幅が最も大きい点を R ピークと決定しました。彼らは、MIT-BIH の 8 つの記録にわたる R ピーク検出で 99.72% の感度と 99.80% の陽性的中率を達成しました。同様の傾向に沿って、Chen ら [25] は、最近の研究で、各ポイントのペアの平均振幅とその傾きに階層的クラスタリングを適用し、ポイントを 2 つのクラスター (R 波クラスターと非R 波クラスター) に分割しました。 R波クラスター。彼らは、MIT-BIH での R ピーク検出において 99.89% の感度と 99.97% の陽性的中率を達成しました。
        Zhouら[26]は、クラスタリングによって腹部ECGから胎児QRS群を抽出した。特に、母親の腹部から得られた胎児の心電図は、母親の心臓の活動、胎児の脳の活動、子宮収縮などのさまざまなノイズによって汚染されています。Zhouらは、母親のECGにおけるRおよびSピークの振幅が胎児ECGのものよりも著しく大きいため、RSピークの振幅が母親のQRS群を胎児ECGから区別するための独特の特徴として機能する可能性があると示唆した。 。彼らは、ECG 内の隣接する極大値と極小値のペアに K 平均法を適用し、3 つのクラスターを発見しました。クラスターの 1 つは母体 RS ピークを含み、もう 1 つは胎児 RS ピークを含み、最後のクラスターは非 RS ピークを含みます。

        Salman ら [140] は、遠隔地の患者をさまざまな緊急度のグループに分類することで、平均待ち時間の短縮を試みました。彼らは、ECG 信号と血圧信号から抽出された特徴にファジー C 平均法を適用し、患者を 5 つのグループに分けました。特定されたクラスターは、正常、風邪、病気、緊急、および高リスク状態の患者に対応します。彼らは各クラスターをキューとして扱い、緊急患者を優先しながら平均待ち時間を最小限に抑えるアルゴリズムを提案しました。

議論と今後の方向性

深層学習に基づくクラスタリングと対照学習

        有望な ECG クラスタリング技術が研究されていますが、大量のデータを処理する際に、前処理ステップや専門家による分析を必要とせずに自動的にクラスタリングを実行できる、より高度なアルゴリズムが緊急に必要とされています。従来の機械学習手法に対する深層学習手法の主な利点は、自動的な特徴抽出と選択プロセスにあります。ディープラーニング技術は、音声認識や画像分類などの複雑なタスクにおいて、従来の機械学習方法よりも優れたパフォーマンスを発揮することがわかっています。ただし、教師なし ECG 分析に深層学習を使用することに焦点を当てた研究はほとんどありません。したがって、深層適応クラスタリング [70] や ClusterGAN [76] (セクション II-C で説明) などの新世代の深層学習アルゴリズムは、ECG クラスタリング システムに適用されることが期待されています。

        深層学習技術の欠点は、特徴がブラック ボックス内で抽出されるため、解釈可能性が欠如していることです。結果がどのように得られたかという関心が結果そのものと同じくらい重要であるため、これは ECG 解析においてますます重要な問題となっています。この分野の今後の研究は、ECG 分析における深層学習技術の解釈可能性の説明に焦点を当てる必要があります。DeepLIFT [141] と同様のアルゴリズムを調査できます。DeepLIFT は、入力が与えられると、予測された出力から入力の特徴に各ニューロンの活性化を逆伝播することによって、ニューラル ネットワーク内の各ニューロンに寄与スコアを割り当てます。

        深層学習に加えて、ECG クラスタリングに対する対照学習の適用をさらに調査できます。対照学習は、ラベル付きデータなしで、類似したデータ点が互いに近接している埋め込み空間を学習することを目的としています。最近では、視覚および言語処理タスクの解決において優れたパフォーマンスを示しています。ECG 分析では、心臓専門医がデータセットの小さなサブセットに注釈を付ける教師なし分析または半教師あり分析に使用できます。興味のある読者は、詳細について [142]、[143] を参照してください。     

ウェアラブル デバイスによって記録された心電図 (ECG) データの教師なし分析

        心電図 (ECG) データがウェアラブル デバイス内で分析される場合、クラスタリング方法の時間と空間の複雑さはデバイスの計算能力の範囲内である必要があります。また、ECG データがリモート サーバーに送信される場合、送信チャネルの信頼性と遅延が重要になります。したがって、ECG データを最適かつ安全に送信するには、効率的な圧縮および暗号化アルゴリズムが必要です。

        さらに、ウェアラブル デバイスで記録される心電図 (ECG) の品質は通常、標準的な臨床デバイスの品質よりも低いため、ノイズに対する堅牢性も非常に重要です。ノイズ除去システムの実際の実装は不完全であるため、ノイズ除去後でも信号にノイズがなくなるという保証はありません [148]。この場合、アーティファクト除去アルゴリズムを使用することが非常に重要です。

        レビューされた方法のほとんどは、心拍数が通常 1 分あたり 120 拍未満である安静状態の ECG で開発および検証されました。ただし、心拍数は、被験者の運動状態を長期間監視している間に大きく変化する可能性があります。したがって、心拍数の変化に対するこの方法の堅牢性も、もう 1 つの重要な考慮事項です。ウェアラブル デバイスを介して記録された ECG の分析は、研究対象がほとんどない新興分野であり、さらなる研究が必要です。興味のある読者は、詳細について次の情報源を参照してください: [144] – [147]、[150] – [152]。

フロー ECG クラスタリング

        毎日生成される心電図データの量は膨大ですが、ハードウェア リソースが限られているため、実際には保存できません。さらに、高リスク患者のリアルタイム監視と異常事象の即時検出が重要です。したがって、将来のクラスタリング システムは、継続的に到着する ECG データ、いわゆるデータ ストリームを処理する必要があります。

        ストリーミング ECG クラスタリングは、従来のクラスタリング システムにいくつかの重要な課題をもたらします。まず、到着する信号をすべて保存するのは現実的ではないため、ECG は 1 回のパスでのみ分析される必要があります。第 2 に、新しい ECG が到着すると、クラスタリングが変化する可能性があります。第三に、心臓イベントはリアルタイムで識別されなければなりません。このレビューでレビューされたすべての方法は非フロー ECG を扱っており、将来の研究の可能性が残されていることに注目する価値があります。興味のある読者は、データフロー クラスタリング分析 [153] ~ [157] の詳細について、次のソースを参照してください。

精神的および生理学的状態を記録した心電図の公開データベース

        これまでに、さまざまな心臓異常を表すオープン ECG データセットの開発に多大な努力が費やされてきました [1]、[112]、[113]。ただし、セクション III-B から III-D で説明されているように、研究では ECG とさまざまな心理的および生理学的状態との関係が発見されており、ECG ベースの認証システムの開発ではプライベート データセットが使用されます。これにより、メソッドを比較して結果を再現することができなくなります。これらの革新的な研究分野をさらに発展させるためには、さまざまな心理状態(ストレスや精神障害など)やさまざまな健康状態(糖尿病など)の下で記録された心電図を含むオープンな心電図データベースが必要です。このようなデータベースは十分に大きく、個人の性別と年齢に関してバランスがとれている必要があります。

P波、QRS波、T波に基づく特徴量エンジニアリング

        ほとんどの後ろ向き研究は、特徴エンジニアリングのために P 波と T 波を特定することを目的としていませんでしたが、これらの波の異常な形態は、心筋虚血、低カリウム血症、心房細動などの重要な心臓疾患を示す可能性があります [32]。さらに、R 波は一般に、記録されたすべての心拍に存在すると想定されています。ただし、右心疾患などの一部の異常な場合には、R 波が存在しない可能性があることに注意してください [32]。

        これらの問題に対処するために、研究者は、Martinez らによって開発されたシステム [158] や Bote らによって開発されたシステム [159] など、最先端の ECG セグメンテーション システムを採用できます。これらのシステムは、ECG 上の P、Q、R、S、および T 波を効率的に識別することができ、すべての主要な波形の時間的および形態学的特徴を抽出できます。

結論は

        この論文では、心電図 (ECG) 分析のための教師なし機械学習手法の包括的かつ批判的なレビューを提供します。従来の ECG クラスタリング アルゴリズムと最先端の ECG クラスタリング アルゴリズムをレビューし、その長所と短所について詳しく説明します。また、教師なし ECG 解析のさまざまなアプリケーションを幅広くレビューし、各アプリケーション分野の最近の研究について説明し、その限界を概説し、将来の方向性を提案します。

        私たちは、この論文でレビューしたクラスタリング手法が、教師なし生体医学信号処理の文脈における将来の ECG モニタリングにおいて引き続き重要な役割を果たし続けると信じています。

おすすめ

転載: blog.csdn.net/qq_25368751/article/details/132172735