DDTW派生動的時間ワープアルゴリズム

DDTW派生動的時間ワープアルゴリズム

著者:穀物

デリバティブの動的時間伸縮(DDTW)は、動的時間伸縮(DTW)に改善されています。生成された「特異点」の古典的なDTWアルゴリズム(特異点)問題を緩和、この記事では、次の側面DDTWのアルゴリズムを紹介します。

1、アルゴリズムの背景

時系列は、データ形式のほぼすべての科学的な規律の流行です。他の配列は、2つの時系列の類似性を比較するために比較されたと共通の処理タスクの時系列配列です。いくつかの地域では、非常に単純な距離メトリック(例えば、ユークリッド距離)で十分です。

image.png

しかし、ほとんどの場合、実質的に二つの配列同一形状が、これらの形状の全体的な組成は、X軸上に整列されていません。(図1)

類似性を見つける、または前処理ステップとして、事前にそれらを平均化するために、我々は(またはその両方)のシーケンスは、軸これらの配列間の「ねじれ」は、より良い比較を達成する必要があります。ダイナミックな時間伸縮(DTW)は、このような定期的を達成するための有効な手法です。

図Aに示すように、実線および点線は、二つの音声波形(観察するために開かれたy軸)の同じ単語「ペン」です。波形の形状は、それらが(非常に類似しているが、時間軸が整列していない、i番目の点の位置合わせに別の配列と配列のi番目の点は、「悲観的差異」を生成することが想定される全体として見ることができます悲観的な非類似度)。パネルBにおいて、DTWは、それらの距離の計算が正確であるように、ポイントを整列これら2つの波形によって見出すことができます。
image.png
(図1)
データマイニング(Keoghの&Pazzani 2000、李らに加えてこのように、DTW展示優れた能力、 。Al.1998、ベルント&クリフォード1994) アプリケーション、DTWさらに上のジェスチャー認識(Gavrila&デイビス1995)のために、ロボット(Gollmer&ポステン1995)及び製薬産業の製造技術(Schmillら1999)、音声処理(Rabiner&Juang 1993)、(Caianiらを。ら1998)。

2、古典的な動的時間伸縮アルゴリズム

:我々は、長さnおよびmのそれぞれ、2つの時系列QおよびCがあると
image.png
二つの配列を整列させるために、我々は、行列の要素(i、j)はn×mの行列のグリッドを構築するために必要とCJは、2人の気を表し距離d(チー、CJ)点(各点と各点Cとの間、すなわちQの配列類似性を、より小さな距離を類似度が高い。かかわらず、ここで、一次の)、ユークリッド距離は、一般的に使用されます。各行列要素(I、j)とCJアライメント点気を表します。このマトリクスでは、我々は2つの時系列、及びショーワーピング経路ワーピング経路(W)の間の距離を計算することができます。そこに我々は規制全体のパス(以下W式)の多くを得ることができるので、「ねじれ」モードの多くの異なる時間軸は、ですが、私たちの目標は、2つの系列間の時間を決定するために構造化最短経路を見つけることですので、 、類似度である「距離」、そしてどのようにそれはすぐにこのパスを見つけるには?私たちは、動的計画法(ダイナミックプログラミング)は、私たちにとって大きな利便性を提供できることを見出しました。
ダイナミックプログラミングアルゴリズムがこのグリッドを通る経路を見つけるために、格子点の数に起因することができ、格子は、整列点が計算された2つの配列を通る経路です。
image.png
=(i、j)は、2つの時系列のマッピングを定義wでのi番目の要素です。さらに、パスは一般的に、いくつかの制約によって構成されています。
1)境界条件:パスを定義する開始及び終了における対角要素のマトリックスで構成されなければならない;
2)連続性:このパスをワーピングするステップが斜めに隣接するセルを含む隣接セル()に限定されることを可能にします。
3)単調性:時間に単調Wポイントを強制します。

3つだけの方向の格子の各経路点は、連続かつ単調性制約を結合します。(I + 1、J):パスグリッド(i、j)を経過した場合、例えば、次の格子点を通って次の3つの条件のいずれかであってもよい 、(I、J + 1) 又は(I + 1、J + 1)。
image.png
以上により、我々はすべてのパスを比較することにより、上記の条件を満たすことができる構造化への最短経路を見つける構造が、DPは、私たちのために最短経路を計算するためのより良い方法を提供します。我々は最初の累積距離の累積距離γ、累積距離γを定義する(i、j)は現在のグリッド点距離d(i、j)、すなわち、ユークリッド距離点気とCJとのためには、ポイントの最小隣接する要素に到達することができそして累積距離:
image.png
動的なプログラミングアルゴリズム、我々は比較的容易最短距離を蓄積することができます。

3、動的プログラミング「特異点」問題

Yは、変数「ひねり」X軸を軸にDTWアルゴリズムの最も重要な特徴は、説明されているので、時系列アライメントの目的を達成するためです。時系列上の単一の点を別の時系列の一部にマッピングされるが、X軸は「直感的」(直感的に)引き起こす歪曲する変数の値によって単純なY軸は、整列されます。私たちは、「特異点」(特異点)として、この動作を見ることを期待していないと言います。
image.png

この特異点の問題を緩和するための一時的な方法をたくさん作った、これらの方法は基本的にある可能性を制限一つの共通点を持っている。「ツイスト。」しかし、欠点は、「右」を見つけない場合があり、それらが引き起こすということである「ねじれました。」
したがって、我々はこの問題を改善するためにデリバティブDTWを導入しました。

4、デリバティブの動的時間伸縮アルゴリズム

前述したように、DTWアルゴリズムは、図2に示すように、特異点の問題の微妙な変化原因容易変数Yが軸ように、X軸ワープ可変のY軸の値に応じて略(乱暴)です。我々は、形状(形状)を位置合わせするDTW機能よりも高いレベルを考慮することを選択して配列の最も正確な時間整合は、特徴(フィーチャの機能)との対応関係であるべきです。
image.png

4.1、DDTWアルゴリズムの詳細

だから我々は、形状についての情報を得ることができますどのように、我々は最初の誘導体が斜面を反映することができることを知っている、とスロープは、当社の判断の時系列は、我々は一階微分によって形状に関する情報を取得する必要があります順序を考慮して、インデックスを形成するので、私たちの意志でありますこのアルゴリズムは、デリバティブと呼ばれる
、動的時間伸縮(DDTW)。
上述したように、我々は、n×m個のマトリックスを構築し、前記マトリックス(I番目、j個目の)要素は、2つの点の気とCJとの間の距離d(チー、CJ)を含みます。DTWアルゴリズムは、ユークリッド距離に応じて2つの時系列、気によって、および推定CJ間DTWアルゴリズムを交換する距離式の差の二乗のDDTW誘導体の対応する点間の距離を算出します。ここでは、そうでない場合は、我々は一般化の方法を高めるためのガイドの数を推定するための簡単な方法を使用して、複雑な精密な一次導関数が計算されて考えていません。次のように推定値は誘導体の式:
image.png
我々は、推定値が点を通る線の傾きと左のその隣接点と隣接点の左右に隣接する頂点を通る直線の平均傾斜を導出するだけであることがわかります。式は2つだけのデータ点を使用するよりも異常値に対してよりロバストであることに留意されたいです。また、音符の第二の点は、代わりに第二の点の逆を使用することであるのに対し、式は、最初と最後の点が含まれていないこと。
image.png
以下は簡単な例です。
image.png

5、実験と結果

特異点の問題にDDTWの改善を検証するために、著者は、フィージビリティスタディを実施するために、それぞれ、正と負の両方からの二つの実験を設計しました。

5.1規則エラー(偽反り)

3つの非常に異なる選択された3つの形状のデータセット、ノイズ自己相関の態様実験に。これらの配列は、彼らが小さな(ローカル)の違いが含まれている場合は特に、非常に関連しているが、同一ではありません。
image.png

2つの単純なアルゴリズムとの間の差を比較するために、我々は、単純なK値(ワーピング経路の長さ)を計算するために使用します。前記範囲maxのK(M、N)<K <M + N-1。この実験では、2つの直列しばらく時間の同様の長さは、M≤K <2M-1それほど。私たちは、次の式を得るように、私たちは、Wは、縦糸の数で定義しますので。
image.png

W経糸2つのアルゴリズムのねじれの数を反映することができる二つの配列の間に見つかった場合、アルゴリズムは、歪まない次いで、Wがゼロに等しくなり、より歪ん、Wの大きな値ことがわかっ 3つのデータセット以上の場合、我々はいくつかの実験を行っ平均し、次の結果が得られました。
image.png

実験により、配列間の正確なマイナーな差異に総歪み軸(野生)によってDTW試行。それは、「より高いレベルの特徴的な」反りしたがってにくく見出さ存在しないと考えられるためDDTW対応します。
image.png
シーケンスのこれら三つのグループのための時間は、実際には完全に間違っているので、それはワープ(完全スプリアス)、価値の高い関連3の時系列グループによるものが同一ではない、とY軸のわずかな違いが含まれていることを指摘しています。それはワープを見つけるために、より多くの2つのアルゴリズムである、彼らはより悪い特異点放電のための問題を特定します。私たちが見ることができるように、DTWのためDDTWは、特異点の問題に大きな改善を持っています。

5.2右の「ねじれ」を検索する(正しい反りを見つけます。)

実験は、時系列の反りのために必要な2つのアルゴリズムの感度を検証することです。実験は、「時系列Q QレプリケーションQとの著者によって時系列を行いました。簡単に言えば、Qの時系列によってワープのための「ガウスの3つの異なるレベルに挿入されたY軸、2つのアルゴリズムによって、次いでQ及びQ時系列の時系列の微妙な変化を達成するためにバンプ」、アルゴリズムを観察し効果。
同じことが、第一の実験として、我々は、エラー経糸の数Mを設定し、以下の条件下での式を得ること。
image.png

二重の矢印に対応する条件は、実際にアルゴリズムによって返された対応関係を示し、単一の矢印に対応し、時系列QとQ」間の正しい対応を示します。そして2つの条件が満たされた場合だけ、我々は時系列変数に2つのY軸に相当の差を計算しました。分母は、標準化し、実行するために宣伝を計算しています。
式(8)の分析我々は、アルゴリズムは、特異点の多くを生成する場合、その後、Mの値が大きくなる、私たちは式の2つの方法を比較することができ、正確に時系列上の対応する点と一致した場合、差がゼロである、ことを見ることができます右のワープ能力を見つけます。結果は以下の通りであります:
image.png
image.png

上記の実験から、DDTW時系列との間の優れたアラインメントを生成することができ;そしてDDTWは、より良好な二つの配列の間の正確な修飾を見つけます。

6.参照

ペーパー:イーモンJ. Keoghの、微分動的時間ワーピング
一時的に論文の実験データ、理解することを学ぶために皆のための唯一の参照コード:https://momodel.cn/explore/5d837ba0870b9dc68fd13fdc?type=app

我々について

Moは(URL:https://でmomodel.cn)のPythonのサポートである人工知能オンラインモデリングプラットフォームを迅速に開発を支援することができ、トレーニングと展開モデル。


MoのAIクラブは、  クラブのしきい値を減らすために開発と利用の人工知能に取り組んサイトのR&Dと製品設計チームが主催しています。ビッグデータの処理や分析、可視化と経験をモデル化したデータを持つチームは、フロントエンドに下から軒並み設計と開発力で、学際的知能プロジェクトを実施してきました。大規模データ分析の管理のための主要な研究の方向と人工知能技術、およびデータ駆動型の科学的な研究を推進するためです。

クラブは、杭州の学術交流と共有するために、現在のライン紙の下に隔週で開催されました。すべての収束に期待しては、交流を育てる人工知能の民主化を促進し、普及していき、人工知能興味の友人に生活を歩きます。
image.png

公開された36元の記事 ウォンの賞賛4 ビュー10000 +

おすすめ

転載: blog.csdn.net/weixin_44015907/article/details/102611324