DDTW 유도체 동적 시간 왜곡 알고리즘

DDTW 유도체 동적 시간 왜곡 알고리즘

저자 : 곡물

미분 동적 타임 와핑 (DDTW)의 동적 타임 와핑에 개선 (DTW)이다. (특이점) 문제 발생 "특이점"고전 DTW 알고리즘을 완화,이 문서는 다음과 같은 측면 DDTW 알고리즘을 소개합니다.

1 알고리즘 배경

시간 시리즈는 거의 데이터 형태로 모든 과학 분야의 유행이다. 다른 서열은 두 시계열의 유사성을 비교하는 비교 하였다 공통 처리 작업 시계열 서열이다. 일부 지역에서는, 매우 간단한 디스턴스 메트릭 (예를 들면, 유클리드 거리)가 충분하다.

의 image.png

그러나 대부분의 경우, 실질적으로 두 시퀀스 동일한 형상하지만, 이러한 형태의 전체 구성은 X 축에 정렬되지 않는다. (도. 1)

유사성을 찾아, 또는 전처리 단계로 이전을 평균을 위해, 우리는 (또는 둘 다) 서열이 축이 시퀀스 사이의 "트위스트"더 나은 비교를 달성하기 위해해야합니다. 동적 타임 와핑 (DTW)는 예컨대 정기적를 달성하는 효과적인 방법이다.

도. (A)에 나타낸 바와 같이, 고체 및 점선은 두 개의 음성 파형 (관찰 개방 Y 축)의 동일한 단어 "펜"이다. 파형 형상은 매우 유사 전체적으로 볼 수 있지만, 시간 축은이 (i 번째의 i 번째 포인트 정렬의 다른 서열과 서열의 점 "비관적 차이의"을 생성하는 것으로 간주 정렬되지 비관적 유사성). 패널 B에서, DTW는 거리 계산이 정확한지 그래서, 정렬 지점이 두 파형에 의해 발견 될 수있다.
의 image.png
(도. 1)
따라서, DTW 전시 좋은 용량, 데이터 마이닝에 더하여 (키오 및 Pazzani 2000 이순신 등 . Al.1998, 번트 및 1,994 클) 제스처 인식을위한 추가의 애플리케이션은 DTW (가브 릴라 및 1,995 데이비스), 로봇 (Gollmer 포스텐 및 1995) 및 제약 산업 제조 기술 (Schmill 등. 등 1999), 음성 처리 (Rabiner 및 Juang 1993), (Caiani 외한다. 등 1998).

(2) 고전 동적 시간 왜곡 알고리즘

우리는 길이 n 및 m,의 각각 두 시계열 Q 및 C가 있다고 가정
의 image.png
두 서열을 정렬하기 위해, 우리는 행렬 원소 (I, J), N × M 개의 행렬의 격자를 구성해야하고 CJ 두 치를 나타낸다 거리 (D)는 Ψ (qi, CJ) 가리 (각 점과 각 점 C 사이, 즉 Q 서열 유사성, 작은 거리 높은 유사도.없이 제 순서 어디), 유클리드 거리가 일반적으로 사용된다. 각 행렬 원소 (I, J) 및 CJ는 정렬 지점 치 나타낸다. 이 행렬로, 우리는 두 시간 시리즈 및 방송 워핑 경로 왜곡로 (W)를 사이의 거리를 계산할 수있다. 거기에 우리가 규정의 많은 전체 경로 (아래 W 식)를 얻을 수 있도록 "트위스트"모드의 많은 다른 시간 축이지만, 우리의 목표이기 때문에 두 시리즈 사이의 시간을 결정하기 위해 구조화 된 최단 경로를 찾을 수 유사성의 정도 "거리"어떻게 신속하게이 경로를 찾는 방법은? 우리는 우리에게 큰 편의를 제공 할 수 동적 프로그래밍 (동적 프로그래밍)을 발견했다.
동적 프로그래밍 알고리즘이 격자를 통한 경로를 찾기 위해, 격자 점의 수에 기인 할 수있는, 그리드 정렬 포인트 산출 두 시퀀스를 통해 경로이다.
의 image.png
난 번째의 요소 w = (i, j)가 두 개의 시계열의 맵핑을 정의 승이다. 또한, 경로는 일반적으로 여러 가지 제약으로 구성되어 있습니다.
; 1) 경계 조건 경로는 시작과 끝에서의 대각 요소들의 매트릭스로 구성되어야 정의
이것은 워핑 경로의 단계)를 대각선으로 인접한 셀을 포함하여 인접하는 셀 (제한되어있게;) 2 연속성
3) 단순성 : 시간에 단순 W 포인트를 강제로.

연속성 및 단순성 제약 만 세 방향의 격자의 각 경로 점 바인딩. (I 1, J +) : 경로 격자를 통과 한 경우, 예를 들어, (I, J)는, 그 다음 그리드 포인트를 통해 다음과 같은 세 가지 조건 중 하나가 될 수있다 , (I, J + 1) I + (또는 1, J + 1).
의 image.png
위함으로써, 우리는 구조화 된 모든 경로가 구조화에 최단 경로를 찾아 비교하여 위의 조건을 충족 할 수 있지만, DP는 우리를 위해 최단 경로를 계산하는 더 나은 방법을 제공합니다. 우리는 먼저 누적 거리 누적 거리 γ 누적 거리 γ 정의 (전, j)는 현재의 격자 점의 거리 d (i, j)로하면, 즉, 유클리드 거리 포인트 치 및 CJ와 대 점의 최소 인접 요소에 도달 할 및 누적 거리 :
의 image.png
동적 프로그래밍 알고리즘, 우리는 비교적 용이 최단 거리를 누적 얻을 수있다.

3, 동적 프로그래밍 "특이점"문제

는 Y 변수 "트위스트"X 축을 축으로 DTW 알고리즘의 가장 중요한 특징은, 설명 그래서 시계열 배치의 목적을 달성하기 위해서이다. 그러나, X 축 왜곡 변수 값으로 단순 Y 축은 시계열상의 단일 지점이 다른 시계열의 일부에 매핑되는 것 인, (직관적)은 "직관적"를 정렬시킨다. 우리는 우리가 "특이점"(특이성)로이 동작을 볼 것으로 예상하지 않는다 말한다.
의 image.png

이 특이점 문제를 완화하기 위해 일시적으로 방법을 많이했다,이 방법은 기본적으로 가능한을 제한 한 가지 공통점을 가지고있다. "트위스트." 그러나, 단점은 원인 것을, 그것은, "올바른"발견되지 않을 수있다 "트위스트."
따라서, 우리는이 문제를 개선하기 위해 파생 DTW를 도입했습니다.

4 파생 동적 타임 워핑 알고리즘

앞서 언급 한 바와 같이, DTW 알고리즘은도 3에 도시 된 바와 같이, 특이점 문제에 미묘한 변화의 원인을 쉽게 변수 Y는 축되도록 상기 X 축 워프 변수 Y 축의 값에 따라 대략적 (격렬)이다. 우리는 모양 (형태) 정렬 할 DTW 기능보다 높은 수준을 고려 선택할 수 있도록 시퀀스의 가장 정확한 시간 정렬은 기능 (기능과 특징) 간의 일치해야합니다.
의 image.png

4.1, DDTW 알고리즘 세부 사항

그래서 우리는 모양에 대한 정보를 얻을 수있는 방법, 우리는 첫 번째 유도체는 기울기를 반영 할 수 있다는 것을 알고, 기울기는 우리의 판정 시간 시리즈는 우리가 1 차 미분에 의해 모양에 대한 정보를 얻을 수있는 순서를 고려해야하므로, 인덱스를 형성 그래서 우리를 것입니다 알고리즘은 파생 상품이라는
동적 타임 워핑을 (DDTW).
상술 한 바와 같이, 우리는 n × m 행렬을 구성하는, 상기 행렬 (I 번째는, j 개의) 번째 요소는 두 점 치 및 CJ 사이의 거리 (d)는 Ψ (qi, CJ)를 포함한다. DTW 알고리즘 치에 의해 추정 CJ 사이 DTW 알고리즘을 대체하기 화학식 거리 차이의 제곱 유클리드 거리 DDTW 유도체에있어서, 두 개의 시계열 대응하는 지점 사이의 거리를 계산한다. 여기에서 우리는 복잡하게 생각하지 않는다 정확한 1 차 미분 그렇지 않으면 우리가 일반화 된 방법을 높이기 위해 가이드의 수를 추정하는 간단한 방법을 사용하여 계산됩니다. 다음 예상 유도체 화학식 :
의 image.png
우리는 추정이 점을 통한 라인의 기울기와 왼쪽의 인접 점과 상기 인접 점의 좌우에 인접한 정점을 통해 직선의 평균 기울기를 도출하는 막이라고 볼 수있다. 이 수식은 두 개의 데이터 요소를 사용하는 것보다 더 강력한 특이임을 유의한다. 두 번째 점 대신 번째 점의 역을 사용하는 반면, 또한 음의 화학식은 제 1 및 최종 점을 포함하지 않는 것이다.
의 image.png
다음은 간단한 예입니다.
의 image.png

5, 실험 및 결과

특이 문제 DDTW 개선을 확인하기 위해, 저자는 실시 타당성 조사에 각각 양극과 음극 모두에서 두 실험을 설계 하였다.

5.1 규칙 오류 (가짜 워핑)

세 개의 매우 다른 선택된 세 형상 데이터 세트 및 노이즈 자기 상관 양태 실험에. 이 시퀀스는 매우 그들이 작은 (로컬) 차이를 포함, 특히 관련,하지만 동일하지 않습니다.
의 image.png

두 간단한 알고리즘의 차이를 비교하기 위해 간단한 K 값 (휨 경로의 길이) 계산할 수를 사용한다. 범위에있어서, 최대 K (m, N) <K <m + N-1. 시간의 길이가 비슷하기 때문에,이 실험의 두 시리즈는 너무 ≤ K <2m-1M의 동안. 우리는 다음과 같은 식을 얻을 수 있도록 우리가, W는 워프의 수를 정의 그래서 :
의 image.png

두 개의 서열 사이에서 발견한다면 W는 경사 두 알고리즘의 꼬임 수를 반영 할 수 있고, 상기 알고리즘은 다음 W 제로와 동일 할 왜곡되지 않고 더 W.의 큰 값 것으로, 왜곡 위의 세 가지 데이터 세트의 경우, 우리는 몇 가지 실험을 평균 한 다음과 같은 결과를 얻었다 수행 :
의 image.png

실험에 의해, 올바른 서열 사이에 사소한 차이 총 왜곡 축 (야생)에 의해 DTW 시도. 이 "높은 수준의 특성"경사 때문에 어렵게 발견 존재하지 않는 것으로 간주되기 때문에 DDTW 대응.
의 image.png
그것은 축, 시퀀스의이 세 그룹에 대한 시간 때문에 사실상 완전히 잘못 왜곡되어 그 때문에 Y의 세 가지 매우 관련이 있지만, 동일하지, 그리고 포함 약간의 차이의 시계열 그룹에 주목할 필요가있다 (완전히 가짜) . 워프를 찾을 수보다 두 알고리즘 즉, 그들은 특이점 방전 악화 문제를 식별합니다. 우리가 볼 수 있도록, DTW에 대한 DDTW는 특이점 문제에 큰 개선이있다.

5.2 권리 "트위스트"를 찾기 (올바른 뒤틀림을 찾을 수)

실험은 시계열의 휘어짐에 필요한 두 알고리즘의 민감도를 확인하기위한 것이다. 실험은 저자에 의해 시계열 Q Q 복제 Q와 시간 시리즈 '를 수행했다. 간단히 말하면, Q의 시계열로 워프 '가우스의 세 가지 레벨로 삽입되어 Y 축 두 알고리즘 후 Q 및 Q 시계열의 시계열의 미묘한 변화를 달성하기 위해 범프'알고리즘을 관찰 효과.
같은 첫 번째 실험으로, 우리는 에러 경사의 개수 M을 설정하고, 다음 조건하에하기 화학식을 얻었다 :
의 image.png

양방향 화살표에 대응하는 조건은 실제로 알고리즘에 의해 반환 된 대응 관계를 표시 한 화살표에 대응하는 시간 순서 Q 및 Q '의 정확한 대응을 나타낸다. 두 가지 조건이 충족되는 경우에만, 우리는 시계열 변수 개의 Y 축에 대응 차이를 계산하는 경우. 분모는 표준화하고 수행하기 위해 홍보를 계산한다.
알고리즘 특이 많이 후 더는 M의 값이 우리가 수식 두 방법과 비교 수를 생성하는 경우 정확하게 시계열의 해당 시점과 일치 할 때, 우리는 그것을 볼 수 식 (8)의 분석은 그 차이가 제로 올바른 워프 용량을 찾기. 결과는 다음과 같다 :
의 image.png
의 image.png

위의 실험에서, DDTW는 시계열 사이의 우수한 정렬을 생성 할 수 있습니다, 그리고 DDTW 더 나은 두 시퀀스 사이의 올바른 수정을 찾을 수 있습니다.

6. 참고 문헌

종이 : Eamonn J. 키오, 파생 동적 타임 워핑이
일시적으로 논문의 실험 데이터, 모두를위한 유일한 참조 코드를 이해하는 법을 배워야 : https://momodel.cn/explore/5d837ba0870b9dc68fd13fdc?type=app

회사 소개

(URL : https : //로 momodel.cn은 )의 파이썬 지원이다 인공 온라인 정보 모델링 플랫폼을 신속하게 개발하는 데 도움이 수, 교육 및 배포 모델.


모 AI 클럽은  클럽의 임계 값을 줄이기 위해 개발과 사용의 인공 지능하기 위해 최선을 다하고 사이트 R & D 및 제품 디자인 팀, 후원하고 있습니다. 빅 데이터 처리 및 분석, 시각화 및 경험을 모델링 데이터와 팀, 프론트 엔드에 바닥에서 전반적으로 설계 및 개발 능력, 전문 분야 정보 프로젝트를 수행하고있다. 대용량 데이터 분석 및 인공 지능 기술의 관리에 대한 주요 연구 방향 및 추진하기 위해 과학 연구 데이터를 기반.

클럽은 항주의 학술 교류와 공유하는 현재의 행 종이에서 매 2 주 개최했다. 모든 인공 지능 관심 친구로 생업에서, 수렴, 교류를 성장 인공 지능, 넓은 사용의 민주화를 촉진하기 위해 계속 희망.
의 image.png

게시 36 개 원래 기사 · 원 찬양 4 ·은 10000 +를 볼

추천

출처blog.csdn.net/weixin_44015907/article/details/102611324