다양한 플랫폼을 검색하고 여러 이미지 표절 검사 도구를 비교했습니다. 이상적인 도구는 동일하거나 어느 정도 유사성이 있는 이미지를 감지할 수 있어야 하며 많은 수의 이미지를 인식할 수 있는 성능을 가져야 합니다. DuplicatePhotoFinder64가 유사한 이미지 검색을 구현하는 방법을 연구합니다.
먼저 그림의 다양한 설명과 정보의 역할을 이해해야 합니다.
이미지의 기본 속성: 픽셀, 해상도, 크기, 색상, 비트 심도, 색조, 채도, 밝기, 색상 채널 및 이미지 계층.
지각적 이해:
픽셀과 해상도는 고려할 필요가 없으며 비교를 위해 동일한 크기로 조정해야 동일한 이미지의 큰 이미지와 작은 이미지가 유사합니다.
색상, 채도, 밝기 등은 필터의 전송 또는 변조 중 색상 왜곡으로 인해 이러한 색상 관련 정보는 사진이 유사한지 여부를 결정하는 데 결정적인 역할을 해서는 안 되며 스타일만 판단할 수 있으며 평소와 비슷합니다.
영상 콘텐츠의 특성을 가장 잘 반영하고 가장 활용하기 쉬운 것이 상대적 계조분포 정보일 것이다. 조금 더 깊이 들어가면 사진의 외곽선과 같은 정보를 추출하고 진직도와 곡률과 같은 특징을 분류할 수 있습니다.
저자는 포함된 정보를 크게 단순화한 그레이스케일 분산에 기반한 방법을 사용합니다. 크기가 다르고 패턴이 일정하며 세부 사항의 차이가 적고 빠른 연속 촬영으로 동일한 이미지의 일련의 이미지의 인접한 이미지에 더 나은 식별 효과가 있어야 합니다. 전체 이미지/부분 이미지, 장면의 다른 위치에 있는 동일 인물, 필터에 의한 명암 처리의 차이가 큰 이미지의 경우 구분 능력이 좋지 않습니다.
처리 방법:
먼저 이미지를 총 64픽셀인 8x8 크기로 조정합니다.
64단계 그레이스케일 이미지로 처리(색상 정보 무시)
그레이 스케일 평균 계산
각 픽셀의 계조를 평균값과 비교하여 평균값보다 낮지 않으면 1로 기록하고 평균값보다 낮으면 0으로 기록하며 64비트 바이너리 그레이스케일 특징 정보(지문)를 획득합니다.
64비트에서 두 그림의 차이를 비교하면 비트 수가 적을수록 차이가 작고 유사도가 높습니다.
보다 세부적인 사항을 고려하고 일부 성능을 희생하는 경우 시스템 크기를 늘리거나 늘릴 수 있습니다.
생각하다:
이미지 스케일링 단계에서는 단순히 특정 행과 특정 열의 픽셀 값을 취하는 것이 아니라 적절한 추출 및 보간 방법을 사용해야 합니다.
전체/로컬 이미지의 경우 벡터 특징을 기반으로 유사성을 찾는 방법.
다른 원칙에 따라 이미지 유사성을 판단하는 다른 방법이 있습니까? 예를 들어 자동화된 테스트 도구 airtest는 전체 이미지에서 부분 이미지를 어떻게 인식합니까?