기술 학습 | 이미지 주석의 기본 내용 소개

"데이터 분석이 없으면 회사는 눈이 멀고 귀가 들리지 않으며 고속도로의 사슴처럼 웹을 돌아다닙니다."

— 제프리 무어

지난 주에 공유한 이미지 데이터 주석 도구는 많은 학생들의 관심을 끌었습니다.동시에 기초와 경험이 전혀 없는 일부 친구들도 이미지 주석의 기본 내용을 이해하고 싶다고 말했습니다.오늘 Xiao A는 여러분과 일부를 공유할 것입니다. .

 이미지 데이터 주석

모든 데이터 과학 작업에는 데이터가 필요합니다. 특히 시스템에 공급되는 깨끗하고 이해하기 쉬운 데이터입니다. 이미지와 관련하여 컴퓨터는 인간의 눈이 보는 것을 볼 필요가 있습니다.

예를 들어, 인간은 물체를 인식하고 분류하는 능력이 있습니다. 마찬가지로 컴퓨터 비전을 사용하여 수신한 시각적 데이터를 해석할 수 있습니다. 이것은 이미지 주석이 들어오는 곳입니다.

이미지 주석은 컴퓨터 비전에서 중요한 역할을 합니다. 이미지 주석의 목표는 작업 관련, 작업별 레이블을 제공하는 것입니다. 여기에는 텍스트 기반 레이블(클래스), 이미지에 그려진 레이블(예: 테두리) 또는 픽셀 수준 레이블이 포함될 수 있습니다. 아래에서 이 범위의 다양한 주석 기술을 살펴봅니다.

AI는 우리가 생각하는 것보다 더 많은 사람의 개입이 필요합니다. 고정밀 학습 데이터를 준비하려면 이미지에 주석을 달아 올바른 결과를 얻어야 합니다. 데이터 주석에는 종종 특정 도메인의 전문가만 제공할 수 있는 높은 수준의 도메인 지식이 필요합니다.

주석이 필요한 컴퓨터 비전 작업:

이미지 분류

표적 탐지

라인/에지 감지

분할

포즈 예측/키포인트 인식

1 이미지 분류

이미지 분류는 객체 감지와 다릅니다. 객체 감지의 목적은 객체를 식별하고 찾는 것이지만 이미지 분류의 목적은 특정 객체 클래스를 식별하고 식별하는 것입니다. 이 사용 사례의 일반적인 예는 고양이와 개 사진을 분류하는 것입니다. 애노테이터는 강아지 이미지에 "dog" 클래스 레이블을 지정하고 고양이 이미지에 "cat" 클래스 레이블을 지정해야 합니다.

2 물체 감지

객체 감지에는 2D 경계 상자와 3D 경계 상자라는 두 가지 주요 기술이 있습니다.

다각형 개체의 경우 다각형 방법을 사용할 수 있습니다. 자세히 논의합시다.

2D 경계 상자

이 방법에서는 감지된 개체 주위에 직사각형 상자만 그려야 합니다. 이미지에서 개체의 위치를 ​​정의하는 데 사용됩니다. 테두리는 사각형의 왼쪽 위 모서리의 x, y 좌표와 오른쪽 아래 모서리의 x, y 좌표로 결정할 수 있습니다.

장점과 단점:

라벨링은 빠르고 쉽습니다.

많은 응용 프로그램에서 중요한 객체의 방향과 같은 중요한 정보를 제공할 수 없습니다.

개체의 일부가 아닌 배경 픽셀을 포함합니다. 이것은 훈련에 영향을 줄 수 있습니다.

3D 경계 상자 또는 큐브

대상의 깊이도 표시할 수 있다는 점을 제외하면 2D 경계 상자와 유사합니다. 이 주석은 2D 이미지 평면의 경계 상자를 3D 직육면체에 역투영하여 달성됩니다. 이를 통해 시스템은 3차원 공간에서 부피 및 위치와 같은 특징을 구별할 수 있습니다.

장점과 단점:

개체 방향 문제를 수정했습니다.

개체가 가려지면 이 주석은 훈련에 영향을 미칠 수 있는 경계 상자의 크기를 상상할 수 있습니다.

이러한 주석에는 훈련에 영향을 미칠 수 있는 배경 픽셀도 포함됩니다.

다각형

때때로 불규칙한 모양의 물체를 표시해야 합니다. 이 경우 다각형이 사용됩니다. 주석을 달 때 물체의 가장자리를 표시하기만 하면 감지할 물체의 완벽한 윤곽을 얻을 수 있습니다.

장점과 단점:

다각형 마커의 주요 장점은 배경 픽셀을 제거하고 개체의 정확한 치수를 캡처한다는 것입니다.

시간이 많이 걸리고, 물체의 모양이 복잡하면 라벨을 붙이기가 어렵습니다.

참고: 다각형 방법은 개체 모양 분할에도 사용됩니다. 아래에서 세분화에 대해 논의하겠습니다.

3 라인/에지 감지(라인 및 스플라인)

선과 스플라인은 경계를 구분할 때 유용합니다. 한 영역을 다른 영역과 구별하는 픽셀에 레이블이 지정됩니다.

장점과 단점:

이 접근 방식의 장점은 라인의 픽셀이 모두 인접할 필요가 없다는 것입니다. 이것은 끊어진 선이나 부분적으로 가려진 물체를 감지하는 데 유용합니다.

이미지의 선에 수동으로 레이블을 지정하는 것은 특히 이미지에 많은 선이 있는 경우 매우 피곤하고 시간이 많이 걸립니다.

이로 인해 개체가 정렬될 때 잘못된 결과가 발생할 수 있습니다.

4 포즈 예측 / 요점 인식

많은 컴퓨터 비전 애플리케이션에서 신경망은 종종 입력 이미지에서 중요한 관심 지점을 식별해야 합니다. 이러한 지점을 랜드마크 또는 키포인트라고 합니다. 이 애플리케이션에서 우리는 신경망이 키 포인트의 좌표(x, y)를 출력하기를 원합니다.

5 분할

이미지 분할은 이미지를 여러 부분으로 나누는 과정입니다. 이미지 분할은 일반적으로 픽셀 수준에서 이미지의 개체와 경계를 지역화하는 데 사용됩니다. 이미지 분할 방법에는 여러 가지가 있습니다.

시맨틱 분할:  시맨틱 분할은 이미지의 각 픽셀이 클래스에 할당되는 픽셀 수준의 주석이 필요한 기계 학습 작업입니다. 모든 픽셀은 의미론적 의미를 지닙니다. 이것은 주로 환경의 맥락이 매우 중요한 상황에서 사용됩니다.

인스턴스 분할:  인스턴스 분할은 픽셀 수준에서 이미지에 있는 각 개체의 각 인스턴스를 식별하는 이미지 분할의 하위 유형입니다. 인스턴스 분할 및 시맨틱 분할은 이미지 분할의 두 가지 세분성 수준 중 하나입니다.

Panoptic 분할:  Panoptic 분할은 모든 픽셀에 클래스 레이블이 할당되고 모든 대상 인스턴스가 고유하게 분할되는 시맨틱 및 인스턴스 분할을 결합합니다.

이미지 주석 사용 사례

그렇다면 기계 모델이 산업별 작업을 수행하는 데 도움이 되도록 이미지 주석을 어떻게 사용할 수 있습니까?

소매:  2D 경계 상자를 사용하여 제품 이미지에 주석을 달 수 있으며 기계 학습 알고리즘에서 이를 사용하여 비용 및 기타 속성을 예측할 수 있습니다. 이미지 분류도 여기에서 도움이 될 수 있습니다.

의학: 다각형은 의료용 X-레이의 장기에 라벨을 지정하는 데 사용할 수 있으므로 딥 러닝 모델에 입력하여 X-레이의 기형 또는 결함에 대해 훈련할 수 있습니다. 이것은 이미지 주석의 가장 중요한 응용 프로그램 중 하나이며 의료 전문가의 높은 도메인 지식이 필요합니다.

자율 주행 자동차: 이것은 이미지 주석을 적용할 수 있는 또 다른 중요한 영역입니다. 시맨틱 분할로 이미지의 모든 픽셀에 레이블을 지정하면 차량이 도로의 장애물을 인식할 수 있습니다. 이 분야에 대한 연구는 여전히 진행 중입니다.

감정 감지: 이것은 사람의 감정(행복, 슬픔 또는 자연스러운 감정)을 감지하는 데 사용할 수 있는 이정표입니다. 이것은 특정 콘텐츠에 대한 피험자의 감정적 반응을 평가하는 데 적용될 수 있습니다.

제조 산업: 선과 스플라인을 사용하여 공장의 이미지를 표시할 수 있습니다. 선은 로봇을 따라 작업합니다. 이를 통해 생산 공정을 자동화하고 인건비를 최소화할 수 있습니다.

이미지 주석의 몇 가지 과제

시간 복잡성: 수동으로 이미지에 레이블을 지정하는 데는 많은 시간이 걸리고 기계 학습에는 많은 데이터 세트가 필요하며 이러한 이미지 기반 데이터 세트에 효과적으로 레이블을 지정하는 데 많은 시간이 걸립니다.

계산 복잡성: 기계 학습에는 모델을 실행하기 위해 정확하게 레이블이 지정된 데이터가 필요합니다. 주석자가 이미지에 주석을 달 때 어떤 종류의 오류를 주입하면 훈련에 영향을 미칠 수 있으며 모든 노력이 낭비될 수 있습니다.

도메인 지식: 앞서 언급했듯이 이미지 주석에는 일반적으로 도메인별 고급 도메인 지식이 필요합니다. 따라서 무엇에 주석을 달아야 하는지 아는 주석가와 해당 분야의 전문가가 필요합니다.

데이터 라벨링을 위한 시스템 학습

오늘날 인공지능의 급속한 발전과 관련 국가정책의 활발한 추진으로 체계적으로 학습할 수 있는 인공지능 관련 자격증 과정이 일부 생겨나고 동시에 해당 시험에 합격하면 국가공인 직업자격증을 취득할 수 있다. .

인적자원사회보장부 "인공지능 훈련사"

산업통상자원부 "인공지능 데이터 라벨링 기술"

문의하기

위의 직업 증명서는 공식 웹 사이트에서 조회할 수 있습니다.더 알고 싶거나 관련 비즈니스 협력을 알리고 싶다면 개인 메시지를 보낼 수 있습니다.

인공 지능에 대한 질문과 경험을 공유하는 것도 환영합니다 Xiao A는 모두가 공유하고 싶어하는 몇 가지 주제를 선택할 것이므로 팔로우하는 것을 잊지 마십시오.

인공지능산업응용연구소

시나리오를 사용하여 AI 생태학을 정의하여 산업, 산업 구조, 사회 개발 수요 추세 및 인재 부족 요구의 변화에 ​​적응하기 위해 산업 구현을 촉진하고 산업 교육 통합, 산업 응용 프로그램 인재 교육, 응용 프로그램 컬렉션을 만듭니다. 시나리오 개발, 산업 생태 재배, 산업 프로젝트 인큐베이션 및 혁신 국제 인공 지능 응용 지향 산업 육성 기지에 대한 투자. 인공 지능 산업 체인을 위한 생태 플랫폼을 구축함으로써 인공 지능 기술을 촉진하여 다양한 비즈니스 시나리오를 위한 산업 응용 표준을 형성하고 보다 완전한 AI 산업 체인 생태로 인공 지능 산업의 구현을 촉진 및 촉진합니다.

Supongo que te gusta

Origin blog.csdn.net/aiinstitute/article/details/131577712
Recomendado
Clasificación