대용량 데이터에 레이블을 지정할 필요가 없는 물체 감지의 새로운 패러다임인 OVD는 다중 모드 AGI를 한 단계 발전시킵니다. - Code World

대용량 데이터에 레이블을 지정할 필요가 없는 물체 감지의 새로운 패러다임인 OVD는 다중 모드 AGI를 한 단계 발전시킵니다.

News 2023-06-12 13:55:53 views: null

팔로우 및 별표 표시

절대 길을 잃지 않는다

컴퓨터 비전 연구소

공용 계정 ID｜ComputerVisionGzq

학습모임｜QR코드를 스캔하시면 홈페이지에서 가입방법을 확인하실 수 있습니다.

컴퓨터비전연구소 칼럼

저자: Edison_G

타겟 검출은 컴퓨터 비전에서 매우 중요한 기본 작업으로, 일반적인 이미지 분류/인식 작업과 달리 타겟 검출은 타겟의 카테고리 위에 타겟의 위치 및 크기 정보를 추가로 제공하는 모델이 필요합니다.CV 3에서는 대규모 작업(식별, 감지, 분할)에서 선행 작업과 다음 작업을 연결하는 핵심 위치입니다.

"360AI 연구소"에서 이관

OVD 기본 흐름도

论文1：캡션을 이용한 개방형 어휘 객체 검출

종이 주소: https://arxiv.org/pdf/2011.10678.pdf
코드 주소: https://github.com/alirezazareian/ovr-cnn

종이 주소: https://arxiv.org/abs/2112.09106
코드 주소: https://github.com/microsoft/RegionCLIP

论文3：CORA: 영역 프롬프트 및 앵커 사전 일치를 사용하여 개방 어휘 탐지를 위한 CLIP 적응

종이 주소: https://arxiv.org/abs/2303.13076
코드 주소: https://github.com/tgxs002/CORA

© 끝

재인쇄를 위해 승인을 위해 이 공식 계정에 문의하십시오.

Computer Vision Research Institute 스터디 그룹이 여러분의 참여를 기다리고 있습니다!

에 대한

컴퓨터 비전 연구소

컴퓨터비전연구소는 주로 딥러닝 분야에 관여하고 있으며 주로 얼굴 검출, 얼굴 인식, 다중 표적 검출, 표적 추적, 이미지 분할 등의 연구 방향에 전념하고 있습니다. 연구소는 계속해서 최신의 새로운 종이 알고리즘 프레임워크를 공유할 것입니다.이번 개혁의 차이점은 "연구"에 집중해야 한다는 것입니다. 이후 해당 분야의 실무 과정을 공유하여 이론을 탈피하는 실제 현장을 모두가 진정으로 경험하고 뇌로 프로그래밍과 사고를 사랑하는 습관을 기를 수 있도록 하겠습니다!

VX：2311123606

지난 추천

Supongo que te gusta

Origin blog.csdn.net/gzq0723/article/details/131078621

Recomendado

Clasificación

Diario

Más

2024-05-18(30)

2024-05-17(4)

2024-05-16(22)

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)