대용량 데이터에 레이블을 지정할 필요가 없는 물체 감지의 새로운 패러다임인 OVD는 다중 모드 AGI를 한 단계 발전시킵니다.

팔로우 및 별표 표시

절대 길을 잃지 않는다

컴퓨터 비전 연구소

19c26b68d733695e2e6a0add96b2ffa8.gif

ff307c2d270b467408271b584d2a71f0.gif

공용 계정 IDComputerVisionGzq

학습모임QR코드를 스캔하시면 홈페이지에서 가입방법을 확인하실 수 있습니다.

컴퓨터비전연구소 칼럼

저자: Edison_G

타겟 검출은 컴퓨터 비전에서 매우 중요한 기본 작업으로, 일반적인 이미지 분류/인식 작업과 달리 타겟 검출은 타겟의 카테고리 위에 타겟의 위치 및 크기 정보를 추가로 제공하는 모델이 필요합니다.CV 3에서는 대규모 작업(식별, 감지, 분할)에서 선행 작업과 다음 작업을 연결하는 핵심 위치입니다.

"360AI 연구소"에서 이관

51141745913822d55e3b7bba8a7a6be3.jpeg

4b9a4ec86ca6e5971f1a3656163a80d2.png

12e5004451eaa794514b2a7640664085.png

OVD 기본 흐름도

30fafb8a0af94a28fcb23a1c852047e0.png

论文1:캡션을 이용한 개방형 어휘 객체 검출

d0800aee8fb11ccf5f2ca006a37091b8.png

  • 종이 주소: https://arxiv.org/pdf/2011.10678.pdf

  • 코드 주소: https://github.com/alirezazareian/ovr-cnn

860645e914f0bb294f63fbdf13aa967e.png

339850a3e629b873b2c5650562a9dd14.png

9afe5937da92e707505c3222085f85e9.png

64f52f73f3287550fba224f63b33355a.png

  • 종이 주소: https://arxiv.org/abs/2112.09106

  • 코드 주소: https://github.com/microsoft/RegionCLIP

ed82845e43488eeda428e945550bbdac.png

4ac775931c25b14573350a904db3fd44.png

f7e7623335e9bd7c8fbe159041659f64.png

论文3:CORA: 영역 프롬프트 및 앵커 사전 일치를 사용하여 개방 어휘 탐지를 위한 CLIP 적응

568518a164753ef7d8907c1d6d8497fd.png

  • 종이 주소: https://arxiv.org/abs/2303.13076

  • 코드 주소: https://github.com/tgxs002/CORA

4f5deb9bc887a4d4148fe8ecbe38032e.png

a1999b6fc9e51aada5dace74544ceb7f.png

754bcdd115cd5947a2dca227d06bc8a9.png

71bf44a204a7281f14acaf9e8a227ff7.png

© 끝 

재인쇄를 위해 승인을 위해 이 공식 계정에 문의하십시오.

03beb3e0116fd037b97008c92e2e3f68.gif

Computer Vision Research Institute 스터디 그룹이 여러분의 참여를 기다리고 있습니다!

에 대한

컴퓨터 비전 연구소

컴퓨터비전연구소는 주로 딥러닝 분야에 관여하고 있으며 주로 얼굴 검출, 얼굴 인식, 다중 표적 검출, 표적 추적, 이미지 분할 등의 연구 방향에 전념하고 있습니다. 연구소는 계속해서 최신의 새로운 종이 알고리즘 프레임워크를 공유할 것입니다.이번 개혁의 차이점은 "연구"에 집중해야 한다는 것입니다. 이후 해당 분야의 실무 과정을 공유하여 이론을 탈피하는 실제 현장을 모두가 진정으로 경험하고 뇌로 프로그래밍과 사고를 사랑하는 습관을 기를 수 있도록 하겠습니다!

VX:2311123606

638544c89adef253dc2ab82eabb597e3.png

지난 추천

Supongo que te gusta

Origin blog.csdn.net/gzq0723/article/details/131078621
Recomendado
Clasificación