영상 인식 및 처리 관련 데이터 세트를 설명

원본 링크 : HTTP : //blog.csdn 의 .NET 이 문서는했다 / qq_14845119 / 기사 / 세부 / 51913171

ImageNet

         ImageNet는 것입니다 컴퓨터 비전 , 프로젝트를 식별하는 시스템이 현재 세계 최대의 영상 인식입니다 데이터베이스 . 인간의 식별 시스템을 시뮬레이션 스탠포드 리 Feifei에서 미국의 컴퓨터 과학자 설립했다. 사진에서 개체를 식별 할 수. 지금은 가장 큰 알려진 이미지입니다 14197122 이미지가 포함 된 데이터베이스 . 연간 대회는 해외 여러 학교와 가정에서 대형 IT 회사와 지주뿐만 아니라 거대한 마음을 네트워킹에 ImageNet 숙고이다. 아래 이미지, 다운로드하기 전에 계정을 등록 할 ImageNet의 필요, 다운로드 링크는 http://www.image-net.org/


PASCAL VOC

         PASCALVOC이 기준 데이터 세트와 시각적 객체 검출의 분류이다 시험 , 검출 알고리즘은 표준 이미지 및 특수 데이터 세트 성능 기준 및 평가 시스템 연구. VOC2007 (430M) (1.9G) 다운로드 VOC2012 두 버전을 포함하는도 1에 도시 된 바와 같이, 이미지. 다운로드 링크를 http://pjreddie.com/projects/pascal-voc-dataset-mirror/



Labelme

         Labelme는 그의 아들이, 그 후, 데이터 세트의 개발을 라벨링을하고 도움 휴식 스탠포드 학생의 어머니의 시간입니다. 데이터 세트하는 단계를 포함하는 주요 기능

(1)보다는 단지 예시 식별하지 않고, 객체 분류를 위해 특별히 설계

장면 디자인 학습 포함 된 개체를 위해 설계 (2)

(3) 프레임 다각형 (폴리곤) 및 배경의 표시를 포함하는, 화소 레벨의 품질을 라벨링 (세그멘테이션 마스크)

(4) 오브젝트 클래스, 각 개체 차가 큰 다양한 다이버 시티도 크다.

(5) 모든 이미지 복사가 아니라, 카메라를 통해 자신 있습니다

(6) 개방, 무료

         아래 이미지는, MATLAB, 다운로드 이상한 방법으로 다운로드 할 필요가 다운로드 링크는 http://labelme2.csail.mit.edu/Release3.0/index.php

머리

       COCO 새로운 이미지 인식, 분류 및 자막 표지 데이터 세트이다. 주로 TSUNG - 이순신 린 (코넬 기술), 제네 비브 패터슨 (브라운), MatteoRuggero 론치 (칼텍), 음 추이 (코넬 기술), 마이클 MAIRE (TTI 시카고), 서지 Belongie (코넬 기술), 루보 미르 Bourdev (UC 버클리)에 의해 함께 모여 로스 Girshick (페이스 북 AI), 제임스 헤이즈 (조지아 공대), PietroPerona (칼텍), 데바 Ramanan (CMU), 래리 Zitnick (페이스 북 AI), 표트르 달러 (페이스 북 AI). 주요 기능은 다음이다

(1) 오브젝트 세그멘테이션

문맥에 의해 식별 (2)

(3) 각 이미지는 대상 물체의 복수

(4) 30 만 개 이상의 이미지

(5) 2,000,000로서는

객체 (6) 80가지

(7) 각 이미지는 다섯 자막 포함

10 만 개인을 포함하는 키 포인트 (8)

         도시 된 바와 같이 이미지를 지원 matlab에 파이썬 두 다운로드 방법 다운로드 링크 http://mscoco.org/

태양

         SUN数据集包含131067个图像,由908个场景类别和4479个物体类别组成,其中背景标注的物体有313884个。图像如下图所示,下载链接为http://groups.csail.mit.edu/vision/SUN/

Caltech

         Caltech是加州理工学院的图像数据库,包含Caltech101和Caltech256两个数据集。该数据集是由Fei-FeiLi, Marco Andreetto, Marc 'Aurelio Ranzato在2003年9月收集而成的。Caltech101包含101种类别的物体,每种类别大约40到800个图像,大部分的类别有大约50个图像。Caltech256包含256种类别的物体,大约30607张图像。图像如下图所示,下载链接为http://www.vision.caltech.edu/Image_Datasets/Caltech101/

Corel5k

         这是Corel5K图像集,共包含科雷尔(Corel)公司收集整理的5000幅图片,故名:Corel5K,可以用于科学图像实验:分类、检索等。Corel5k数据集是图像实验的事实标准数据集。请勿用于商业用途。私底下学习交流使用。Corel图像库涵盖多个主题,由若干个CD组成,每个CD包含100张大小相等的图像,可以转换成多种格式。每张CD代表一个语义主题,例如有公共汽车、恐龙、海滩等。Corel5k自从被提出用于图像标注实验后,已经成为图像实验的标准数据集,被广泛应用于标注算法性能的比较。Corel5k由50张CD组成,包含50个语义主题。

         Corel5k图像库通常被分成三个部分:4000张图像作为训练集,500张图像作为验证集用来估计模型参数,其余500张作为测试集评价算法性能。使用验证集寻找到最优模型参数后4000张训练集和500张验证集混合起来组成新的训练集。

         该图像库中的每张图片被标注1~5个标注词,训练集中总共有374个标注词,在测试集中总共使用了263个标注词。图像如下图所示,很遗憾本人也未找到官方下载路径,于是github上传了一份,下载链接为https://github.com/watersink/Corel5K


CIFARCanada Institude For Advanced Research

      CIFAR是由加拿大先进技术研究院的AlexKrizhevsky, Vinod Nair和Geoffrey Hinton收集而成的80百万小图片数据集。包含CIFAR-10和CIFAR-100两个数据集。 Cifar-10由60000张32*32的RGB彩色图片构成,共10个分类。50000张训练,10000张测试(交叉验证)。这个数据集最大的特点在于将识别迁移到了普适物体,而且应用于多分类。CIFAR-100由60000张图像构成,包含100个类别,每个类别600张图像,其中500张用于训练,100张用于测试。其中这100个类别又组成了20个大的类别,每个图像包含小类别和大类别两个标签。官网提供了Matlab,C,Python三个版本的数据格式。图像如下图所示,下载链接为http://www.cs.toronto.edu/~kriz/cifar.html


人脸数据库:

AFLWAnnotated Facial Landmarks in the Wild

       AFLW人脸数据库是一个包括多姿态、多视角的大规模人脸数据库,而且每个人脸都被标注了21个特征点。此数据库信息量非常大,包括了各种姿态、表情、光照、种族等因素影响的图片。AFLW人脸数据库大约包括25000万已手工标注的人脸图片,其中59%为女性,41%为男性,大部分的图片都是彩色,只有少部分是灰色图片。该数据库非常适合用于人脸识别、人脸测、人脸对齐等方面的究,具有很高的研究价值。图像如下图所示,需要申请帐号才可以下载,下载链接为http://lrs.icg.tugraz.at/research/aflw/

LFWLabeled Faces in the Wild

       LFW是一个用于研究无约束的人脸识别的数据库。该数据集包含了从网络收集的13000张人脸图像,每张图像都以被拍摄的人名命名。其中,有1680个人有两个或两个以上不同的照片。这些数据集唯一的限制就是它们可以被经典的Viola-Jones检测器检测到(a hummor)。图像如下图所示,下载链接为http://vis-www.cs.umass.edu/lfw/index.html#download

AFWAnnotated Faces in the Wild

       AFW数据集是使用Flickr(雅虎旗下图片分享网站)图像建立的人脸图像库,包含205个图像,其中有473个标记的人脸。对于每一个人脸都包含一个长方形边界框,6个地标和相关的姿势角度。数据库虽然不大,额外的好处是作者给出了其2012 CVPR的论文和程序以及训练好的模型。图像如下图所示,下载链接为http://www.ics.uci.edu/~xzhu/face/


FDDBFace Detection Data Set and Benchmark

       FDDB数据集主要用于约束人脸检测研究,该数据集选取野外环境中拍摄的2845个图像,从中选择5171个人脸图像。是一个被广泛使用的权威的人脸检测平台。图像如下图所示,下载链接为http://vis-www.cs.umass.edu/fddb/

WIDER FACE

   WIDER FACE是香港中文大学的一个提供更广泛人脸数据的人脸检测基准数据集,由YangShuo, Luo Ping ,Loy ,Chen Change ,Tang Xiaoou收集。它包含32203个图像和393703个人脸图像,在尺度,姿势,闭塞,表达,装扮,关照等方面表现出了大的变化。WIDER FACE是基于61个事件类别组织的,对于每一个事件类别,选取其中的40%作为训练集,10%用于交叉验证(cross validation),50%作为测试集。和PASCAL VOC数据集一样,该数据集也采用相同的指标。和MALF和Caltech数据集一样,对于测试图像并没有提供相应的背景边界框。图像如下图所示,下载链接为http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

CMU-MIT

     CMU-MIT是由卡内基梅隆大学和麻省理工学院一起收集的数据集,所有图片都是黑白的gif格式。里面包含511个闭合的人脸图像,其中130个是正面的人脸图像。图像如下图所示,没有找到官方链接,Github下载链接为 https://github.com/watersink/CMU-MIT

GENKI

         GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像,GENKI-4K包含4000个图像,分为“笑”和“不笑”两种,每个图片的人脸的尺度大小,姿势,光照变化,头的转动等都不一样,专门用于做笑脸识别。GENKI-SZSL包含3500个图像,这些图像包括广泛的背景,光照条件,地理位置,个人身份和种族等。图像如下图所示,下载链接为http://mplab.ucsd.edu,如果进不去可以,同样可以去下面的github下载,链接https://github.com/watersink/GENKI

IJB-A (IARPA JanusBenchmark A)

       IJB-A是一个用于人脸检测和识别的数据库,包含24327个图像和49759个人脸。图像如下图所示,需要邮箱申请相应帐号才可以下载,下载链接为http://www.nist.gov/itl/iad/ig/ijba_request.cfm

MALF (Multi-Attribute Labelled Faces)

       MALF是为了细粒度的评估野外环境中人脸检测模型而设计的数据库。数据主要来源于Internet,包含5250个图像,11931个人脸。每一幅图像包含正方形边界框,俯仰、蜷缩等姿势等。该数据集忽略了小于20*20的人脸,大约838个人脸,占该数据集的7%。同时,该数据集还提供了性别,是否带眼镜,是否遮挡,是否是夸张的表情等信息。图像如下图所示,需要申请才可以得到官方的下载链接,链接为 http://www.cbsr.ia.ac.cn/faceevaluation/

MegaFace

    MegaFace资料集包含一百万张图片,代表690000个独特的人。所有数据都是华盛顿大学从Flickr(雅虎旗下图片分享网站)组织收集的。这是第一个在一百万规模级别的面部识别算法测试基准。 现有脸部识别系统仍难以准确识别超过百万的数据量。为了比较现有公开脸部识别算法的准确度,华盛顿大学在去年年底开展了一个名为“MegaFace Challenge”的公开竞赛。这个项目旨在研究当数据库规模提升数个量级时,现有的脸部识别系统能否维持可靠的准确率。图像如下图所示,需要邮箱申请才可以下载,下载链接为http://megaface.cs.washington.edu/dataset/download.html

300W

       300W数据集是由AFLW,AFW,Helen,IBUG,LFPW,LFW等数据集组成的数据库。图像如下图所示,需要邮箱申请才可以下载,下载链接为 http://ibug.doc.ic.ac.uk/resources/300-W/

IMM Data Sets

       IMM人脸数据库包括了240张人脸图片和240个asf格式文件(可以用UltraEdit打开,记录了58个点的地标),共40个人(7女33男),每人6张人脸图片,每张人脸图片被标记了58个特征点。所有人都未戴眼镜,图像如下图所示,下载链接为http://www2.imm.dtu.dk/~aam/datasets/datasets.html

MUCT Data Sets

         MUCT人脸数据库由3755个人脸图像组成,每个人脸图像有76个点的地标(landmark),图片为jpg格式,地标文件包含csv,rda,shape三种格式。该图像库在种族、关照、年龄等方面表现出更大的多样性。具体图像如下图所示,下载链接为 http://www.milbo.org/muct/

ORL  (AT&T Dataset)

         ORL数据集是剑桥大学AT&T实验室收集的一个人脸数据集。包含了从1992.4到1994.4该实验室的成员。该数据集中图像分为40个不同的主题,每个主题包含10幅图像。对于其中的某些主题,图像是在不同的时间拍摄的。在关照,面部表情(张开眼睛,闭合眼睛,笑,非笑),面部细节(眼镜)等方面都变现出了差异性。所有图像都是以黑色均匀背景,并且从正面向上方向拍摄。

         其中图片都是PGM格式,图像大小为92*102,包含256个灰色通道。具体图像如下图所示,下载链接为http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html


行人检测数据库

INRIA Person Dataset

         Inria数据集是最常使用的行人检测数据集。其中正样本(行人)为png格式,负样本为jpg格式。里面的图片分为只有车,只有人,有车有人,无车无人四个类别。图片像素为70*134,96*160,64*128等。具体图像如下图所示,下载链接为http://pascal.inrialpes.fr/data/human/

CaltechPedestrian Detection Benchmark

         加州理工学院的步行数据集包含大约包含10个小时640x480 30Hz的视频。其主要是在一个在行驶在乡村街道的小车上拍摄。视频大约250000帧(在137个约分钟的长段),共有350000个边界框和2300个独特的行人进行了注释。注释包括包围盒和详细的闭塞标签之间的时间对应关系。更多信息可在其PAMI 2012 CVPR 2009标杆的论文获得。具体图像如下图所示,下载链接为http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/


MIT cbcl (center for biological and computational learning)Pedestrian Data 

         该数据集主要包含2个部分,一部分为128*64的包含924个图片的ppm格式的图片,另一部分为从打图中分别切割而出的小图,主要包含胳膊,脑袋,脚,腿,头肩,身体等。具体图像如下图所示,下载链接为http://cbcl.mit.edu/software-datasets/PedestrianData.html,需要翻墙才可以。

年龄,性别数据库

Adience

         该数据集来源为Flickr相册,由用户使用iPhone5或者其它智能手机设备拍摄,同时具有相应的公众许可。该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时,里面还进行了相应的landmark的标注。是做性别年龄估计和人脸对齐的一个数据集。图片包含2284个类别和26580张图片。具体图像如下图所示,下载链接为http://www.openu.ac.il/home/hassner/Adience/data.html#agegender

车辆数据库

KITTIKarlsruhe Institute ofTechnology and Toyota Technological Institute

         KITTI包含7481个训练图片和7518个测试图片。所有图片都是真彩色png格式。该数据集中标注了车辆的类型,是否截断,遮挡情况,角度值,2维和3维box框,位置,旋转角度,分数等重要的信息,绝对是做车载导航的不可多得的数据集。具体图像如下图所示,下载链接为http://www.cvlibs.net/datasets/kitti/

字符数据库

MNISTMixed National Instituteof Standards and Technology

         MNIST는 큰 필기 디지털 데이터베이스, 널리 사용되는 기계 학습 , 뉴욕 대학 얀 레컨 마무리 영역을 교육 및 테스트. 60,000 10,000 시험 세트를 포함 MNIST 트레이닝 세트는, 각 도면은 정규화 된 스케일 디지털 처리 센터 (28) * (28)의 크기가 고정되어있다. 아래와 같이 다운로드 링크, 이미지 상세한 http://yann.lecun.com/exdb/mnist/

게시 11 개 원래 기사 · 원의 찬양 (14) · 전망 5467

추천

출처blog.csdn.net/ssnszds/article/details/87934095