title

1. 杜克大学数据(DukeMTMC-reID)

DukeMTMC 数据集是一个大规模标记的多目标多摄像机行人跟踪数据集。它提供了一个由 8 个同步摄像机记录的新型大型高清视频数据集，具有 7,000 多个单摄像机轨迹和超过 2,700 多个独立人物，DukeMTMC-reID 是 DukeMTMC 数据集的行人重识别子集，并且提供了人工标注的bounding box。

目录结构

DukeMTMC-reID
　　├── bounding_box_test
　　　　　　　├── 0002_c1_f0044158.jpg
　　　　　　　├── 3761_c6_f0183709.jpg
　　　　　　　├── 7139_c2_f0160815.jpg
　　├── bounding_box_train
　　　　　　　├── 0001_c2_f0046182.jpg
　　　　　　　├── 0008_c3_f0026318.jpg
　　　　　　　├── 7140_c4_f0175988.jpg
　　├── query
　　　　　　　├── 0005_c2_f0046985.jpg
　　　　　　　├── 0023_c4_f0031504.jpg
　　　　　　　├── 7139_c2_f0160575.jpg
　　└── CITATION_DukeMTMC.txt
　　└── CITATION_DukeMTMC-reID.txt
　　└── LICENSE_DukeMTMC.txt
　　└── LICENSE_DukeMTMC-reID.txt
　　└── README.md

目录介绍

从视频中每 120 帧采样一张图像，得到了 36,411 张图像。一共有 1,404个人出现在大于两个摄像头下，有 408 个人 (distractor ID) 只出现在一个摄像头下。

1） “bounding_box_test”——用于测试集的 702 人，包含 17,661 张图像（随机采样，702 ID + 408 distractor ID）
2） “bounding_box_train”——用于训练集的 702 人，包含 16,522 张图像（随机采样）
3） “query”——为测试集中的 702 人在每个摄像头中随机选择一张图像作为 query，共有 2,228 张图像

DukeMTMC-attribute数据集标注

title
---------------------

2. 清华大学Market-1501

　Market-1501 数据集在清华大学校园中采集，夏天拍摄，在 2015 年构建并公开。它包括由6个摄像头（其中5个高清摄像头和1个低清摄像头）拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到，并且在一个摄像头中可能具有多张图像。训练集有 751 人，包含 12,936 张图像，平均每个人有 17.2 张训练数据；测试集有 750 人，包含 19,732 张图像，平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的，而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

2.1 数据集简介

2.2 目录结构

Market-1501
　　├── bounding_box_test
　　　　　　　├── 0000_c1s1_000151_01.jpg
　　　　　　　├── 0000_c1s1_000376_03.jpg
　　　　　　　├── 0000_c1s1_001051_02.jpg
　　├── bounding_box_train
　　　　　　　├── 0002_c1s1_000451_03.jpg
　　　　　　　├── 0002_c1s1_000551_01.jpg
　　　　　　　├── 0002_c1s1_000801_01.jpg
　　├── gt_bbox
　　　　　　　├── 0001_c1s1_001051_00.jpg
　　　　　　　├── 0001_c1s1_009376_00.jpg
　　　　　　　├── 0001_c2s1_001976_00.jpg
　　├── gt_query
　　　　　　　├── 0001_c1s1_001051_00_good.mat
　　　　　　　├── 0001_c1s1_001051_00_junk.mat
　　├── query
　　　　　　　├── 0001_c1s1_001051_00.jpg
　　　　　　　├── 0001_c2s1_000301_00.jpg
　　　　　　　├── 0001_c3s1_000551_00.jpg
　　└── readme.txt

2.3 目录介绍

1） “bounding_box_test”——用于测试集的 750 人，包含 19,732 张图像，前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图（可能与query是同一个人），-1 表示检测出来其他人的图（不在这 750 人中）
2） “bounding_box_train”——用于训练集的 751 人，包含 12,936 张图像
3） “query”——为 750 人在每个摄像头中随机选择一张图像作为query，因此一个人的query最多有 6 个，共有 3,368 张图像
4） “gt_query”——matlab格式，用于判断一个query的哪些图片是好的匹配（同一个人不同摄像头的图像）和不好的匹配（同一个人同一个摄像头的图像或非同一个人的图像）
5） “gt_bbox”——手工标注的bounding box，用于判断DPM检测的bounding box是不是一个好的box

2.4 命名规则

以 0001_c1s1_000151_01.jpg 为例:
1） 0001 表示每个人的标签编号，从0001到1501；
2） c1 表示第一个摄像头(camera1)，共有6个摄像头；
3） s1 表示第一个录像片段(sequece1)，每个摄像机都有数个录像段；
4） 000151 表示 c1s1 的第000151帧图片，视频帧率25fps；
5） 01 表示 c1s1_001051 这一帧上的第1个检测框，由于采用DPM检测器，对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

Market-1501_Attribute数据集属性标注

title
---------------------

3. 香港中文大学CUHK03

3.1 数据集简介

CUHK03是第一个足以进行深度学习的大规模行人重识别数据集，该数据集的图像采集于香港中文大学（CUHK）校园。数据以”cuhk-03.mat”的 MAT 文件格式存储，含有 1467 个不同的人物，由 5 对摄像头采集。

3.2 目录结构

CUHK-03
　　├── “detected”── 5 x 1 cell
　　　　　　　├── 843x10 cell
　　　　　　　├── 440x10 cell
　　　　　　　├── 77x10 cell
　　　　　　　├── 58x10 cell
　　　　　　　├── 49x10 cell
　　├── “labeled”── 5 x 1 cell
　　　　　　　├── 843x10 cell
　　　　　　　├── 440x10 cell
　　　　　　　├── 77x10 cell
　　　　　　　├── 58x10 cell
　　　　　　　├── 49x10 cell
　　├── “testsets”── 20 x 1 cell
　　　　　　　├── 100 x 2 double matrix

3.3 目录介绍

（1）”detected”—— 5 x 1 cells，由机器标注，每个 cell 中包含一对摄像头组采集的照片，如下所示：
　　每个摄像头组由 M x 10 cells 组成，M 为行人索引，前 5 列和后 5 列分别来自同一组的不同摄像头。
　　cell 内每个元素为一幅 H x W x 3 的行人框图像(uint8 数据类型)，个别图像可能空缺，为空集。
843x10 cell ——> 摄像头组pair 1。
440x10 cell ——> 摄像头组pair 2。
77x10 cell ——> 摄像头组pair 3。
58x10 cell ——> 摄像头组pair 4。
49x10 cell ——> 摄像头组pair 5
（2）”labeled”—— 5 x 1 cells，行人框由人工标注，格式和内容和”detected”相同。
（3）”testsets”—— 20 x 1 cells，测试协议，由 20 个 100 x 2 double 类型矩阵组成 (重复二十次)。
　　100 x 2 double，100 行代表 100 个测试样本，第 1 列为摄像头 pair 索引，第 2 列为行人索引。
--------------------------
--------------------------

匹配情况