玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集

数据集介绍

Lung-PET-CT-Dx是一个公开肺癌目标检测数据集,该公共数据集源自 The Cancer Imaging Archive(TCIA)。TCIA是肿瘤研究方面的著名的医学影像公开数据库。大部分数据以 DICOM 格式存储,所有数据都经过去隐私处理。

该数据集由肺癌受试者的 CT 和 PET-CT DICOM 图像组成,带有 XML 注释文件(xml文件中用边界框标识了肿瘤位置和分类)。 这些PET/CT影像是从肺癌患者中回顾性获得的,患者均经肺活检确诊 。 根据组织病理学诊断对受试者进行分组,分为4类,“A”诊断为腺癌,“B”为小细胞癌,“E”为大细胞癌,“G”为鳞状细胞癌。

在这里插入图片描述

数据集中共有355例次的影像记录,记录了患者的CT或PET-CT的影像资料,CT图像的分辨率是512×512。

下面两张图是下载好的数据集的CT图像部分。其主要是胸部PET-CT的图像,包括了 灰度的CT图像 和 带代谢摄取增高显像的CT图像。

在这里插入图片描述

在这里插入图片描述

如何从TCIA下载数据集

(该小节可能需要特殊方式访问目标网站)

Lung-PET-CT-Dx数据集源自TCIA。TCIA是肿瘤研究方向的医学影像公开数据库。
我们可以在官网的 Access The Data → Browse Data Collection 浏览所有数据集。
在这里插入图片描述

我们可以在Filter table处,输入“lung”等关键词筛选我们需要的数据集。
在这里插入图片描述


我们输入Lung-PET-CT-Dx进入我们的目标数据集页面。
找到下面的Data Access界面。
在这里插入图片描述
Images 为我们需要下载的影像资料。
Annotation Files是目标检测的标注数据(即XML注释文件,标注了肿瘤位置和分类)。
Clinical Data是患者相关的临床资料。
下面两个可以直接下载。


第一个Image,我们点击Download,会发现下载了一个tcia文件(Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia)。
这是一个下载列表文件,需要使用网站提供的 NBIA Data Retriever 软件进行下载。

单击下面的NBIA Data Retriever,在新页面中选择 Downloading the NBIA Data Retriever,如果你是Windows系统,点击 Windows即可下载安装文件。
在这里插入图片描述

下载后打开安装文件完成安装。
安装完后直接打开软件会提示需要tcia文件。
在这里插入图片描述


我们把前面下载的 Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia 文件直接和 NBIA Data Retriever 的快捷方式放在一起。
在这里插入图片描述

然后打开 tcia文件 即可,单击Agree,即可看到下载页面了。
单击 Start,开始下载数据集(准备好半天的时间下载)。
在这里插入图片描述

下载数据集的一部分

如果觉得数据集太大了,我只想要其中的一小部分该怎么做呢?
我们回到数据集页面,在刚才的 Images 处单击 Search 按钮。
在这里插入图片描述


我们可以在这里逐条浏览数据集中的各条数据,甚至可以浏览每一张的CT图片。
对于我们想要的条目,可以单击购物车 Cart 按钮。
在这里插入图片描述


挑完后,单击Cart进入购物车页面,单击Download即可下载对应的 tcia文件。
我们把这个文件和 NBIA Data Retriever 的快捷方式放在一起,即可打开下载我们想要的数据了。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/takedachia/article/details/129840078