医学影像的特征提取--python—pyradiomics库

医学影像的特征提取

在对医学影像进行处理时，很重要的一个方面就是对于图像的特征提取。这直接关系到后续对于图像的判读，分类等操作。那么今天就为大家介绍python中一个非常高效便捷的库——pyradiomics库。

1. pyradiomics库的安装

如果你使用的是anaconda的IDE，那么可以使用cmd进行安装：在anaconda的Script文件里打开命令行（shift+右键即可）：直接conda(or pip) install pyradiomics
其他情况：

确保计算机已经安装python，并且版本在2.7或者3.4以上
在https://github.com/Radiomics/pyradiomics上把项目下载下来并解压
打开cmd，并进入解压后的目录
在cmd中运行：python -m pip install -r requirements.txt（用于安装pyradiomics所需的依赖）
在cmd中运行：python setup.py install
安装完成，打开python，import radiomics，如果不报错，则表示安装成功

2.pyradiomics的使用示例

首先我给出示例文件：
链接：https://pan.baidu.com/s/1yLymOYIZ11if1J5VVHzhQg
密码：deh4
示例文件是一个大脑的CT影像序列，你可以这样理解，我们平时看到的CT图片就是其中一张，而医生看的却是由这一帧一帧图片构成的“视频”——也就是CT影像序列。
现在我们先看代码（这不是我写的，后面我会注明出处，但是我亲自检验过，并发现一些问题）：

import radiomics
import radiomics.featureextractor as FEE
 
# 文件名
main_path =  '...'
ori_name = r'\brain1_image.nrrd'
lab_name = r'\brain1_label.nrrd'
para_name = r'\Params.yaml'
 
# 文件全部路径
ori_path = main_path + ori_name  
lab_path = main_path + lab_name
para_path = main_path + para_name
print("originl path: " + ori_path)
print("label path: " + lab_path)
print("parameter path: " + para_path)
 
# 使用配置文件初始化特征抽取器
extractor = FEE.RadiomicsFeaturesExtractor(para_path)
print ("Extraction parameters:\n\t", extractor.settings)
print ("Enabled filters:\n\t", extractor._enabledImagetypes)
print ("Enabled features:\n\t", extractor._enabledFeatures)
 
# 运行
result = extractor.execute(ori_path,lab_path)  #抽取特征
print ("Result type:", type(result))  # result is returned in a Python ordered dictionary
print ("")
print ("Calculated features")
for key, value in result.items():  #输出特征
    print ("\t", key, ":", value)

就以上程序说明几个问题：

就Params.yaml文件进行解释：下图是它的一部分，我们大可将其理解为一种字典结构的文件，它告诉了程序我们要输入怎样的图片，我们需要得到哪些特征。就比如如果你想就获取的特征进行自定义，完全可以在Params.yaml文件中进行修改，文件里有详细的注释，就不用我解释了：

2.之前在运行这个程序时，很多时候会报错：No label object with label 1，找遍整个程序我也没看见label 1在哪，而且这个库封装的相当完好，你根本看不出来哪里有问题。后来，在这里找到了症结所在：

原来他在Params.yaml中把label写死了，我解释一下他的含义：
我们常见的医疗图片像素值是从0~255，对于掩模，我们常用白色标记出目标位置，而黑色作为背景。白色的像素是255，而他这里却写的1，也就是说，他对医疗图片像素进行了二值化处理，白色不就是1了嘛。所以，在使用时，我们只需要把label改为我们掩模图中目标区域的像素值即可。

3.关于nrrd格式的解析。nrrd和dcm格式差不多，都是医疗图像格式，他们都是有病人信息，图像信息两部分构成。这里可以告诉大家的是，我们传入该库里的函数的图像格式都必须是nrrd的（我也对此表示很烦）。
在实际用的时候，我的数据是png格式的掩模，分开的dcm格式的CT原图。但是我们要将一个人的单个dcm转换为nrrd序列的话，他的病人信息中有一个名字大概叫做“序列信息”的家伙就至关重要了，他决定了我们dcm作为构建“视频”的前后顺序。因此，我找了一个常用的实例dcm（github上找的），进行了“换信息头”的操作，就是用别人的头，而用我的图像信息。（其实这里是因为我的dcm貌似格式和其他dcm不太一样，不能用pydicom库打开，我能说dcm这个文件标准已经改了四次了吗【手动苦笑】）
其实，有很多人问png，jpg等常见的图片形式能不能转换为dcm，nrrd格式，那么以上不失为一种好的方法。
以下是我的代码，仅供参考：

import numpy as np
import SimpleITK as itk
import cv2
import  matplotlib.pyplot as plt
import os
base=r'C:/Users/……/Desktop/ct_transport/dcm_'          #这一部分做好文件夹的准备
i=1
while(i<21):
    file_name=base+str(i)
    os.mkdir(file_name)
    i=i+1
for i in range(20):                   #以下是对每一个人进行循环，达到一人png全部转为dcm后再转为nrrd格式；
    in_path=r'C:/Users/……/Desktop/ABC/%d/png/'%(i+1109)
    x=0
    for s in os.listdir(in_path):       #对每一个人的png进行循环，转换为dcm（换信息头）
        in_path_per = os.path.join(in_path,s)
        print(in_path_per)
        img = cv2.imread(in_path_per)
        # in_path_dcm=r'C:\Users\……\Desktop\CT\10080.dcm'
        data2=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        ds = pydicom.dcmread(r"liver\image_%d"%x)
        ds.PixelData = data2.tostring()

        #ds.Rows, ds.Columns = data2.shape
        # data1 = ds.pixel_array
        # plt.imshow(data1, "gray")
        #  plt.show()
        out_path='C:/Users/……/Desktop/ct_transport/dcm_%d/%d.dcm'%(i+1,x+1)#这个应该是每一个人的每一个图片，外面用i区别表示，里面用x区别表示；
        ds.save_as(out_path)
        x=x+1
    in_path_dcm = r'C:/Users/……/Desktop/ct_transport/dcm_%d'%(i+1)
    series_file_names = itk.ImageSeriesReader().GetGDCMSeriesFileNames(in_path_dcm)
    # series_file_names=sitk.ImageSeriesReader.GetGDCMSeriesFileNames(in_path,series_ids[1])
    #print(tuple(list(series_file_names)[::-1]))
    series_reader = itk.ImageSeriesReader()
    series_reader.SetFileNames(series_file_names)
    image3D = series_reader.Execute()

    itk.WriteImage(image3D, 'C:/Users/……/Desktop/ct_test_nrrd/mask_%d.nrrd'%(i+1))#以一个人为单位，进行了存储
    print('完成一个人')

4.输出格式
输出就是一个字典结构，但是，要注意有很多是无关信息，比如库的版本等，这是大家用的时候可以做一些筛选。其实他的特征也都是3D特征。

以下就是我使用其代码的兄弟的公众号，在此向他表示感谢，也欢迎大家关注！
在这里插入图片描述

weixin_43038752

发布了9 篇原创文章 · 获赞 4 · 访问量 1922

私信关注