医学影像的特征提取--python—pyradiomics库

医学影像的特征提取

在对医学影像进行处理时,很重要的一个方面就是对于图像的特征提取。这直接关系到后续对于图像的判读,分类等操作。那么今天就为大家介绍python中一个非常高效便捷的库——pyradiomics库。

1. pyradiomics库的安装

如果你使用的是anaconda的IDE,那么可以使用cmd进行安装:在anaconda的Script文件里打开命令行(shift+右键即可):直接conda(or pip) install pyradiomics
其他情况:

  1. 确保计算机已经安装python,并且版本在2.7或者3.4以上

  2. 在https://github.com/Radiomics/pyradiomics上把项目下载下来并解压

  3. 打开cmd,并进入解压后的目录

  4. 在cmd中运行:python -m pip install -r requirements.txt(用于安装pyradiomics所需的依赖)

  5. 在cmd中运行:python setup.py install

  6. 安装完成,打开python,import radiomics,如果不报错,则表示安装成功

2.pyradiomics的使用示例

首先我给出示例文件:
链接:https://pan.baidu.com/s/1yLymOYIZ11if1J5VVHzhQg
密码:deh4
示例文件是一个大脑的CT影像序列,你可以这样理解,我们平时看到的CT图片就是其中一张,而医生看的却是由这一帧一帧图片构成的“视频”——也就是CT影像序列。
现在我们先看代码(这不是我写的,后面我会注明出处,但是我亲自检验过,并发现一些问题):

import radiomics
import radiomics.featureextractor as FEE
 
# 文件名
main_path =  '...'
ori_name = r'\brain1_image.nrrd'
lab_name = r'\brain1_label.nrrd'
para_name = r'\Params.yaml'
 
# 文件全部路径
ori_path = main_path + ori_name  
lab_path = main_path + lab_name
para_path = main_path + para_name
print("originl path: " + ori_path)
print("label path: " + lab_path)
print("parameter path: " + para_path)
 
# 使用配置文件初始化特征抽取器
extractor = FEE.RadiomicsFeaturesExtractor(para_path)
print ("Extraction parameters:\n\t", extractor.settings)
print ("Enabled filters:\n\t", extractor._enabledImagetypes)
print ("Enabled features:\n\t", extractor._enabledFeatures)
 
# 运行
result = extractor.execute(ori_path,lab_path)  #抽取特征
print ("Result type:", type(result))  # result is returned in a Python ordered dictionary
print ("")
print ("Calculated features")
for key, value in result.items():  #输出特征
    print ("\t", key, ":", value)

就以上程序说明几个问题:

  1. 就Params.yaml文件进行解释:下图是它的一部分,我们大可将其理解为一种字典结构的文件,它告诉了程序我们要输入怎样的图片,我们需要得到哪些特征。就比如如果你想就获取的特征进行自定义,完全可以在Params.yaml文件中进行修改,文件里有详细的注释,就不用我解释了:
    在这里插入图片描述
    2.之前在运行这个程序时,很多时候会报错:No label object with label 1,找遍整个程序我也没看见label 1在哪,而且这个库封装的相当完好,你根本看不出来哪里有问题。后来,在这里找到了症结所在:
    注意看这个label:1
    原来他在Params.yaml中把label写死了,我解释一下他的含义:
    我们常见的医疗图片像素值是从0~255,对于掩模,我们常用白色标记出目标位置,而黑色作为背景。白色的像素是255,而他这里却写的1,也就是说,他对医疗图片像素进行了二值化处理,白色不就是1了嘛。所以,在使用时,我们只需要把label改为我们掩模图中目标区域的像素值即可。
    在这里插入图片描述
    在这里插入图片描述
    3.关于nrrd格式的解析。nrrd和dcm格式差不多,都是医疗图像格式,他们都是有病人信息,图像信息两部分构成。这里可以告诉大家的是,我们传入该库里的函数的图像格式都必须是nrrd的(我也对此表示很烦)。
    在实际用的时候,我的数据是png格式的掩模,分开的dcm格式的CT原图。但是我们要将一个人的单个dcm转换为nrrd序列的话,他的病人信息中有一个名字大概叫做“序列信息”的家伙就至关重要了,他决定了我们dcm作为构建“视频”的前后顺序。因此,我找了一个常用的实例dcm(github上找的),进行了“换信息头”的操作,就是用别人的头,而用我的图像信息。(其实这里是因为我的dcm貌似格式和其他dcm不太一样,不能用pydicom库打开,我能说dcm这个文件标准已经改了四次了吗【手动苦笑】)
    其实,有很多人问png,jpg等常见的图片形式能不能转换为dcm,nrrd格式,那么以上不失为一种好的方法。
    以下是我的代码,仅供参考:
import numpy as np
import SimpleITK as itk
import cv2
import  matplotlib.pyplot as plt
import os
base=r'C:/Users/……/Desktop/ct_transport/dcm_'          #这一部分做好文件夹的准备
i=1
while(i<21):
    file_name=base+str(i)
    os.mkdir(file_name)
    i=i+1
for i in range(20):                   #以下是对每一个人进行循环,达到一人png全部转为dcm后再转为nrrd格式;
    in_path=r'C:/Users/……/Desktop/ABC/%d/png/'%(i+1109)
    x=0
    for s in os.listdir(in_path):       #对每一个人的png进行循环,转换为dcm(换信息头)
        in_path_per = os.path.join(in_path,s)
        print(in_path_per)
        img = cv2.imread(in_path_per)
        # in_path_dcm=r'C:\Users\……\Desktop\CT\10080.dcm'
        data2=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        ds = pydicom.dcmread(r"liver\image_%d"%x)
        ds.PixelData = data2.tostring()

        #ds.Rows, ds.Columns = data2.shape
        # data1 = ds.pixel_array
        # plt.imshow(data1, "gray")
        #  plt.show()
        out_path='C:/Users/……/Desktop/ct_transport/dcm_%d/%d.dcm'%(i+1,x+1)#这个应该是每一个人的每一个图片,外面用i区别表示,里面用x区别表示;
        ds.save_as(out_path)
        x=x+1
    in_path_dcm = r'C:/Users/……/Desktop/ct_transport/dcm_%d'%(i+1)
    series_file_names = itk.ImageSeriesReader().GetGDCMSeriesFileNames(in_path_dcm)
    # series_file_names=sitk.ImageSeriesReader.GetGDCMSeriesFileNames(in_path,series_ids[1])
    #print(tuple(list(series_file_names)[::-1]))
    series_reader = itk.ImageSeriesReader()
    series_reader.SetFileNames(series_file_names)
    image3D = series_reader.Execute()

    itk.WriteImage(image3D, 'C:/Users/……/Desktop/ct_test_nrrd/mask_%d.nrrd'%(i+1))#以一个人为单位,进行了存储
    print('完成一个人')

4.输出格式
输出就是一个字典结构,但是,要注意有很多是无关信息,比如库的版本等,这是大家用的时候可以做一些筛选。其实他的特征也都是3D特征。

以下就是我使用其代码的兄弟的公众号,在此向他表示感谢,也欢迎大家关注!
在这里插入图片描述

发布了9 篇原创文章 · 获赞 4 · 访问量 1922

猜你喜欢

转载自blog.csdn.net/weixin_43038752/article/details/90105417
今日推荐