基于空洞全卷积网络的病理性肺组织的语义分割 论文阅读

基于空洞全卷积网络的病理性肺组织的语义分割


原文:Anthimopoulos M, Christodoulidis S, Ebner L, et al. Semantic Segmentation of Pathological Lung Tissue with Dilated Fully Convolutional Networks[J]. 2018.

学习类别:半监督


简介

针对间质性肺病(Interstitial Lung Diseases,ILDs),本文提出一种空洞全卷积网络用于辅助诊断,其输入数据可为任意大小的CT图像,输出结果为相应的标签。

  • 数据集:172个病例,其中109个病例来自Geneva University Hospital(HUG)的关于间质性肺病的公开数据集,63个病例来自Bern University Hospital-“Inselspital”(INSEL)。INSEL的数据为3D图像,而HUG的数据为2D图像且间距为10-15mm。两者的切片厚度均为1-2mm。数据集由两名经验丰富的医师标注,分类标签为6种:

    • normal
    • ground glass opacity
    • micronodules
    • consolidation
    • reticulation
    • honeycombing

    注:医师标注未标记全部数据。

    image_1cgasedhposeikjr11cdpju2m.png-45kB

    image_1cgasgi0m1h151dh3kbegqvid713.png-220.3kB

  • 训练方式:端到端、半监督。

  • 空洞卷积:在卷积核的非零值之间插入零值,从而扩大卷积核。

    image_1cg9pjkucrj31k971rcd84e4iv9.png-14.5kB

    空洞卷积解决的问题:

    • Up-sampling or pooling layer is deterministic;
    • 内部数据结构丢失;
    • 空间层级化信息丢失;
    • 小物体无法重建。

    关于空洞卷积可参考知乎回答

网络结构

网络共13层卷积层,感受野的大小为 287 287 。其中,前十层的32个卷积核大小均为 3 3 ,其空洞率分别为1,1,2,3,5,8,13,21,34和55。其中,前十层的输出与网络的输入相结合,因此特征图谱共为321,并将其作为剩余网络的输入,dropout=0.5。

空洞率基于斐波那契数列,避免网格问题。

最后三层卷积核大小为 1 1 ,输出结果由softmax函数计算出分类类别的概率。在每一卷积层后都跟随一个BN层。损失函数为交叉熵,采用Adam优化器,学习率为0.0001。

对于注释区域相对应的所有像素赋予与特定集合中其类别的样本数成反比的权重。

该方法用于解决如下问题:

  • 大部分数据未标注;
  • 标签类别分布不均。

image_1cgbfcgr11j5qligt91sfd1oge9.png-92.3kB
image_1cgbfdcfouvm25g1vdqaltk83m.png-28.9kB

半监督采用半监督聚类算法,其损失函数为:

image_1cgbfidqo1knmqjr17741nq2qvj2j.png-14.1kB

其中, y ^ 为预测标签, y 为采用独热编码(one-hot encoding)的正确标签, C 为类别数, w s i 为类别 i 在监督学习中的权重, w u 为无监督学习中的权重, α 为scaler。

在验证集上迭代50次无明显变化(明显变化为至少变化0.5%)后停止。

为避免过拟合,采用图像增强。

结果

image_1cgbgj2qp1mcdk7u1grc15lg5b330.png-57.8kB

猜你喜欢

转载自blog.csdn.net/u013058162/article/details/80735118