Radon Inversion via Deep Learning

通过深度学习的Radon逆变换

论文地址:https://ieeexplore.ieee.org/document/8950464/

项目地址:https://github.com/hejipro

Abstract

Radon变换广泛应用于物理和生命科学,其主要应用之一是医学X射线计算机断层扫描(CT),这在疾病筛查和诊断中具有重要意义。在本文中,我们提出了一种新的利用深度学习(DL)技术进行Radon逆变换的重建框架。为了简单起见,所提出的框架被表示为iRadonMAP,即Radon逆变换近似。具体来说,我们构建了一个包含三个专用组件的可解释神经网络。第一个分量是正弦图域中沿旋转角方向的全连接滤波(FCF)层,第二个分量是正弦波反投影(SBP)层,它将滤波后的正弦图数据反投影到空间域中。接下来,增加了一个通用的网络结构,以进一步提高整体性能。iRadonMAP首先在ImageNet数据库中的大量通用图像上进行预训练,然后根据临床患者数据进行微调。实验结果证明了所提出的iRadonMAP框架用于Radon逆变换的可行性。

I. INTRODUCTION

在1917年,奥地利的Johann Radon发展了Radon变换理论[1],由于其在不造成侵入性损伤的情况下获得物体内部结构的优势,该理论后来在各种应用中得到了应用。具体来说,Radon变换最重要的应用之一是医用X射线计算机断层扫描(CT)[2],[3],由于其在疾病筛查和诊断方面的巨大优势,它是现代医院和诊所不可或缺的成像方式。

在医学X射线CT扫描中,通过求解逆问题来获得患者内部解剖结构的过程被称为Radon逆变换,或者更一般地说,图像重建[4]。在Radon逆变换或所谓的图像重建算法中,应该适当考虑两个主要问题。第一个问题是有希望的重建性能,第二个问题是重建速度快。目前,Radon逆变换最广泛使用的方法是滤波反投影(FBP)算法[5]。尽管FBP算法的重建速度很快,但由于低剂量CT(LDCT)成像中正弦图数据不足和/或退化,重建性能将显著降低,这是临床常规中减少患者辐射暴露的常见策略[6]。

基于模型的迭代重建(MBIR)算法包括Radon逆变换方法的另一个主要分支。使用MBIR方法,如果可以将一些精心设计的先验知识/正则化纳入MBIR框架中,并且可以仔细调整相应的超参数,则可以获得比FBP算法更有前景的重建。MBIR方法的流行先验包括基于总变异(TV)[7]、[8]、非局部补丁[9]、字典学习[10]和稀疏化变换学习[11]、[12]的先验。然而,选择适当的先验知识和超参数并不是一项容易的任务[13],[14]。更重要的是,由于优化过程中涉及多个前向和后向投影,MBIR方法的重建速度将比FBP方法慢得多。

为了平衡有希望的重建性能和快速重建速度之间的权衡,在过去的几十年里,人们提出了各种算法。例如,Zeng等人提出,通过简单的数学推导[15],[16],可以将具有二次惩罚项的特定MBIR模型的迭代解重新公式化为具有特定截止频率的窗口FBP算法。因此,这种FBP算法的重建性能可以与MBIR模型的重建性能同等有希望,同时相应的重建速度要快得多。然而,对于大多数惩罚项更复杂的MBIR模型,通过简单的数学推导找到相应的FBP算法可能非常困难。

在过去的几年里,基于深度学习(DL)的技术由于其出色的端到端学习能力,已被广泛应用于计算机视觉和自然语言处理领域。在这些领域取得的有希望的性能也激发了医学图像处理应用中许多有趣的工作,包括Radon逆变换[17],[18]。一方面,基于DL的技术可以与MBIR方法相结合。例如,基于DL技术的各种正则化,如卷积神经网络(CNN)和自编码器(AE),已经被提出用于MBIR框架,并且已经实现了有希望的重建性能[19],[20]。另一种选择是将MBIR方法的优化过程展开到N个阶段网络,该网络经过端到端训练,以平衡重建性能和速度之间的权衡[21]-[23]。尽管如此,这些策略的计算成本仍然远高于FBP算法的计算成本。另一方面,基于DL的技术也可以与FBP方法相结合。这一类别的一个例子包括Würfl等人[24]提出的工作。他们提出学习FBP方法的投影域权重,这可以很好地平衡重建性能和速度之间的权衡。然而,该算法只展示了学习投影域权重的优势,而没有展示学习FBP方法中其他组件的优势,例如斜坡滤波和反投影操作。

最近,Zhu等人[25]提出了一种统一的图像重建框架,称为流形近似自变换(即AUTOMAP)。AUTOMAP是用神经网络架构实现的,该架构将图像重建问题重新定义为数据驱动的监督学习任务,从而实现端到端的重建,而不是用多个自组织阶段近似逆函数。这种算法由于其强大而紧凑的网络结构,在实现有希望的Radon逆变换重建性能和快速重建速度方面具有巨大的潜力。然而,由于AUTOMAP采用了几个堆叠的完全连接层来近似从传感器到空间域的流形之间的投影,因此当针对较大维度训练AUTOMAP模型时,计算负担将呈指数级增加。此外,Li等人[26]提出了一种类似的端到端重建网络,命名为iCT-Net,用于Radon逆变换,并在各种数据采集条件下展示了其优势。

在本文中,我们提出了一个可解释的医用X射线CT中Radon逆变换框架。为了简单起见,所提出的Radon逆变换框架表示为iRadonMAP,即Radon逆变换近似。iRadonMAP中也采用了基于DL的技术。具体而言,iRadonMAP的架构类似于包含图像后处理步骤的FBP算法。使用iRadonMAP,有希望的重建性能可以从适当的训练数据语料库中得出,而不是从先验知识的精心选择和专家超参数调整中得出;此外,可以在不涉及多次耗时的前向和后向投影的情况下实现快速重建速度。为了评估iRadonMAP的性能,使用了临床患者数据。实验结果表明,利用所提出的iRadonMAP框架可以实现有希望的Radon逆变换重建能力。

II. PROPOSED INVERSE RADON TRANSFORM APPROXIMATION

在这里插入图片描述

我们提出了一种可解释的网络架构,命名为iRadonMAP,用于医学X射线CT中的Radon逆变换。iRadonMAP的整体架构如图1所示。与包含图像后处理步骤的FBP算法的重建范式类似,我们为iRadonMAP构建了三个专用组件。第一个组件是全连接滤波(FCF)层,第二个组件是正弦反投影(SBP)层,而第三个组件是公共网络结构。具体地,首先使用FCF层沿着旋转角度方向对正弦图进行滤波,之后使用SBP层对滤波后的正弦图进行反投影。随后,通过在SBP层之后添加公共网络结构来进一步增强反投影图像,以提高iRadonMAP的整体性能。

在下文中,我们首先回顾了Radon变换的理论和相应的逆变换方法。然后,我们通过将Radon逆变换的传统重建链映射到可解释的神经网络架构中,推导出iRadonMAP框架。

A. Theory Review

在不失一般性的情况下,本工作中讨论的Radon变换指的是平行光束成像几何中的变换。扇束和锥形束的情况可以类似地推导出来。从数学上讲,任意二维物体 f ( x , y ) f(x,y) f(x,y)的平行光束成像几何结构的Radon变换可以写成如下[4]:
p ( s , θ ) = ∫ − ∞ ∞ ∫ − ∞ ∞ f ( x , y ) δ ( x cos ⁡ θ + y sin ⁡ θ − s ) d x d y (1) p(s, \theta)=\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x, y) \delta(x \cos \theta+y \sin \theta-s) d x d y \tag{1} p(s,θ)=f(x,y)δ(xcosθ+ysinθs)dxdy(1)
这里, p ( s , θ ) p(s, \theta) p(s,θ)表示物体 f ( x , y ) f(x, y) f(x,y)的Radon投影,其中 s s s是detector bin的位置, θ \theta θ是X射线管的旋转角。 δ ( ⋅ ) \delta(\cdot) δ()是一个狄拉克函数。所有Radond投影构建正弦图数据。Radon变换的直观图示如图2所示。

在这里插入图片描述

为了便于推导,公式(1)中的连续Radon变换首先离散化如下:
p = A μ (2) p=A \mu \tag{2} p=Aμ(2)
这里, p ∈ R N ⋅ M p \in \mathbb{R}^{N \cdot M} pRNM表示离散正弦图数据,其中 N N N是detector bin的数量, M M M是旋转角度的数量。 μ ∈ R J \mu \in \mathbb{R}^J μRJ表示要重建的离散化对象,其中 J J J是重建中的像素数。 A ∈ R N ⋅ M × J A \in \mathbb{R}^{N \cdot M \times J} ARNM×J表示正向投影模型。因此,Radon逆变换问题等效于最小二乘最小化,如下所示:
L ( μ ) = arg ⁡ min ⁡ μ 1 2 ∥ A μ − p ∥ 2 2 (3) \mathcal{L}(\mu)=\underset{\mu}{\arg \min } \frac{1}{2}\|A \mu-p\|_2^2 \tag{3} L(μ)=μargmin21Aμp22(3)
公式(3)的理论解可以通过允许 L ( μ ) \mathcal{L}(\mu) L(μ)相对于 μ \mu μ的梯度消失来获得,即 δ L ( μ ) δ μ = 0 \frac{\delta \mathcal{L}(\mu)}{\delta \mu}=0 δμδL(μ)=0,可以写如下:
μ ∗ = ( A T A ) − 1 A T p (4) \mu^*=\left(A^T A\right)^{-1} A^T p \tag{4} μ=(ATA)1ATp(4)
公式(4)的重建过程实际上遵循“反投影,然后滤波”的形式,可以通过一些必要的数学推导将其重写为FBP(即“滤波,然后反投影”)算法[4]。这里, ( A A T ) − 1 \left(A A^T\right)^{-1} (AAT)1对应于FBP算法中的理想斜坡滤波器。 A T A^T AT是一个反投影矩阵。此外,为了进一步提高CT重建的图像质量,通常采用图像后处理技术。这些技术的例子包括双边滤波器[27]、非局部均值滤波器[28]和基于补丁的恢复方法[29]。

总之,Radon逆变换的传统重建链可以通过三个步骤构建,即滤波操作、反投影操作和图像后处理操作。在下一节中,我们将这三个步骤映射到一个名为iRadonMAP的可解释神经网络中的三个组件中,以实现有希望的重建性能和快速的重建速度。

B. Network Architecture

在FBP算法中,将斜坡滤波器应用于沿旋转角度方向逐视图的一维傅立叶域视图中的正弦图数据,之后通过傅里叶逆变换获得滤波后的正弦图。等效地,斜坡滤波器也可以直接实现为正弦图数据上的单个一维卷积算子,而无需傅立叶变换。因此,我们可以直观地将iRadonMAP框架中的滤波操作实现为一维卷积层。然而,考虑到滤波操作的可能复杂性,需要更灵活的结构。在iRadonMAP中,过滤操作采用了全连接技术。具体地,滤波操作被实现为沿着旋转角方向的FCF层,其尺寸等于detector bin的尺寸。FCF层表示为 F η F_{\eta} Fη,其数学表达式如下:

p ^ ( k , m ) = tanh ⁡ ( ∑ n = 1 N η k n ⋅ p ( n , m ) ) (5) \hat{p}(k, m)=\tanh \left(\sum_{n=1}^N \eta_{k n} \cdot p(n, m)\right) \tag{5} p^(k,m)=tanh(n=1Nηknp(n,m))(5)
这里, η \eta η是参数。 p ^ \hat{p} p^是经滤波的正弦图。 k k k n n n是detector bin的索引, m m m是旋转角度的索引。 tanh ⁡ ( ⋅ ) \tanh (\cdot) tanh()是一种常用的激活函数,用于加速网络训练[30]。此外,几个FCF层,例如 T T T层,可以堆叠在一起以增强过滤操作。

FCF层的输出被称为滤波正弦图,需要将其反向投影到空间域中。反投影操作直观地被视为反投影矩阵 A T A^T AT和滤波正弦图 p ^ \hat{p} p^之间的矩阵乘法,这可以用全连接技术直接实现。然而,当正弦图数据和目标重建都具有大的维度时,在相应的完全连接层中将涉及极其大量的参数,这消除了训练这样的模型的可能性。此外,当考虑正弦图和目标重建之间的几何关系时,全连接技术对于Radon逆变换是不太合理的。事实上,对应于空间域中某个位置 ( i , j ) (i, j) (i,j)的Radon投影在正弦图数据中形成正弦曲线,如图2所示。因此,我们提出了一个SBP层,表示为 B γ B_\gamma Bγ,用于反投影滤波正弦图。所提出的SBP层的数学表达式如下所示:
μ ( i , j ) = ∑ m = 1 M γ i j m ⋅ p ^ ( n , m ) ∣ n = I N T [ i cos ⁡ θ m + j sin ⁡ θ m ] . (6) \mu(i, j)=\left.\sum_{m=1}^M \gamma_{i j m} \cdot \hat{p}(n, m)\right|_{n=I N T\left[i \cos \theta_m+j \sin \theta_m\right] .} \tag{6} μ(i,j)=m=1Mγijmp^(n,m) n=INT[icosθm+jsinθm].(6)
这里, γ \gamma γ是参数。 i , j i, j i,j是空间域中的索引。 θ m \theta_m θm表示正弦图数据中第m个矢量的相应旋转角度。INT表示最近邻插值,表达式 n = I N T [ i cos ⁡ θ m + j sin ⁡ θ m ] n=I N T\left[i \cos \theta_m+j \sin \theta_m\right] n=INT[icosθm+jsinθm]确定了正弦图数据中关于空间域中某个位置 ( i , j ) (i, j) (i,j)的正弦曲线。值得注意的是,如果参数 γ \gamma γ为设置为 π M \frac{\pi}{M} Mπ,我们得到了传统反投影运算的简化版本,如下所示:
μ ( i , j ) = π M ∑ m = 1 M p ^ ( n , m ) ∣ n = I N T [ i cos ⁡ θ m + j sin ⁡ θ m ] . (7) \mu(i, j)=\left.\frac{\pi}{M} \sum_{m=1}^M \hat{p}(n, m)\right|_{n=I N T\left[i \cos \theta_m+j \sin \theta_m\right] .} \tag{7} μ(i,j)=Mπm=1Mp^(n,m) n=INT[icosθm+jsinθm].(7)
可以看出,公式(7)中定义的简化后投影(SPBP)是公式(6)中定义的SBP层的特殊情况。因此,SBP层在并入iRadonMAP框架时比SPBP更灵活。

此外,为了进一步提高iRadonMAP的整体性能,在SBP层之后增加了一个通用的网络结构。已经提出了各种CNN结构来增强退化输入的图像质量。这些网络结构包括通用图像去噪器DnCNN[31]和CT图像去噪符RED-CNN[32]。在这项工作中,残差CNN(rNN)因其在网络训练中的优异性能而被采用[33],[34]。与上述仅在空间域中训练的去噪器不同,用于iRadonMAP的rCNN与从正弦图域到空间域的FCF和SBP层一起端到端地训练。一般来说,rCNN可以写如下:
μ ∗ = r CNN ⁡ ζ ( μ ) . (8) \mu^*=r \operatorname{CNN}_\zeta(\mu) . \tag{8} μ=rCNNζ(μ).(8)
这里, ξ \xi ξ 是rCNN中的参数。 r C N N \mathrm{rCNN} rCNN由L个块构成。第一个块的形式为’Conv.+GN+ReLU’,其中Conv.表示卷积运算,GN表示群归一化[35],ReLU表示线性整流函数[36]。从第二个块到第(L−1)个块,有一堆残差块,其结构是两个’Conv. + ReLU’的组合,其中包含捷径技术。与K.He等人[33]提出的工作类似,所采用的捷径技术执行恒等映射,即 F ( x ) + x \mathcal{F}(x)+x F(x)+x,其中 x x x表示残差块的输入, F ( ⋅ ) \mathcal{F}(\cdot) F()表示卷积层的堆栈,即在我们的工作中的’Conv.+ReLU+Conv.'。最后一个块只是一个卷积层。所有的卷积运算都有64个核,大小为 3 × 3 3 \times 3 3×3。需要注意的是,rCNN并不是所提出的iRadonMAP框架的唯一选项。

总之,iRadonMAP的重建格式如下所示:
μ ∗ = r C N N ζ ( B η F η p ) (9) \mu^*=r C N N_\zeta\left(B_\eta F_\eta p\right) \tag{9} μ=rCNNζ(BηFηp)(9)
iRadonMAP的整体网络架构如图1所示。

III. EXPERIMENTAL SETUP

A. Pretraining Datase

为了收集足够多样的特征模式来训练iRadonMAP模型,对从ImageNet中提取的大量通用图像进行了组装,以构建预训练数据集[37]。采用ImageNet数据作为iRadonMAP的预训练数据集的目的是学习从正弦图域到空间域的映射。这些图像的大小各不相同,大多数与512×512相当,例如500×366、373×500和480×500。这些图像的类别包括各种动物、植物、不同的人物场景和风景。为了更直观地理解,我们在图3中显示了一些示例。

在这里插入图片描述

在这项工作中,收集了62899张RGB彩色图像,并通过旋转和翻转进行了8次增强,总共得到503192张图像。与[25]类似,提取每个RGB彩色图像的Y通道亮度以形成灰度强度图像,并进一步裁剪/填充到中心512×512像素。此外,减去每个图像的平均强度,然后将图像归一化为整个数据集的最大强度。根据具有平行光束成像几何结构的Radon变换理论,模拟了每个图像的正弦图数据。具体而言,模拟成像参数定义如下:采用具有736个平行X射线束的模拟投影仪(即detector bins),模拟投影均匀分布在[0,180]度。假设两个相邻图像像素和两个相邻detector bin之间的间距均为1 mm。我们模拟了每个图像具有不同投影数(即290、145和100视图)的几个正弦图。值得注意的是,我们工作中采用的所有正弦图都是对数变换的。所有模拟均使用ASTRA工具箱[38]进行。

B. Fine-Tuning Datasets

iRadonMAP模型的微调数据集由梅奥诊所提供并授权的临床患者数据组成[39]。采用临床数据作为iRadonMAP的微调数据集的目的是确保CT衰减系数的准确性。Mayo数据包括来自10名不同患者的原始投影数据和FBP重建图像,这些患者在正常剂量(即120 kVp和200有效mAs)辐射下从胸部扫描到腹部。总共包括5351个图像切片。这些数据是用以下成像参数获取的:X射线源沿着螺旋轨道旋转,每360度有1152个扇束视图;detector bin的数量为736个,并且两个相邻仓之间的空间为1.0947mm;从X射线源到探测器阵列的距离为1085.6mm,从X射线光源到旋转中心的距离为595mm;重建的尺寸为512×512,体素大小为0.6640 mm。梅奥诊所还提供了原始的四分之一剂量数据,这些数据是通过将泊松噪声和高斯电子噪声添加到相应的正态剂量数据中来模拟的[40]。三个微调数据集,即无噪声,稀疏视图和噪声微调数据集是根据9名患者的数据(即4791张图像)构建的。

1) 无噪声和稀疏视图微调数据集:提取正常剂量FBP重建图像,构建无噪声和稀视图微调数据集中。为了增加微调数据集,还使用了矢状面和冠状面图像切片。每个图像首先被对称拼接,以创建一个更大的图像,其中包含原始图像的四个反射,然后裁剪成随机的512×512截面。然后,类似于预训练数据集对裁剪的切片进行归一化,但使用固定的平均强度和最大强度来获取,从而可以在重建后恢复CT衰减系数。然后,使用与预训练数据集相同的平行光束成像几何结构,从裁剪的截面模拟具有290、145和100个视图的正弦图。

2) 噪声微调数据集:为了构建噪声微调数据集中,首先将Mayo提供的原始四分之一剂量数据重新绑定到平行波束成像几何结构中[41],这导致了大小为576×736的重新绑定正弦图数据。通过下采样进一步调整重新绑定的四分之一剂量正弦图的大小,以适应预训练的模型,该模型接收大小为290×736的输入。然后,用FBP方法重建调整大小后的四分之一剂量数据。为了增强数据集,将与无噪声和稀疏视图情况下类似的策略应用于这些四分之一剂量FBP重建图像,以生成有噪声的微调数据集。值得注意的是,调整大小的四分之一剂量数据的检测器像素大小和重建体素大小分别为1.0947mm和0.6640mm。在微调之前,对模拟过程的相应成像参数和预训练的iRadonMAP模型的成像参数进行了相应的调整。

C. Testing Datasets

Mayo数据中的最后一位患者被用于测试,图像切片的数量为560。我们评估了用上述三个微调数据集获得的三个iRadonMAP模型的重建性能,其中我们将三个iRedonMAP模型分别称为无噪声、稀疏和有噪声的iRadonMAP模型。无噪声和稀疏视图iRadonMAP模型的测试正弦图是从正常剂量图像中模拟的,而有噪声iRadonMAP模型的测试正弦波是从原始正常剂量投影数据中模拟的。这三个iRadonMAP模型的测试正弦图的构建方法与相应微调数据集的构建方法一致。对于所有三个模型,将正常剂量的FBP重建图像作为参考。

D. Training Strategies

我们在PyTorch深度学习工具箱[42]上实现了iRadonMAP框架,使用两个具有24GB内存容量的NVIDIA Tesla P40图形处理单元(GPU)。iRadonMAP模型通过最小化模型重建 μ ∗ \mu^* μ和参考 μ ^ \hat{\mu} μ^(即通用图像在预训练阶段或在微调阶段的正常剂量FBP重建进行端到端优化)之间的均方误差(MSE),其定义如下:
E ( γ , η , ξ ) = arg ⁡ min ⁡ γ , η , ξ 1 N ∑ i = 1 N ∥ μ i ∗ − μ ^ i ∥ 2 2 . (10) E(\gamma, \eta, \xi)=\underset{\gamma, \eta, \xi}{\arg \min } \frac{1}{N} \sum_{i=1}^N\left\|\mu_i^*-\hat{\mu}_i\right\|_2^2 . \tag{10} E(γ,η,ξ)=γ,η,ξargminN1i=1Nμiμ^i22.(10)
这里, N N N是训练对的数量。这个最小化问题可以用各种现成的算法来解决,在这项工作中,RMSProp算法(见http://www.cs.toronto.edu/~tijmen/cs321/slides/electure_slides_lec6.pdf)。相应的batch size、 batch number、学习率、动量和权重衰减分别设置为2100、0.00002、0.9和0.0。具体而言,首先训练无噪声和稀疏视图iRadonMAP模型,以学习预训练数据集上从正弦图域到空间域的映射,利用其足够多样化的特征模式的优势。然后,分别使用无噪声和稀疏视图微调数据集对它们进行微调,以确保CT衰减系数的准确性。此外,从具有噪声微调数据集的无噪声模型进一步微调了噪声iRaodnMAP模型。图4显示了无噪声iRadonMAP模型的预训练和微调阶段的训练和验证损失曲线。epoch的数量是根据经验设置的,以确保预训练和微调阶段都有足够的优化。

在这里插入图片描述

E. Other Network Designs

所提出的iRadonMAP框架由三个组件组成,即FCF层、SBP层和rCNN。如第II-B节所示,所提出的iRadonMAP框架中的每个组件都可以使用各种技术来实现,而不是当前工作所采用的技术。例如,也可以采用一维卷积滤波(ConvF)网络来构造正弦图域中的滤波操作;也可以采用公式(7)中定义的SPBP操作来反投影滤波的正弦图数据,而不是SBP层;此外,完全卷积网络(FCN)也可以用于所提出的iRadonMAP框架,它是一个类似于rCNN的二维卷积层堆栈,但没有捷径技术。图5显示了每个组件的不同技术的比较。

在这里插入图片描述

为了证明所提出的iRadonMAP框架用于Radon逆变换的可行性,我们评估了在第IV-D节中提出的iRadonMAP框架下,三个组件的不同组合的重建性能。在评估中,FCF和ConvF都被设置为两层结构,其中包含激活函数 t a n h ( ⋅ ) tanh(\cdot) tanh();ConvF的核数和核大小分别为64和1×3;用于rCNN和FCN两者的块号被设置为13;并且FCN的内核数量和内核大小与rCNN的内核数目和内核大小相同。我们在相同的训练条件下,即相同的数据集、优化器、学习率和时期数量,独立地训练了所有网络架构。值得注意的是,在我们的实现中,所有操作都采用了偏置项,这些项在公式(5)和公式(6)中没有显示。为了简单起见。在所提出的iRadonMAP框架下,每个组件的参数数量和相应的输出维度如表一所示。

在这里插入图片描述

F. Quantitative Indices

我们通过采用三个流行的指标来评估iRadonMAP模型的定量性能,即峰值信噪比(PSNR)、归一化均方误差(NMSE)和特征相似性(FSIM)。PSNR和NMSE是用于评估CT重建的两个广泛采用的定量指标。在这里,我们提供了这两个指数的定义,其公式如下:
PSNR ⁡ ( μ ∗ , μ ^ ) = 10 × log ⁡ 10 ( 25 5 2 ∥ μ ∗ − μ ^ ∥ 2 2 ) , (11) \begin{aligned} \operatorname{PSNR}\left(\mu^*, \hat{\mu}\right) & =10 \times \log _{10}\left(\frac{255^2}{\left\|\mu^*-\hat{\mu}\right\|_2^2}\right), \end{aligned} \tag{11} PSNR(μ,μ^)=10×log10(μμ^222552),(11)

NMSE ⁡ ( μ ∗ , μ ^ ) = ∥ μ ∗ − μ ^ ∥ 2 ∥ μ ^ ∥ 2 . (12) \begin{aligned} \operatorname{NMSE}\left(\mu^*, \hat{\mu}\right) & =\frac{\left\|\mu^*-\hat{\mu}\right\|_2}{\|\hat{\mu}\|_2} . \end{aligned} \tag{12} NMSE(μ,μ^)=μ^2μμ^2.(12)

这里, μ ∗ \mu^* μ表示归一化重建, μ ^ \hat{\mu} μ^表示相应的归一化参考。此外,由于能够测量 μ ∗ {\mu}^* μ μ ^ \hat{\mu} μ^之间的感知一致性,本工作也采用了FSIM。计算FSIM的公式如下:
FSIM ⁡ ( μ ∗ , μ ^ ) = ∑ x ∈ Ω S L ( x ) ⋅ P C m ( x ) ∑ x ∈ Ω P C m ( x ) (13) \operatorname{FSIM}\left(\mu^*, \hat{\mu}\right)=\frac{\sum_{x \in \Omega} S_L(x) \cdot P C_m(x)}{\sum_{x \in \Omega} P C_m(x)} \tag{13} FSIM(μ,μ^)=xΩPCm(x)xΩSL(x)PCm(x)(13)
这里, Ω \Omega Ω指的是整个图像的空间域。 P C m ( x ) P C_m(x) PCm(x) μ ^ \hat{\mu} μ^ μ ∗ \mu^* μ之间较大的相位一致性 ( P C ) (\mathrm{PC}) (PC)值; S L ( x ) S_L(x) SL(x)表示 P C \mathrm{PC} PC相似度 S P C ( x ) S_{P C}(x) SPC(x) μ ^ \hat{\mu} μ^ μ ∗ \mu^* μ之间的梯度幅度 ( G M ) (\mathrm{GM}) (GM)相似度 S G ( x ) S_G(x) SG(x)的乘积。PC值和GM值的定义参见原始文件[43]。

G. Comparison Methods

为了评估所提出的iRadonMAP模型的性能,选择了带有斜坡滤波器的FBP算法作为基线方法,其中斜坡滤波器是FBP算法最常用的内核。在稀疏视图和噪声数据的研究中,还采用了一种称为PWLS-TV的传统迭代重建算法,该算法通过优化具有TV先验的惩罚加权最小二乘模型来重建CT图像,用于比较目的。用于平衡保真度项和先前项之间的权衡的相应惩罚参数被设置为0.02,迭代次数被设置为50,这是在我们的实验中基于PSNR选择的。此外,我们在噪声数据研究中添加了另外两种相互竞争的重建算法,即KSAE[20]和RED-CNN[32]。这里,KSAE是一种基于DL的迭代重建算法,它使用学习的自编码器作为先验,RED-CNN是空间域中基于DL的去噪器。KSAE和RED-CNN的训练设置都是根据原始论文[20]、[32]确定的。

IV. RESULTS

A. Noise-Free Data Reconstruction Results

图6展示了iRadonMAP的无噪声数据重建性能。这三行显示了三个重建案例。第一列显示了相应的引用。第二列显示了用于比较的FBP结果。第三列显示iRadonMAP结果。放大图像显示在相应的完整图像的右下角。通过视觉检查,iRadonMAP的重建性能与FBP算法的重建性能非常相似。

在这里插入图片描述

此外,重建和参考之间的残差图像如图7所示,这表明在无噪声扫描条件下,iRadonMAP可以实现比FBP算法略好的重建精度。

在这里插入图片描述

iRadonMAP对测试数据集的总体定量性能(即PSNR、NMSE和FSIM)如表二所示。

在这里插入图片描述

B. Sparse-View Data Reconstruction Results

在本节中,我们评估了iRadonMAP在稀疏视图扫描条件下的重建性能。145个视图和100个视图的重建结果分别如图8和图10所示。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

相应的残差图像分别如图9和图11所示。结果表明,所提出的iRadonMAP模型可以有效地减少稀疏扫描方案引起的条纹伪影。与PWLS-TV相比,iRadonMAP的重建在伪影减少和细节保留方面表现更好。

在这里插入图片描述

在这里插入图片描述

测试数据集的145个视图和100个视图的总体定量测量结果分别显示在表三和表四中。

在这里插入图片描述

C. Noisy Data Reconstruction Results

我们进一步评估了iRadonMAP在噪声数据下的重建性能。重建结果如图12所示。

在这里插入图片描述

相应的残差图像如图13所示。

在这里插入图片描述

此外,不同方法对测试数据集的总体定量性能如表五所示。定性和定量结果都表明,iRadonMAP模型具有很好的抑制因降低辐射剂量而引起的噪声的能力。

在这里插入图片描述

D. Evaluating Network Designs

不同网络设计的重建结果如图14所示。不同网络结构的重建和参考之间的绝对残差图像显示在相应的重建图像的右下角。

在这里插入图片描述

  • 通过比较‘SBP+RNN’和‘FCF+SBP+RNN’的结果,我们发现在没有正弦图域中的滤波操作,其指示滤波操作的重要性。
  • 通过比较‘ConvF+SBP+rCNN’和‘FCF+SBP/rCNN’的绝对残差图像,我们观察到用全连接技术实现的滤波操作比用卷积技术实现的要好。
  • ‘FCF+SPBP+rCNN’和‘FCF+SBP+rCNN‘的结果显示了SBP层的重要性。具体而言,具有SPBP层的网络结构将在重建中心周围引起明显的伪影,而类似的伪影不会出现在‘FCF+SBP+rCNN’的重建中。一个可能的原因是,SBP层在并入iRadonMAP框架时比SPBP层更灵活。
  • 通过比较‘FCF+SBP’和‘FCF+SBP+rCNN’的结果,我们发现在SBP层之后,如果没有rCNN分量,重建会受到圆形伪影的污染。结果表明,rCNN分量在考虑空间信息以抑制圆形伪影方面是重要的。
  • 为了确保公平性,我们还评估了其他网络结构的重建性能,如“ConvF+SPBP+rCNN‘和‘FCF +SPBP + FCN’,并且这两个结果都不如’FCF+SBP+rCNN‘的结果。

上述网络架构的重建性能表明了为所提出的iRadonMAP框架选择的组合的可行性。

E. Analysis of Network Parameters

在本节中,我们分析了所提出的iRadonMAP框架的两个网络参数,包括rCNN的FCF层数和残差块数。评估是通过扰动两个参数中的一个进行的,而其他参数是固定的。我们在图15中给出了与不同数量的FCF层和rCNN残差块相对应的最终重建的定量测量。图中的结果15(a)表明,使用2个FCF层获得了最佳性能,这表示重建性能与FCF层数之间的非线性关系。图15(b)中的结果显示,随着残差块数量的增加,没有显著改善。基于上述分析,我们选择了一个具有2个FCF层和13个残差块的标准结构作为iRadonMAP的最终网络架构。

在这里插入图片描述

V. DISCUSSION AND CONCLUSION

本文提出了一种新的重构框架iRadonMAP。受包含图像后处理步骤的FBP算法重建范式的启发,iRadonMAP采用DL技术构建全连通滤波运算和正弦反投影运算来执行Radon逆变换,并通过公共网络结构进一步增强了Radon逆变换。临床患者数据的实验结果证明了iRadonMAP用于Radon逆变换的可行性。

所提出的iRadonMAP框架的可行性是双重的。首先,我们根据包含图像后处理步骤的FBP算法的重建链,构建了所提出的iRaodnMAP框架的网络架构,这为所提出的iRadonMAP框架提供了实现有希望的重建性能和快速重建速度的理论可行性。第二个方面是SBP层的设计。SBP层在滤波正弦图数据和重建之间建立了一个简单得多的连接,与完全连接的技术相比,这确保了重建大尺寸正弦图的可行性。

所介绍的工作也有潜在的局限性。在噪声数据研究中,所提出的iRadonMAP的重建性能与RED-CNN的重建性能相似,后者是空间域中的纯后处理操作。因此,当前的iRadonMAP模型和RED-CNN都很难恢复在低剂量扫描条件下被严重噪声掩盖的极其细微的纹理。一个可能的原因是rCNN在重建过程中发挥了相当大的作用。众所周知,为了恢复这些被污染的细微纹理,应该仔细考虑正弦图数据的质量。由于所提出的iRadonMAP框架的可扩展性,可以通过在正弦图域中添加一个公共网络结构来解决这个问题[44]。

在当前的iRadonMAP模型中,反投影操作被实现为SBP层,这是SPBP操作的扩展,如公式(7)所定义。SBP层使用最近邻插值将正弦图中的一个正弦反投影到重建点中。然而,传统反向投影(CBP)操作的实际实现不使用最近邻插值,而是使用两个相邻检测器仓之间的线性插值。关于用SBP重建网络架构时出现的圆形伪影,SPBP使其恶化,如图14所示,SBP层不准确的反向投影强度可能是罪魁祸首。然而,SBP层可以通过在反向投影操作中涉及相邻的正弦曲线来简单地扩展。这样,扩展的SBP层可以被视为CBP实际实现的扩展,这对于Radon逆变换可能更合理。在未来,我们将进行这样一个实验,比较各种背投影,即SBP、扩展SBP、SPBP和CBP,以研究圆形伪影产生的内在机制。

此外,通过训练用当前iRadonMAP模型的特定成像几何结构获取的大量数据来学习反投影操作,即SBP,这表明用不同的成像几何结构(例如,不同数量的detector bins、投影视图、重建大小)和/或与训练数据(例如,包含金属的数据)不一致获取的正弦图可能难以用特定的iRadonMAP模型重建。使用不同成像几何形状获取的正弦图的单个模型需要单独训练,这包括当前工作的另一个限制。值得注意的是,鉴于其端到端的学习能力,所提出的iRadonMAP框架对于无法解析解决的重建问题可能具有优势[45]。我们将在未来为这些应用进一步开发iRadonMAP的重建能力。

目前的iRadonMAP框架更多地关注平行波束成像几何条件下的Radon逆变换,这足以证明所提出的iRadonMAP框架的可行性。然而,目前的工作中没有说明在商业CT扫描仪中更广泛使用的扇形/锥形光束成像几何结构的iRadonMAP框架。我们相信,与平行光束成像几何结构类似,可以推导出适用于扇形/锥形光束成像几何的iRadonMAP模型。为了将当前的工作纳入现代医学CT扫描仪,还需要做出更多的努力,这将是我们未来研究的一个潜在课题。

iRadonMAP的体系结构为未来的研究提出了几个有趣的主题。第一个是传统重建链的参数化。与iRadonMAP类似,传统重建链中的各种前/后处理步骤可以参数化,并与当前的iRadonMAP模型相结合,为Radon逆变换构建一个更灵活、更强大的网络。改进的网络结构的端到端优化可以提供处理更复杂输入的机会,而无需精心设计各种校准来近似相应的Radon逆变换。

第二个有趣的主题涉及基于原始数据的计算机辅助检测/诊断(CAD)。最近,大多数基于DL的CAD方法都采用了一些常见的网络结构来执行使用CT重建图像或原始正弦图数据的检测/诊断任务。重建过程和检测/诊断过程可以结合在一起,以构建联合重建检测或联合重建诊断网络结构,并且通过端到端的训练策略来预期潜在的有希望的检测/诊断性能。事实上,已经进行了一些初步研究[46]-[48]。我们相信,所提出的iRadonMAP框架将为这类研究提供新的机会。

在这项工作中,我们已经证明了iRadonMAP对Radon逆变换的重建能力。经过一些必要的修正,所提出的iRadonMAP框架也可以应用于其他CT应用,如光谱CT中的材料分解[49]、灌注CT中的去卷积[50]、[51]和金属伪影减少(MAR)[52]、[53]。这些可能性将在我们未来的工作中进行研究。

猜你喜欢

转载自blog.csdn.net/weixin_43790925/article/details/129941394