作者:木扎尔特2502918527 | 来源:互联网 | 2023-09-18 19:49
医学分割论文:SegmentationofCTthoracicorgansbymulti-resolutionVB-netsAuther:MiaofeiHan.Instituti
医学分割论文:Segmentation of CT thoracic organs by multi-resolution VB-nets
Auther: Miaofei Han. Institution:1Shanghai United Imaging Intelligence Inc. Publish year: 2019
论文地址:SegTHOR2019
在本篇论文中,作者提出了VB-Net结构,采用了多尺度分割网络,参与了SegTHOR胸部器官分割挑战赛,并在四个危及器官勾画中取得第一名
Overview:
目前深度学习在医学图像分割领域使用较多的是U-Net和V-Net结构,V-Net在U-Net的基础上添加了残差模块,梯度传递更平稳,易于优化。作者在V-Net的基础上进行优化,提出了VB-Net.
Network:
Fig1 Vb-Net的结构
VB-Net的主要区别在于使用bottleneck结构代替了上采样和下采样中的常规卷积层
Bottleneck结构由三个卷积层组成,第一层是一个卷积核为1 * 1 * 1的卷积层,用于减少feature map的channel数,第二层是与常规卷积层kernel相同的空洞卷积,第三层是一个1 * 1 * 1卷积层,将channel数恢复至原始水平。
这样做的好处是,1. 减小模型参数量 2. 加快模型推理速度
multi-resolution:
目前医学图像(CT,MR)分辨率在512 * 512 * 300左右,使用全图分割会占用大量显存,将图像重采样后进行分割,会丢失部分细节信息,采用部分小体积图像配合滑窗预测,会降低显存消耗,但会增加推理时间
为此,作者提出了多尺度分辨率策略,首先在低分辨率下获得分割区域的roi范围,再使用高分辨率数据得到精细的分割结果
data and experiment:
- Intensity normalization
首先对CT数据进行归一化:选择窗位40,窗宽350,将原始CT数据归一化至[-1,1] - Resolution
粗尺度中,将数据重采样至pixel spacing为6mm,细尺度中,将数据重采样至pixel spacing为1mm - Fully convolution network inference
虽然在训练时使用了patch+random crop,但在预测时使用了全数据进行推理。即数据重采样至粗尺度->粗尺度网络分割得到VOI->VOI重采样至细尺度->细尺度网络分割得到结果
另一方面,在推理时使用了自己编写的推理引擎替代常规的深度学习框架,可降低显存占用,加快推理速度 - post-processing
找出分割结果中的最大三维连通域,去掉孤立点
Result:
具体结果不放了,以dice评价,Esophagus:0.8651,Heart:0.9536,Trachea:0.9276,Aorta:0.9464。
值得一提的是,单个OAR分割的显存占用在2GB以下,分割时间在1s以内