admin 管理员组文章数量: 1087834
2024年6月1日发(作者:织梦模板不用apache用nginx可以吗)
·404·
计算机应用研究
2020
年
CNN
的低剂量
CT
图像肺结节检测基于改进
FasterR-
高
摘
12
璇
,
毕晓君
(1.
哈尔滨工程大学信息与通信工程学院
,
哈
尔滨
150001;2.
中央民族大学信息工程学院
,
北京
100081)
早治疗能够有效降低肺
癌死亡率
。
肺癌的早期症状是
要
:
肺癌是发病率和死亡率居首位的恶性肿瘤
。
早诊断
、
以肺结节形式表现的
,
因此对肺结节进行有效筛查对肺癌诊断意义重大
。
提出一种嵌入
SENet
和二阶响应变换的
CNN
目标检测算法
,
改进
FasterR-
有效地提高了肺结节的检测精度
。
为了提取到更有效的卷积特征
,
首次将通道注
means
聚类算法修改锚框尺寸
,
意力机制和二阶响应变换机制进行融合
,
嵌入到残差网络中
。
在训练开始前
,
通过
K-
CNN
算法能有效地提高肺结节的检测精度
。
降低损失
,
加快收敛
。
实验结果表明
,
嵌入
SES
模块的改进
FasterR-
CNN;SENet;
二阶响应
关键词
:
深度学
习
;
肺结节检测
;
卷积神经网络
;FasterR-
0
引言
目前肺癌的发病率和死亡率均
列我国癌症首位
。
一个原因是
肺癌患者在早期不会有明显症状
,
患者被发现时往往已经肺癌晚
期
,
若在病变早期得到及时的诊断和治疗
,
将会大大提高存活
[1]
早
治疗意义十分重大
。
肺结节
因此对肺癌患者做到早诊断
、
率
,
是肺癌早期的出现形式
,
对肺癌的诊断实质上就是对肺部中肺结
[2]
节的检测
。CT
扫描是
目前最可靠的肺癌检测途径之一
,
但会给
患者带来高剂量辐射
,
带来二次伤害
。
解决办法是采用低剂量
CT
扫描
,
它能减少剂量辐射
,
降低患者检查费用
,
但代价是牺牲原本
CT
的清晰度
,
影响医生主观判断
,
造成漏诊率和误诊率变高
,
因此
在低剂量
CT
中对肺结节进行精确检测已成为国内外研究的重点
和难点
。
CAD)
虽然目前的计算机辅助系统
(computeraideddiagnosis,
有效提高了诊断效率
,
但仍存在三个明显缺点
:a)
检测中要经过分
割
、
提取
、
筛选三个步骤
,
整个过程耗时较长
;b)
检测候选结节和分
辨假阳性结节两步分开进行
,
无法实现端到端检测且无法利用大
数据样本
;c)
传统
CAD
由于网络简单
,
提取的大多为低级特征
,
无
法真实地反映大小不一
、
纹理复杂的结节
。
近年提出的深度学习模型因其大数据驱动和特征提取能力强
的优点
,
在图像分类和目标检测领域异军突起
,
有效推动了医学图
[3,4]
。
它的特点恰好能克服传统
CAD
的
像处理领域内的很多研究
研究证明它全面优于传统检测
方法
,
因此基于深度学习的肺
缺点
,
结节检测方法成为目前一大热门研究方向
。
FasterR-CNN
作为基于深度学习的目标检测算法
,
是目前在通
用物体检测中精度最高的算法之一
,
而且能真正实现端到端检测
。
整个过程均在
GPU
上实现
,
速度也是远超传统
CAD
方法
。
研究人
CNN
应用于肺结节检测
[5]
,
在较大的结节检测中取
员已将
FasterR-
由于目前的
Faster
得了较好效果
。
但
对于低剂量
CT
中的小结节
,
R-CNN
特征提取网络层数少
、
能力弱
,
结节假阳率和漏检率仍有下
降空间
。
综上
,
本文针对低剂量
CT
图像肺结节检测现阶段还存在的主
CNN
模型用于肺结节检测
。
在要问题
,
提出一种改进的
FasterR-
[6]
使用
101
层的残差网络
(ResNet)
替换原
先的
ZF
或
VGG
网络的
基础上
,
首次将通道注意力机制和二阶响应变换机制进行融合
,
并
将融合的
SES
结构嵌入到残差网络中
。
在区域建议网络中
,
利用
[7]
means
聚类算法计算出适用于本文数据集的锚框尺寸
,
从
基于
K-
CNN
算法中的区域建议网络进行改进
。
实验结
而实
现对
FasterR-
果表明
,
改进的目标检测算法能有效地提高肺结节的检测精度
,
同
时不影响检测速度
,
为下一步肺癌的诊断和治疗打下基础
。
中的特征图固定为统一尺寸
;
最后通过
softmax
分类器分类和包围
框回归
(boundingboxesregression)
实现最终的目标检测
。
图
1FasterR-CNN
目标检
测框架
1.1
卷积神
经网络
CNN)
是深度学习
卷积神
经网络
(convolutionalneuralnetwork,
最经典的结构之一
,
其本质是通过卷积的形式进行特征提取
。
这
样可以大大减少参数
,
拥有更深的网络层数
,
提取更高层的抽象特
征
,
这些特征是提高目标分类和识别的关键
。
基本
CNN
模型如图
2
所示
,P
代表池化层
,F
代表全连接层
,
其中
C
代表卷积层
,
另外还
有输入层和分类层
。
图
2CNN
结构框
架
1.2RPN
Faster
传统算法产生检测区域的方法十分耗时
,
针对
这一不足
,
R-CNN
目标检测框架提出了
RPN
层
,
利用
RPN
层生成检测区域能
大大缩短检测区域的生成时间
。
在
RPN
层中每个特征点会融合周
围空间信息
,
并生成一组锚框
。
每组锚框实际是一组尺度比例不
同的矩形框
,
对应着原始图像中不同大小的候选区域
,
进而实现多
尺度的检测
。
再经过
1×1
的卷积得到两组输出
:
第一组输出检测
区域是前景
(
目标区域为前景
)
或背景的概率
,
即目标性得分
;
第二
组输出的是检测区域的回归偏移
,
对检测区域进行调整
,
使其能够
拟合预测目标的坐标
。
t
x
=(x-x
a
)/w
a
,t'
x
=(x'-x
a
)/w
a
t
y
=(y-y
a
)/h
a
,t'
y
=(y'-y
a
)/h
a
t
w
=log(w/w
a
),t'
w
=log(w'/w
a
)
t
h
=log(h/h
a
),t'
x
=log(h'/h
a
)(1)
1FasterR-CNN
算法介
绍
FasterR-CNN
算法的框架如图
1
所示
,
框架分为四个主要部分
:
[8]
卷积神经网络特征提取
、
候选窗口生成
、
目标分类和边框回归
。
首先
,
将原始图像输入网络
,
由特征提取网络提取特征图
(f
ea-
turemap);
然后
,CNN
创建的区将提取到的特征图通过由
FasterR-
RPN)
生成候选区域框
(pro-
域建议网络
(regionproposalsnetwork,
posals),
并将生成的候选区域框映射到特征图上
;
接着
,
利用感兴
ROIpooling)
层将每个候选框趣区域池化
(regionofinterestpooling,
y、w、h;
目标区域中心坐
其中
:
预测区域中心坐标
、
宽和
高分别是
x、
y'、w'、h';
锚框中心坐标
、
标
、
宽和高分别是
x'、
宽和高分别是
x
a
、
w
a
、h
a
。
y
a
、
可以利用其目标性
得分初步
对于每一个判断为前景的区域
,
[9]
筛选出得分高的检测区域
;
再利用非极大值抑制
选出置
信度高
的检测区域
;
最后按照目标性得分筛选出一定数量的感兴趣区域
。
因此在
RPN
层中
,
实现了对检测目标的初步定位
。
在
RPN
层中
,
参数设置会对结果产生影响
。
由于图像中肺结
收稿日
期
:2019-12-01;
修回日期
:2020-02-02
作者简介
:
高璇
(1994-)
,
女
,
山东日照人
,
硕士研究生
,
主要研究方向为深度学习
、
图像处理
;
毕晓君
(1964-),
女
(
通信作者
),
黑龙江哈尔滨人
,
教
,,,、(bixiaojun@hrbeu.edu.cn).
授博导博士主要研究方向为深度学习图像处理
第
37
卷增刊高
CNN
的低剂量
CT
图像肺结节检测璇
,
等
:
基于改进
FasterR-
·405·
节数量
不多
,
所以在实验中
,
通过调整检测阶段
RPN
层最终输出感
兴趣区域的数量
,
使得算法在不影响目标检测准确率的同时
,
提升
算法检测速度
。
1.3ROIpooling
层
在提取的特征图通过
R
PN
层后
,
会产生尺寸大小不一的候选
区域框
。
这些区域框无法直接在卷积网络中作进一步的分类和回
归
。
首先要将区域框和特征图进行整合
,
而这些候选区域框映射
到特征图的映射区域就是
ROI。
这也是
ROIpooling
的输入
。
为了
得到一致的尺寸输出
,ROIpooling
层借鉴了
SPPNet
中金字塔池化
的思想
,
通过对
RPN
后的特征图进行分块池化
,
得到固定的输出尺
寸
。
输出尺寸统一后
,
就可进行后续的全连接和分类及边框回归
任务了
。
2
改进
Fa
sterR-CNN
模型
在端到端肺结节检测中
,
研究者公认准确度最高的是
Faster
R-CNN
算法
[10]
,
但在实验中发现其仍存在漏检和误检现象
。
普通
FasterR-CNN
框架利用
VGG16
[11]
网络作为图像特征提取网
络
。
但
在肺结节检测中
,
被检测的结节区部分较小
,
经过
VGG16
网络的多
个池化层后会存在信息丢失
。
而残差网络由于引入了残差机制
,
可以更好地保留小物体特征
。
同时
,
残差网络使用了瓶颈块结构
,
利用两个
1×1
的卷积核代替传统结构中
3×3
的卷积核
,
减少了网
络的参数量
。
因此
,
本文算法使用残差网络代替
VGG16
网络作为
特征提取的主干网络
,
并在此基础上将
SENet
和
SORT
进行融合
,
并嵌入检测框架
,
充分利用通道信息和特征融合
,
进一步提高肺结
节检测精度
,
保留更多细小区域细节特征
,
保证算法检测的准确
率
。
实验证明
,
本文方法在肺结节的检测上表现更佳
。
2.1SENet
结构
SENet
[12]
由
squeeze、excitation、reweight
三部分
组成
,
是胡杰于
2017
年提出的一种卷积神经网络结构
。
嵌入该结构的卷积网络在
ILSVRC2017
的分类项目获得第一名
。
该结构显式地建模了特征
通道之间的依赖关系
,
通过学习的方式获取各个通道的重要程度
,
抑制无用特征
,
提升有效特征
。SENet
结构如图
3
所示
。
图
3SENet
结构
首先是
s
queeze
操作
,
即全局平均池化
,
公式为
z
c
=F
sq
(u
c
)=
1
WH
W×
H
i
∑
=1j
∑
=1
u
c
(i,j)(2)
得到大
小为
C×1×1
的特征图
(C
为特征图通道数
);
再经过
excita-
tion
操作获得通道依赖性
,
公式为
s=F
ex
(z,W)=
σ
(g(z,W))=
σ
(W
2
δ
(W
1
z))(3)
其中
:W
×C
1
∈
R
,W
2
∈
R
C×
;
δ是线性激活函数
sigmoid;
σ是非线
性
激活函数
ReLU;W
1
z
是一个全连接层操作
;W
1
的维度
是
C/r×C,
r
表示缩放参数
,
本文设置为
16,
目的是减少通道个数降低计算量
,
同理
,
与
W
2
相乘也是全连接层操
作
,W
2
的维度
是
C×C/r,
因此最
后输出的维度为
C×1×1。
最后进行
reweight
操作
,
即在对应位置
与原输入特征图相乘
,
得到输出
。
公式为
珓
x
c
=F
scale
(u
c
,s
c
)=s
c
·u
c
(4)
其中
:F
scale
(u
c
,s
c
)
指的是
u
c
∈
R
W×H
和标量
s
c
之间的对应通道积
。
2.2SORT
算法
网络非线性化程度越高通常意味着特征的表达能
力越强
,
从
这一角度出发
,Wang
等人
[13]
提出了
S
ORT(second-orderresponse
transform)
即二阶响应变换
,
其核心思想是将元素级的内积引入网
络中
,
增强网络的非线性
,
从而实现对更复杂函数的拟合
。
具体来说
,SORT
算法将元素乘积变换附加到一个双分支网络
模块的线性和上
[14]
。
其直接优势是便于跨分支响应的传
播
,
这样
每个分支就可以根据另一个分支的当前状态更新其权重
。
本文首
次将其引入肺结节目标检测框架中以提升检测性能
。
本文采用的特征提取网络为残差网络
,
残差网络由残差单元
组成
,
而残差单元的输出可以看做两个分支的直接加和
,
如式
(4)
所示
。
而引入二阶响应变换后计算公式变为式
(5)。
式中ε
=
10
-4
,
作用是保证梯度计算的稳定
性
。
同时为避免
x
和
F(x)
出现
负值
,
在计算内积前利用
ReLU
进行激活
,
所以最后公式如式
(6),
δ
表示
ReLU
函数
。
y
R
=x+F(x)(5)
y
s
=x+F(x)+
槡
x
F(x)+
ε
(6)
y
s
=x+F(x)+
槡
δ
(x
F(x))+
ε
(7)
2.3
本文改
进算法
SENet
通过学习的方式获
取各个通道的重要程度
,
抑制无用
特征
,
提升有效特征
。
将其嵌入残差网络
,
而
SORT
是将元素级的
内积引入网络中
,
增强网络的非线性
。
两者的目标都是使网络能
有更强的特征提取能力
。
经过分析发现
,
两个算法在整体结构上
互不影响
,
而且在理论思想上一个进行的是通道级的改进
,
一个
利用的是元素级内积
。
在有效利用特征通道间关系后进一步进
行元素级内积能够更好地保留图片的特征细节
。
因此为进一步
提高肺结节检测正确率
,
本文尝试将两个算法进行融合
,
形成
SES
模块
。
图
4(a)
是普通残差单元结构图
;
图
4(b)
是加入
SORT
后的残差
单元
;
图
4(c)
是嵌入
SENet
结构的残差单元
;
图
4(d)
是嵌入
SE+
SORT
的残差单元
,
即
SES
模块
。
图
4
残差单元及三类改进残差单元
3
实验与
分析
3.1
实验环境与实验数据
实验基
于
Ubuntu16.0.4
操作系统
,
使用图形处理器
(graphics
processingunit,GPU)
版
TensorFlow
[15]
作为深度学习框架
,GPU
型号
为
20
80Ti。
本文实验数据集采用的是由美国国家癌症研究所收集的
LIDC-IDRI
[16]
(lungimagedatabaseconsortium),
该数据集由肺部
CT
影像和对应的诊断结果病变标
注
XML
文件组成
。
在本实验中
,
首
先从原始数据集的
10
万张医学专用的
DICOM
格式
CT
图像中选取
2275
张带有结节的图像
,
利用
Python
将其转换为
PNG
格式
,
再通
过
labelImg
软件对图像中的结节进行标注
,
生成后缀为
xml
的标
签
。
通过对图像和标签进行对应的水平翻转
,
实现对数据集的扩
增
,
最终得到带有结节的
CT
图像共计
4550
张
,
其中
64%
用做训练
集
,16%
用做验证集
,20%
用做测试集
。
数据集样本分布如表
1
所
示
。
经过框定的结节图像如图
5
所示
。
表
1
数据集样本分布
数据集数
量占比
/%
训练集
291264
验证集
7
2816
测试集
91020
图
5
肺结节数据集样图
3.2
实验流程和评价指标
本文肺结节检测实验流程如图
6
所示
。
通过
筛选
、
转换
、
扩增和标注后得到了
4550
张图片
,
并按比例
·406·
计算机应用研究
2020
年
将其分
为训练集
、
验证集和测试集
。
由于肺结节在整个图片内占
比较小
,
所以原始
RPN
锚框比例不适用
。
本文通过
K-means
聚类
算法分析结节大小后
,
将原始尺度
1∶1、1∶2、2∶1,
原始大小
1282、2562、5122
的锚框改为尺度
1∶1、2∶3、3∶2,
大小为
162、
322、482。
整个模型的损失函数公式为
L(
{p
i
}
,{t
i
}
)=
1
N
∑
L
p'
cls
cls
(p
i
,
i
)+
λ
1
N
∑
p'
i
L
reg
(t
i
,t'
i
)(8)
reg
i
其中
:p
i
、p'
i
分别是类别的预测概率值和真实概率值
;t
i
、t'
i
分别是
候
选框坐标向量的预测值和真实值
;N
cls
代表分类归一化
;N
reg
代表
回归
归一化
;
λ为平衡权重
,
设为常数
10。
分类损失计算公式
:
L
cls
(p
i
,p'
i
)=-log[p
i
p'
i
+(1-p
i
)
(1-p
'
i
)
](9)
回归损失计算公式
:
L
reg
(t
i
,t'
i
)=smoothL
1
(t
i
-t'
i
)(10)
图
6
肺结节图像目标检测流程
修改锚框尺寸后损
失对比如图
7
所示
。
相比未修改
,
修改锚
框尺寸后损失值降低
,
模型更易收敛
。
再使用训练集训练四种
FasterR-CNN
模型
,
分别将训练好的
模型通过测试集进行检测
,
最终通过评价指标分析本文算法
。
图
7
训练时损失值对比结果
本文算法采用的评价指标为目标检测通用评价指标
———
平
均
精度均值
(meanaverageprecision,MAP)
,MAP
是指各类目标平均
精度
(AP)
的均值
。
由于本文只检测肺结节一类目标
,
所以
MAP
等
于
AP。
而
AP
是由精确率
(precision)
和召回率
(recall)
计算而成
。
精确率指被正确检测出的结节占全部检测出区域的百分比
,
召回
率是指被正确检测出的结节占全部结节的百分比
,
两者计算公式
如式
(11)
(12)
所示
。
precision=
TP
TP+
FP
(11)
recall=
TP
TP+
FN
(12)
其中
:TP
表示正确检测出的
肺结节数量
;FP
表示背景被检测为肺
结节的数量
;FN
表示肺结节被检测为背景的数量
。
以精确率为横轴
,
召回率为纵轴绘制曲线后
,
曲线下的面积即
为
AP,
其计算方式如式
(13)
所示
。
AP=
∫
1
0
p(r)dr
(13)
3.3
参数设置和实验结果
四种模型训练的迭代次数设置
为
10
万次
,
学习权重的方法为
随机梯度下降
(SGD)
法
,
前
5
万次迭代的学习率设置为
0.001,
后
5
万次学习率缩减到
0.0001。
批大小
(batchsize)
设置为
64,
动量
(momentum)
设置为
0.9,
权重衰减设置为
0.0005。
正样本的目标区域重叠度是大于
0.8,
负样本的目标区域重叠
度设置为小于
0.5。
四种模型经过训练后
,
在同一测试集上进行了测试
,
测试平均
精度和检测时间如表
2
所示
。
表
2
实验结
果对比
实验所
用方法
AP/%
单张切片测试时间
/
张
/s
原始
FasterR-CNN86.910.063
FasterR-CNN(SENet)88.900.073
FasterR-CNN(SORT)87.500.077
改进
FasterR-CNN89.830.086
通过表
2
可
以看出
,
本文提出的改进方法比原始方法和使用
单一模块都要好
,
相比原始
FasterR-CNN,
平均精度提高
2.92%。
图
8
是四种模型在结节检测中的视觉对比图
。
选择的图片均
为较难识别的例子
,
包括孤立结节
(
第一行图片
)、
胸膜尾结节
(
第
二行图片
)。
其中
(a)(e)
是原始网络下的检测结果
,(b)(f)
是嵌
入
SENet
的
FasterR-CNN,(c)(g)
是嵌入
SORT
的
FasterR-CNN,
(d)(h)
是本文改进
FasterR-CNN。
可以看出
,
相比于原始方法的
低置信度
、
单一
SENet
模块或
SORT
模块的置信度不稳定
,
本文方
法的目标区域置信度最高且波动最小
,
即更准确地检测并框定出
结节所在位置
,
甚至极小结节或者复杂结节也能实现
。
本文方法虽然取得了最高的精度
,
但由于增加了算法复杂度
,
导
致训练和检测时间比未改进前传统模型更长
。
考虑到在肺结节检测
中不需要极高的实时性
,
所以该不足不会影响在实际中的效果
。
图
8
肺结节检测结果
4
结束语
肺癌的发病率逐年递增
,
早发现
、
早
治疗能极大地提高患者的
存活可能
。
而肺结节作为肺癌早期征兆
,
对肺癌的早期筛查其实
就是对肺结节的检测
。
传统方法大多通过人工提取特征
,
检测精
度低
、
效率低
。
因此本文利用深度学习中的
FasterR-CNN
模型对
肺结节进行了检测
。
针对其特征提取网络不充分
、
易丢失底层信息的缺点
,
本文进
行了网络改进
。
首次将二阶响应应用到肺结节检测中
,
并与
SENet
进行了融合
,
提出新的
SES
模块
。
实验结果表明
,
本文方法在同样
迭代次数的模型中
,
检测肺结节的精度最高
,
平均精度为
89.83%,
相比原始
FasterR-CNN,
平均精度提高
2.92%。
参考文
献
:
1]SluimerI,SchilhamA,ProkopM,etal.Computeranalysisofcomputed
tomographyscansofthelung:asurvey[J].IEEETransonMedical
Imaging,2006,25(4)
:385-405.
2]GinnekenBV,Armato
Ⅲ
SG,DeHoopB,etal.Comparingandcombi-
ningalgorithmsforcomputer-aideddetectionofpulmonarynodulesin
computedtomographyscans:theANODE09study[J].MedicalImage
Analysis,2010,14(6):707-722.
3]
黄凯奇
,
任伟强
,
谭铁牛
.
图像物体分类与检测算法综述
[J].
计算
机学报
,2014,37(6)
:1225-
1240.
4]
尹宏鹏
,
陈波
,
柴毅
,
等
.
基于视觉的目标检测与跟踪综述
[J].
自
动化学报
,2016,42(10)
:1466-
1489.
5]ShinHC,RothHR,GaoMingchen,etal.Deepconvolutionalneural
networksforcomputer-aideddetection:CNNarchitectures,datasetcha-
racteristicsandtransferlearning[J].IEEETransonMedicalIma-
ging,2016,35(5):1285-1298.
6]HeKaiming,ZhangXiangyu,RenShaoqing,etal.Deepresiduallear-
ningforimagerecognition[C]//ProcofIEEEConferenceonComputer
VisionandPatternRecognition.Piscataway,NJ:IEEEPress,2016:
770-778.
7]St-CharlesP-L,BilodeauG-A,BergevinR.SuBSENSE:auniversal
changedetectionmethodwithlocaladaptivesensitivity[J].IEEE
TransonImageProcessing,2015,24(1):359-373.
(
下转第
409
页
)
[
[
[
[
[
[
[
第
37
卷增刊
等
:
一种改进的航母图像型号级细粒度分类方法
庞
钢明
,
·409·
ECH
相比
SCH
方法有着更好的识别精度
,
尤其在轻
总而言
之
,
量级骨干网络上表现效果更好
。
50
骨干网络条件下
ECH
方法在
20
类航母图
3
展示了
ResNet-
测试图像上的分类混淆矩阵
。
矩阵中
,
对角线数值表示各类的分
类准确率
;
其他数值中
,
没有数值的项表示对应的类别之间不存在
混淆误分的情况
,
有数值的项则表示对应的类别间存在误分情况
。
其中
,
矩阵方格背景色越深的表示数值越大
。
从图
3
中可以直观地看出
L61
型号全部分类正确
,
其他型号均
有被误分类的情况
,
其中
CVN72
达到了
84%
的误分率
。
对比各类
CVN68~CVN78
的类别之间极易被错分
。
造成误分率可以发现
,
错分的主要原因在于这些型号类别的航母均为美军核动力航母
,
除舷号外个体之间差异极小
。
相对而言
,
中
、
俄
、
印
、
意
、
英
、
法等国
航母型号由于外观差异
(
除舷号外一般还存在其他较容易分辨的
部位
,
如航母的塔台
)
具有相对较高的分类准确率
。
件下提升
1%~3%。
从现有分类精度看
,
航母图像型号级细粒度
分类有着较大的发展空间
,
在当今海洋利益愈重要的时代背景下
,
亟待更深入地探索研究更快更准确的航母图像型号级分类方法
。
参考文
献
:
[1]
张润鑫
,
陈瑞明
.
基于组合特征的航母目标识别方法
[J].
武
文波
,
2018,39(2):126-
132.
航天返回与遥感
,
[2]
许少宝
,
王蜂
,
陈聪
.
基于最小惯性轴的航母目标识别方法
[J].
激
2013,43(4):452-
456.
光与红外
,
[3]KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwith
deepconvolutionalneuralnetworks[C]//Procofthe26thAnnualCon-
ferenceonNeuralInformationProcessingSystems.2012:1106-1114.
[4]RussakovskyO,DengJia,SuHao,etal.ImageNetlargescalevisual
recognitionchallenge[J].InternationalJournalofComputerVi-
sion,2015,115(3):211-252.
[5]
马啸
,
邵利民
,
金鑫
,
等
.
舰船目标识别技术研究进展
[J].
科技导
2019,37(24):65-
78.
报
,
CNN
的海上舰船识别算法
[6]
谷东亮
,
金鑫
.
基于
FasterR-
徐晓刚
,
[J].
图像与信号处理
,2018,7(3):136-
141.
[7]
马啸
,
邵利民
,
金鑫
,
等
.
改进的
YOLO
模型及其在舰船目标识别中
J].
电讯技术
,2019,59(8):869-
874.
的应用
[
[8]
刘子坤
.
天基可见光图像舰船目标识别
[D].
北京
:
中国科学院大
2017.
学
,
[9]KangKai,PangGangming,WangJiabao,etal.Anewbenchmarkfor
instance-levelimageclassification[J].IEEEAccess,2020,8:70306-
70315.
[10]MisraD.Mish:aselfregularizednon-monotonicneuralactivationfunc-
tion[EB/OL].(2019-08-23)[2020-03-
19].http://arxiv.org/abs/
1908.08681.
[11]IandolaFN,MatthewWM,AshrafK,etal.SqueezeNet:AlexNet-level
accuracywith50xfewerparametersand<1MBmodelsize[EB/OL].
(2016-02-24)[2020-03-19].http://arxiv.org/abs/1602.07360.
[12]MaNingning,ZhangXiangyu,ZhengHaitao,etal.ShuffleNetV2:prac-
ticalguidelinesforefficientCNNarchitecturedesign[C]//Procofthe
15thEuropeanConferenceonComputerVision.Berlin:Springer,2018:
122-138.
[13]SandlerM,HowardAG,ZhuMenglong,etal.Invertedresidualsand
linearbottlenecks:mobilenetworksforclassification,detectionandseg-
mentation[EB/OL].(2018-01-13)[2020-03-19].http://arxiv.org/
abs/1801.04381.
[14]SimonyanK,ZissermanA.Verydeepconvolutionalnetworksforlarge-
scaleimagerecognition[C]//Procofthe3rdInternationalConference
onLearningRepresentations.2015.
[15]HeKaiming,ZhangXiangyu,RenShaoqing,etal.Deepresiduallear-
ningforimagerecognition[C]//ProcofIEEEConferenceonComputer
VisionandPatternRecognition.Piscataway,NJ:IEEEPress,2016:
770-778.
[16]HuangGao,LiuZhuang,LaurensVDM,etal.Denselyconnectedcon-
volutionalnetworks[C]//ProcofIEEEConferenceonComputerVision
andPatternRecognition.Piscataway,NJ:IEEEPress,2017:2261-
2269.
[13]WangYan,XieLingxi,LiuChenxi,etal.Sortsecond-orderresponse
transformforvisualrecognition[C]//ProcofIEEEInternationalCon-
ferenceonComputerVision.Piscataway,NJ:IEEEPress,2017:1368-
1377.
[14]
尚永生
.
基于卷积神经网络的胸部
CT
图像肺结节检测算法研究
[D].
济南
:
山东师范大学
,2019.
[15]AbadiM,BarhamP,ChenJianmin,etal.TensorFlow:asystemforlarge-
scalemachinelearning[C]//Procofthe12thUSENIXSymposiumon
OperatingSystemsDesignandImplementation.2016:265-283.
[16]ArmatoRS,McLennanG,BidautL,etal.Thelungimagedatabase
consortium(LIDC)andimagedatabaseresourceinitiative(IDRI)
:a
completed
referencedatabaseoflungnodulesonCTscans[J].Medi-
calPhysics,2011,38(2):articleNo.915.
[17]ShenWei,ZhouMu,YangFeng,etal.Multi-scaleconvolutionalneural
networksforlungnoduleclassification[C]//ProcofInternationalCon-
ferenceonInformationProcessinginMedicalImaging.Berlin:Springer,
2015:588-599.
图
3ECH(ResNet-50)
对航母型号的分类混淆矩阵
50
骨干网络条件下
ECH
方法部分错
同时
,
图
4
展示
了
ResNet-
P:XXX
为预测类别
。
在测试集分样例
,
其中
T:XXX
为真实类别
,
上
,
共有
207
张图像被错分
。
图
4ECH(ResNet-50)
错分样
本示例
从上述结果可以发
现
,
型号级别的航母图像分类任务仍面临
巨大挑战
,
尤其表现在同一国家的不同型号航母
。
由于制造工艺
等条件限制
,
同一国家在一定周期内建造的不同型号航母通常都
具有极小的差异
,
所以航母图像型号级细粒度分类仍有待深入
研究
。
4
结束语
本文针对航母图像型号级细粒度分类任务
,
提出了一种改进
的端对端分类识别框架
ECH,
在航母图像型号级细粒度级分类数
据集上得到了
63.8%
的识别精度
,
较现有方法在不同骨干网络条
(
上接第
406
页
)
[8]
王
厚华
.
基于深度学习的医学图像肺结节检测算法研究
[D].
西
2018.
安
:
西安电子科技大学
,
[9]RenShaoqing,HeKaiming,GirshickR,etal.FasterR-CNN:towards
real-timeobjectdetectionwithregionproposalnetworks[J].IEEE
TransonPatternAnalysisandMachineIntelligence,2017,39
(6)
:1137-
1149.
[10]DeyR,LuZhongjie,HongYi.Diagnosticclassificationoflungnodules
using3Dneuralnetworks[C]//Procofthe15thIEEEInternational
SymposiumonBiomedicalImaging.Piscataway,NJ:IEEEPress,2018:
774-778.
[11]SimonyanK,ZissermanA.Verydeepconvolutionalnetworksforlarge-
scaleimagerecognition[EB/OL].(2015-04-10).https://arxiv.org/
abs/1409.1556.
[12]HuJie,ShenLi,AlbanieS,etal.Squeeze-and-excitationnetworks[J].
IEEETransonPatternAnalysisandMachineIntelligence,2020,
42(8):2011-2023.
版权声明:本文标题:基于改进Faster R-CNN的低剂量CT图像肺结节检测 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1717248267a703579.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论