肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉

阅读报告-Perinodular and Intranodular Radiomic Features on Lung CT Images Distinguish Adenocarcinomas from Granulomas

(肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉)

perinodular 肿瘤结节周围 intranodular 肿瘤结节内部 Adenocarcinomas 腺癌 Granulomas息肉

收录期刊:RADIOLOGY 中科院分区:1区 大类学科:医学 发表日期:2018.12.18

论文作者:Niha Beig, MS•Mohammadhadi Khorrami, MS•Mehdi Alilou, PhD•Prateek Prasanna, PhD•Nathaniel Braman, BS•Mahdi Orooji, PhD•Sagar Rakshit, MD•Kaustav Bera, MD•Prabhakar Rajiah, MD•Jennifer Ginsberg, MS•Christopher Donatelli, MD•Rajat Thawani, MD•Michael Yang, MD•Frank Jacono, MD•Pallavi Tiwari, PhD•Vamsidhar Velcheti, MD•Robert Gilkeson, MD•Philip Linden, MD•Anant Madabhushi, PhD

作者机构:From the Department of Biomedical Engineering, Case Western Reserve University;Taussig Cancer Institute–Cleveland Clinic, Cleveland, Ohio (S.R.) ……

Purpose:

评估放射组学特征在非对比CT中区分非小细胞肺腺癌和息肉的能力。

Results:

具有结节内部放射学特征的支持向量机分类器在测试集上的ROC曲线下获得0.75的面积(AUC)。结合放射组织的结节内部与周围区域将AUC提高至0.80。在同一测试集上,CNN使得AUC为0.76。放射科医师阅读的AUC分别为0.61和0.60。

研究背景:

腺癌是非小细胞肺癌最常见的亚型,使其成为给定的非对比肺癌筛查人群中最常见的真阳性结果,而非钙化息肉代表最常见且可能最令人困惑的假阳性。区分这两种病理状况是胸部放射科医师面临的最具挑战性的问题之一,因为它们在CT图像上具有相似的外观。基于放射学或基于CNN的分析来区分良性和恶性肺结节是广泛的,但在CT图像上没有给出区分息肉和腺癌的特异性分析。而且没有任何工作试图集体评估结节形状和结节内异质性的结构模式的作用,并评估结节外的结构周围habitat,以分类腺癌和息肉。

进行的工作:

1.与结节外的放射学特征是否可预测非对比CT图像的恶性程度

2.评估与单独的结节内测量相比,结节周围和结节内放射学模式的组合是否更能预测结节恶性肿瘤。

3.将机器学习分类器结果与卷积神经网络(CNN)和两名放射科医师的诊断结果进行比较。

数据:

肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉
471名有腺癌或者息肉的患者的CT

筛选标准:病理报告的可用性,在轴视图中存在筛查或诊断性胸部CT图像、孤立性肺结节

剩余405例

去除CT伪影(48)、具有对比度增强(n = 37)的图像,以及在成像前进行活组织检查的患者(n= 30)

剩余290例,分为训练集和验证集

Training set 145 :腺癌73 息肉72

Validation cohort 145 :腺癌72 息肉73

实验方法:
  1. 放射科医生手工勾画出原始肿瘤区域

  2. 通过形态学操作对原始肿瘤区域进行膨胀,从而获取结节外的30mm的环状瘤周区域,将该30mm厚的区域划分为6个5mm厚的小环

    提取特征

    肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉
    experiment 1: 从肿瘤内部区域提取纹理特征 共252个

experiment 2: 从肿瘤周围区域提取纹理特征 252* 5 = 1512个

experiment 3:从肿瘤内部区域提取纹理特征 共252个

​ 从肿瘤周围区域提取纹理特征 252* 5 = 1512个

​ 形状特征 12个

​ 共计 1776个特征

特征类别

Haralick (13 descriptors): 量化以矩阵形式存储的图像中每个像素周围的局部邻域中的空间灰度共生矩阵(GLCM)

Gabor (25 descriptors):通过改变方向和比例考虑定向纹理以捕获微体系结构。每个描述符量化特定频率(f=0、2、4、8、16、32)和方向(θ=π/8、π/4、3π/8、π/2、3π/4)下对给定Gabor滤波器的响应。

Laws energy (25 descriptors): 5×5个对称或反对称掩模,用于提取图像上的水平(L)、边缘(E)、点(S)、波(W)和波纹(R)图案。这些掩模与每个图像的卷积导致每个CT序列的每个图像总共有25个不同的规律特征。

纹理特征(共252个)

统计值(statistic)包括4个:中值(median), 标准差(standard deviation), 偏态(skewness)和峰态(kurtosis)

  • Gabor特征:frequency(5) * theta(5) * statistic(4) = 100个
  • Laws Energy特征:5 * 5 * statistic(4) = 100个
  • Haralick特征:13 * statistic(4) = 52个

形状特征(共12个)

  • Size: Including Width, Height, Depth of bounding box
  • Area: from 2D slices of each nodule
  • Perimeter: rom 2D slices of each nodule
  • Eccentricity: foci of the ellipse and to major axis length
  • Extend: ratio of pixels in the region to pixels in the total bounding box
  • Compactness: ratio of the perimeter squared to the product of 4π and area
  • Radial distance: distances from center of each slice to contour points
  • Roughness: perimeter of slices divided by convex perimeterPage 6 of 15
  • Elongation: from major and minor axis
  • Convexity: from convex hull
  • Equivalent Diameter: Diameter of circle with same area of slices
  • Sphericity: 3D compactness
CNN提取深层特征:

在所有切片周围裁剪具有在所识别的结节的中心周围100个像素的感受野大小的二维斑块并且作为输入馈送。通过使用多层LeNet模型(手写数字识别中的一个经典的网络)提取深层特征。

统计分析

为了避免过拟合,选择显著性最强的12个特征进行统计分析(通过双侧Wilcoxon秩和检验)

使用的分类器:

  1. 线性判别分析(linear discriminant analysis),
  2. 二次判别分析(quadratic discriminant analysis),
  3. 支持向量机(support vector machine)基于线性核和径向基函数核
  4. 随机森林(random forest)
  • 评价指标:AUC

CNN诊断:LeNet模型

医生诊断:Reader1:经认证的影像科医生

​ Reader2:胸腔科医生(3年阅读胸腔CT经验)

评分:良性,可能良性,不确定,可能恶性,恶性,五种诊断结果,分别对应0.2, 0.4, 0.6, 0.8, 1的得分,由此计算医生的AUC

实验结果
实验一:结节外的放射学特征区分腺癌和息肉

表1:从训练集中获得的前12个放射学特征
肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉
结果分析:

  • 显著性最强的12个特征都来自于距离结节5mm之内的瘤周,及最小的那个圆环;
  • 在这12个特征中,有11个都是低频Gabor特征,另外一个为Laws Energy特征(R5S5)
  • 四个不同的分类器中,AUC(=0.74)最高的为支持向量机(线性核),相应的准确度,敏感度和特异度分别为68%,77%和63%。
实验二:联合放射组学(结节内和周围结构纹理特征)区分腺癌与息肉

表2:从训练集中获得的前12个放射学特征
肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉
结果分析:

  • 显著性最强的12个特征中,有3个来自于距离结节5mm之内的瘤周,剩下9个来自于肿瘤区域

  • 四个不同的分类器中,AUC(=0.80)最高的为支持向量机(线性核),相应的准确度,敏感度和特异度分别为71%,74%和68%。

实验三:人机比较(将机器学习结果与CNN和医生诊断作比较)

表3:CT图像上用不同的分类器区分腺癌和肉芽肿的训练和独立测试集获得的AUC值
肺CT图像上的周围结节和结节内放射学特征区分腺癌和息肉
LDA:线性判别分析 QDA:二次判别分析 RBF:径向基函数 RF:随机森林

CNN诊断结果:LeNet的AUC为0.76,敏感度和特异性分别为72%和76%

医生诊断:两位医生的AUC分别为0.61和0.6

实验结果

实验中选择出来的没有基于形状的特征而都是结节内和结节周围的纹理特征,表明计算机提取的结节周围纹理特征比任何给定结节的形状属性更能预测恶性肿瘤。

结论

来自结节的结节内和结节周围区域的放射学特征可以在非对比CT中区分非小细胞肺癌和良性息肉。