参加第七届“泰迪杯”数据挖掘挑战赛 B题直肠癌淋巴结转移的智能诊断 学习经验总结
如题,整个四月份都用来学做这个赛题了,虽然是个数据挖掘比赛,但是B题是一个集合了对医学图像的图像分割和特征提取,图像分类的综合图像处理题,也是自己为了实践一下自己所学的一些知识的尝试,本科及以上组的大佬们还是不少的,所以我这个刚刚接触的小透明,就抱着多学一点知识,对计算机视觉这个方向多一些了解和实践的想法,组了一个队友,找了指导老师后参赛了。虽然最后的整个赛题没有完全做完,准确的说是大部分时间花在第一问上了,对于第三问的图像分类算法也有了一些了解。在这个过程中自己把剩下的网易公开课中关于神经网络和卷积神经网络的部分全部看完了,由于时间原因没有进行总结,后期有时间的话再看一遍补上吧,没有时间的话就直接进行下面的课时学习了。
先留存一下题目:
B题直肠癌淋巴结转移的智能诊断
直肠癌是消化道最常见的恶性肿瘤之一,而直肠癌患者是否有淋巴结转移对治疗方案的决策以及病人预后有重要的影响,因此对是否有淋巴结转移的准确判断是直肠癌治疗的重要步骤。本问题希望能够设计出有效的算法通过对直肠癌 CT 影像特征的判断来对淋巴结转移情况进行评估,提高影像学对淋巴结转移判断的准确性。
具体任务如下:
任务一:直肠肿瘤分割
在CT 动脉期和门脉期增强图像上,肿瘤区域和周围组织在强度上存在差异。以数据集1 中提供的CT 影像和医生标记出的直肠肿瘤掩模为训练样本,设计图像分割算法,分割出直肠肿瘤所在的区域。由于 CT 图像是一个连续的扫描序列,参赛者需要给出每个病例每幅图像中标记肿瘤区域的掩模图像(掩模图像的解释见第三部分数据集说明)。
任务二:直肠肿瘤部分特征的提取
提取CT 图像中直肠癌肿瘤区域的影像特征,可以是平面的二维特征如形状、面积、强度、纹理、小波系数等,也可以是肿瘤部位的三维特征如体积、表面积等,也欢迎提出新的影像特征。
任务三:直肠肿瘤部分特征的提取
所给数据中包含淋巴结转移阴性和阳性的两类病例,请分析直肠肿瘤区域影像特征与是否淋巴结转移之间的关系,基于CT 影像数据建立分类模型并评估模型的有效性。可适当引入病人临床数据(如性别、年龄、实验室指标等)。
拓展任务:
直肠肿瘤的影像学研究中,精确分割肿瘤区域一直是实践中的一个难点。本问题拓展的一个方向是通过实验来验证当所选取区域适当扩大(例如覆盖一部分肿瘤的周边组织)或适当缩小(例如只选取肿瘤的部分核心区域)时,是否仍然能构建有效的模型来判断肿瘤是否已发生淋巴结转移。
因为其实题目没有完全完成,所以就记录一下学习的东西,具体的实现过程和更好的网络模型,希望等到6,7月份的赛题答疑交流的时候,能够从更多参赛选手和获奖选手那里学习一下,再完善自己的模型,后期整理好把论文和程序发上来。
首先,在研究第一问的时候,我和另一名队员通过了解,初步入门选择了U-net网络模型,U-net网络是一个很适合应用于医学图像处理的网络,目前已经算是一个比较成熟的网络,而且也有很多针对于医学图像处理的比赛,使得U-net网络得到了很好的发展,比如Kaggle,Lunach,天池医疗大奖赛等等,很多的获奖队伍都是基于U-net网络或者对其进行改进,入门的应该就是ISBI Challenge的细胞分割赛题了,基于这个赛题的资料,网上有很多。
U-net网络模型如下:
u-net论文:https://arxiv.org/pdf/1505.04597.pdf
u-net网络最大的特征就是一个上采样加一个下采样的全卷积过程,而且没有全连接层,网络的输入层为一张图像,网络的输出层仍然是一张等同大小的图像,其中的池化、卷积等一系列操作和卷积神经网络的基本相同。
通过一段时间的对网络的学习之后,我就开始对题目给定的图像进行预处理了。
由于题目给定的训练图像是:.dcm 的腹部横截面的CT图像和.png格式的肿瘤掩膜图像,因此对于CT图像我们又去找了一些预处理方式,转换成HU值,归一化……(因为不清楚对不对,所以就不详细讲了,等后期归纳)然后就是使用网络模型训练,然后对测试集进行预测了。
第二问因为时间原因,完全没有准备。
第三问,在指导老师的指导下,我们也找到了一些解题的思路,然后学习了一些图像分类的方法,其实基本操作还是基于卷积神经网络的,有了前面的学习这里就好理解多了,原理和方法清楚了,但是对于题目的表意,我们团队一直都讨论不出来选取的图像(感觉需要一部分医学知识,因为我们完全看不懂淋巴结的分布在哪里),所以这个题目并没有完成。
虽然比赛作品做的不尽人意,但是感觉自己的收获很大,二十多天的时间,用比赛来督促自己学习和实践,效果也很显著,毕竟才刚刚开始接触计算机视觉,像这种有实际问题和数据的实践更是第一次,总体来说基本达到了自己参赛的目的,在实践中学习和成长。本来也没有想过去获奖,现在就期望,最后的赛题学习交流的时候能够学到更多的东西,完善自己的这个比赛作品,希望能够真正把它做完吧。