核心观点

  • 块分类网络可通过修改输入大小与增加顶层被转换为端对端全图可训练网络
  • 从块分类器输出生成的热图层会在全图网络中导致信息瓶颈,应被移除以优化性能
  • 块分类器对整个图像分类器的性能至关重要
  • 所有卷积设计优于卷积和完全连接层的混合

问题

  1. 乳腺癌诊断不可简单视作图像分类任务
    病变状态由整张图像中的一小部分区域来确定
    若数据集存在 ROI 标注则可将其视为目标检测与分类问题
  2. 现有研究假定用于研究的数据集均是完全 ROI 标注的
    在此假定下训练出来的模型无法转换应用于普通数据集
  3. 需要考虑数据集仅存在全局标注的情况
    DM 比赛数据集就是如此:
    * 总 640000 张
    * 训练集中 2000 左右正样本

本文方案

  • 全卷积设计
    基于全标注数据集训练可识别局部 patch 的模型
    在没有 ROI 标注的情况下,利用端对端网络训练模型将其转换为全图分类器
    1. 在 patch 分类器上简单堆叠卷积块来构造全图分类器
    2. 利用卷积将输入大小从 patch 更改为全图
  • 附加设计
    从头开始构建整个图像分类器的管道

方案细节

  1. 从识别 patches 将分类器转换到全图
    即可解除对 ROI 标注的显式依赖
    利用卷积神经网络实现
  2. 顶层网络结构
    不使用全连接层的全卷积设计
    1. 删除块网络的最后几层,直到最后一个卷积层
    2. 在最后一个卷积层之上加入卷积层,使得 feature map 具有合适的大小
      residual and VGG block
    3. 加入一个全局均池化层与一个输出完整网络
      删除输出层,避免信息瓶颈问题:使得顶层无法完全利用块网络提供的信息
  3. patch 分类器网络训练过程
    首先,在 ImagNet 数据集上预训练得到权重,有利于加速学习与模型泛化。
    其次,使用三阶段训练策略进行训练。
    原因:
    1. 顶层需要比底层更高的学习率
    2. keras 不存在逐层调整学习率的功能
    实现:
    1. 以 1e-3 的学习率训练最后一层(最顶) for 三个周期
    2. 以 1e-4 的学习率解冻顶层们并训练十个周期
    3. 以 1e-5 的学习率解冻所有层并训练 37 个周期

  • 项目要求主要针对 patch 分类器来做,所以论文就看到这里了,后面整图训练过程没看了。