Carvana Image Masking Challenge on Kaggle
车辆边界识别与车辆分割的解决方案.

Github 项目 - carvana-challenge

9th place (top 1.2%) on Public Leaderboard
31th place (top 4.2%) on Private Leaderboard
团队成员:Chia-Hao HsiehShao-Wen Lai

1. 竞赛问题


自动从图片中移除背景,精确分割出车辆及其边界.

2. 数据

  • 训练数据
  • 测试数据
  1. 张测试图片

3. 评估 Evaluation

采用平均 Dice 相关系数(mean Dice coefficient) 作为评估标准.
Dice 相关系数用于对比预测分割结果和其对应的 groundtruth 分割标注间的像素级一致性.
${\frac{2 * |X \cap Y|}{|X| + |Y|}}$
其中,X 是预测的像素集,Y 是 groundtruth 标注像素值.

如果 X 和 Y 都是空集,则 Dice 相关系数设为 1.

4. 解决方案

该解决方案采用了 U-Net 模型的 5 个改进版本的集成. 模型采用 1280x1280 尺寸作为输入图片尺寸.
损失函数采用 Soft Dice Loss 和二值交叉熵(Binary Cross Entropy Loss).
网络训练时,数据增强包括,翻转(flipping),平移(shifting),缩放(scaling),HSV 颜色增强(color augmentation) 和 fancy PCA.

单台 P5000 GPU 的机器,训练单个模型大概耗时 60-80 小时;测试耗时约 6-8 小时.

4.1 最佳表现的单模型


4.2 结果

最佳的模型集成得到的结果为:

  • 0.997191 mean Dice coefficient on Private Leaderboard
  • 0.996899 mean Dice coefficient on Public Leaderboard.

最佳单模型的结果示例:


Last modification:October 9th, 2018 at 05:25 pm