论文阅读 - Semantic Soft Segmentation

博主： AIHGF
发布时间：2018 年 08 月 01 日
9873 次浏览
9 条评论
4588字数
分类：语义分割论文阅读

论文：Semantic Soft Segmentation - SIGGRAPH2018
作者：Yagiz Aksoy, Tae-Hyun Oh, Sylvain Paris, Marc Pollefeys and Wojciech Matusik
团队：MIT CSAIL, Adobe Research
Paper - Semantic Soft Segmentation - SIGGRAPH2018
Supplementary Material - Semantic Soft Segmentation - SIGGRAPH2018
HomePage
Github - SIGGRAPH18SSS - Semantic feature generator- 特征提取源码
Github - Spectral segmentation implementation - 分割源码
YouTube - Video

语义软分割(Semantic Soft Segments)，旨在精确表示图像不同区域间的软过渡. 类似与磁力套索(magnetic lasso) 和魔术棒(magic wand) 的功能.

semantic soft segments, a set of layers that correspond to semantically meaningful regions in an image with accurate
soft transitions between different objects.

从谱分割(spectral segmentation) 角度来解决 soft segmentation 问题，提出的图结构(Graph Structure)，既考虑了图片的纹理和颜色特征，也利用了由深度神经网络生成的更高层的语义信息.
根据仔细构建的 Laplacian 矩阵的特征分解(eigendecomposition) 自动的生成 soft segments.

出发点：
[1] - 能够分割图片中的不同物体，同时精确表示出分割物体间的过渡情况.
[2] - 自动完成分割，不用手工操作.

Semantic Soft Segmentation，自动将图像分解为不同的层，以覆盖场景的物体对象，并通过软过渡(soft transitions) 来分离不同的物体对象.

1. 技术路线

问题描述：
给定输入图片，自动生成其 soft 分割结果，即，分解为表示了场景内物体的不同层，包括物体的透明度和物体间的软过渡.
每一层的各个像素由一个透明度值alpha表示. alpha=0 表示完全不透明(fully opaque)，alpha=1 表示完全透明(fully transparent)，alpha 值在 0-1 之间，则表示部分不透明度.

输入图片的 RGB 像素可以表示为每一层中的像素值与对应的 alpha 值的加权和.

1.1. 低层特征构建 - Nonlocal ColorAffinity

构建低层次的仿射关系项，以表示基于颜色的像素间较大范围的关联性特征.

主要构建过程：
[1] - 采用 SLIC 生成 2500 个超像素;
[2] - 估计每个超像素和对应于图像 20% 尺寸半径内所有超像素的仿射关系.

1.2. 高层特征构建 - High-Level Semantic Affinity

虽然 nonlocal color affinity 添加了像素间大范围间的相互作用关系，但仍是低层特征.
这里构建高层语义仿射关系项，以使得属于同一场景物体的像素尽可能的接近，不同场景物体的像素间的关系远离.

1.3. 图像层创建 - Creating the Layers

通过对 Laplacian 矩阵进行特征分解，提取特征向量，并对特征向量进行两步稀疏处理，来创建图像层.

[1] - 构建 Laplacian 矩阵
[2] - 受约束的稀疏化(Constrained sparsification)
[3] - 松弛的稀疏化(Relaxed sparsification)

1.4. 语义特征向量 - Semantic Feature Vectors

在高层特征构建时，相同物体的像素的特征向量相似，不同物体的像素的特征向量不同.
特征向量是采用语义分割的深度网络模型训练和生成的.

这里采用了 DeepLab-ResNet-101 作为特征提取器，但网络训练是采用的是度量学习方法，最大化不同物体的特征间的 L2 距离(稍微修改了 N-Pair loss).

在 COCO-Stuff 数据集上进行语义分割网络的训练.
采用 guided filter 将网络生成的 feature map 与图像进行边缘对齐.
然后采用 PCA 降低 feature map 维度到 3.
最后，归一化特征向量值到 [0, 1].

2. 分析实验

在 MATLAB 环境，640x480 的图片处理耗时约为 3 分钟.

Semantic Soft Segmentation 是 semantic segmentation, neural image matting 和 soft segmentation 的交叉.

2.1. Spectral Matting and Semantic Segmentation

2.2. Natural Image Matting

2.3. Soft Color Segmentation

2.4. Using Semantic Soft Segments for Image Editing

2.5. Limitations

最后修改：2021 年 03 月 04 日

如果觉得我的文章对你有用，请随意赞赏

9 条评论

Julian
July 31st, 2019 at 06:15 pm

请问一下，有没有相关的数据集呢

回复
1. AIHGF
  August 1st, 2019 at 08:43 am
  
  @Julian
  
  没有论文里的训练数据集.
  
  回复
Matting
June 30th, 2019 at 11:58 am

学习学习OωO

回复
lee
April 15th, 2019 at 04:22 pm

您好，请问这篇文章是不是还没有训练代码？

回复
1. AIHGF
  April 15th, 2019 at 05:21 pm
  
  @lee
  
  好像没有开源训练代码，从论文里的描述来看，训练在 loss 方面有点意思.
  
  回复
  1. Owen
    April 28th, 2019 at 10:37 am
    
    @AIHGF
    
    我最近在探索一种行之有效的分割手机APP界面上各种元素的方法，这篇论文看上去比较适合，研究研究。
    
    回复
    
    AIHGF
    April 28th, 2019 at 02:08 pm
    
    @Owen
    
    这个对环境要求有点小高，矩阵计算在 MATLAB 上消耗比较大.
    
    回复
    
    Owen
    April 28th, 2019 at 04:04 pm
    
    @AIHGF
    
    嗯，不打算直接在手机端本地完成计算。截屏回传到专门的执行机来进行，因为之前对python熟悉一些，打算改造个python的脚本试试。请问您知道有可以参考的python实现吗？
    
    回复
    
    AIHGF
    April 28th, 2019 at 04:44 pm
    
    @Owen
    
    好像还没看到 python 的实现，demo 代码利用了很多 matlab 的 inbuilt 函数.
    
    回复

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

论文阅读 - Semantic Soft Segmentation

AIHGF • 2018 年 08 月 01 日

<blockquote>论文：<a class="no-external-link" href="http://people.inf.ethz.ch/aksoyy/papers/TOG18-sss.pdf" target="_blank">Semantic Soft Segmentation - SIGGRAPH2018</a>作者：<a class="no-external-link" href="http://people.inf.ethz.ch/aksoyy/" target="_blank">Yagiz Aksoy</a>, <a class="no-external-link" href="http://taehyunoh.com/" target="_blank">Tae-Hyun Oh</a>, <a class="no-external-link" href="http://people.csail.mit.edu/sparis/" target="_blank">Sylvain Paris</a>, <a class="no-external-link" href="https://www.inf.ethz.ch/personal/marc.pollefeys/" target="_blank">Marc Pollefeys</a> and <a class="no-external-link" href="http://people.csail.mit.edu/wojciech/" target="_blank">Wojciech Matusik</a>团队：MIT CSAIL, Adobe Research<a class="no-external-link" href="http://people.inf.ethz.ch/aksoyy/papers/TOG18-sss.pdf" target="_blank">Paper - Semantic Soft Segmentation - SIGGRAPH2018</a><a class="no-external-link" href="http://people.inf.ethz.ch/aksoyy/papers/TOG18-sss-supp.pdf" target="_blank">Supplementary Material - Semantic Soft Segmentation - SIGGRAPH2018</a><a class="no-external-link" href="http://people.inf.ethz.ch/aksoyy/sss/" target="_blank">HomePage</a><a class="no-external-link" href="https://github.com/iyah4888/SIGGRAPH18SSS" target="_blank">Github - SIGGRAPH18SSS - Semantic feature generator- 特征提取源码</a><a class="no-external-link" href="https://github.com/yaksoy/SemanticSoftSegmentation" target="_blank">Github - Spectral segmentation implementation - 分割源码</a><a class="no-external-link" href="https://youtu.be/QYIQbfnS9jA" target="_blank">YouTube - Video</a></blockquote>语义软分割(Semantic Soft Segments)，旨在精确表示图像不同区域间的软过渡. 类似与磁力套索(magnetic lasso) 和魔术棒(magic wand) 的功能.<blockquote>semantic soft segments, a set of layers that correspond to semantically meaningful regions in an image with accurate soft transitions between different objects.</blockquote>从谱分割(spectral segmentation) 角度来解决 soft segmentation 问题，提出的图结构(Graph Structure)，既考虑了图片的纹理和颜色特征，也利用了由深度神经网络生成的更高层的语义信息. 根据仔细构建的 Laplacian 矩阵的特征分解(eigendecomposition) 自动的生成 soft segments.<img src="https://www.aiuai.cn/uploads/sina/5ce8df9e511ee.jpg" alt="" title="" style="">出发点： [1] - 能够分割图片中的不同物体，同时精确表示出分割物体间的过渡情况. [2] - 自动完成分割，不用手工操作.Semantic Soft Segmentation，自动将图像分解为不同的层，以覆盖场景的物体对象，并通过软过渡(soft transitions) 来分离不同的物体对象.相关研究方向：<ul><li>Soft segmentation - 将图像分解为两个或多个分割，每个像素可能属于不止一个分割部分.</li><li>Natural image matting - 估计用于定义的前景区域中每个像素的不透明度. 一般输入是 trimap，其分别定义了不透明的前景，透明的背景以及未知透明度的区域.</li><li>Targeted edit propagation</li><li>Semantic segmentation - 语义分割</li></ul><h2>1. 技术路线</h2>问题描述： 给定输入图片，自动生成其 soft 分割结果，即，分解为表示了场景内物体的不同层，包括物体的透明度和物体间的软过渡. 每一层的各个像素由一个透明度值alpha表示. alpha=0 表示完全不透明(fully opaque)，alpha=1 表示完全透明(fully transparent)，alpha 值在 0-1 之间，则表示部分不透明度.<img src="https://www.aiuai.cn/uploads/sina/5ce8df9ede7a0.jpg" alt="" title="" style="">输入图片的 RGB 像素可以表示为每一层中的像素值与对应的 alpha 值的加权和.<img src="https://www.aiuai.cn/uploads/sina/5ce8df9f2d1e5.jpg" alt="" title="" style=""><h3>1.1. 低层特征构建 - Nonlocal ColorAffinity</h3>构建低层次的仿射关系项，以表示基于颜色的像素间较大范围的关联性特征.主要构建过程： [1] - 采用 SLIC 生成 2500 个超像素; [2] - 估计每个超像素和对应于图像 20% 尺寸半径内所有超像素的仿射关系.<img src="https://www.aiuai.cn/uploads/sina/5ce8df9fbb19f.jpg" alt="" title="" style=""><h3>1.2. 高层特征构建 - High-Level Semantic Affinity</h3>虽然 nonlocal color affinity 添加了像素间大范围间的相互作用关系，但仍是低层特征. 这里构建高层语义仿射关系项，以使得属于同一场景物体的像素尽可能的接近，不同场景物体的像素间的关系远离.<img src="https://www.aiuai.cn/uploads/sina/5ce8dfa017c54.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa06a953.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa10c7f2.jpg" alt="" title="" style=""><h3>1.3. 图像层创建 - Creating the Layers</h3>通过对 Laplacian 矩阵进行特征分解，提取特征向量，并对特征向量进行两步稀疏处理，来创建图像层.[1] - 构建 Laplacian 矩阵 [2] - 受约束的稀疏化(Constrained sparsification) [3] - 松弛的稀疏化(Relaxed sparsification)<img src="https://www.aiuai.cn/uploads/sina/5ce8dfa17bfc2.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa241ff8.jpg" alt="" title="" style=""><h3>1.4. 语义特征向量 - Semantic Feature Vectors</h3>在高层特征构建时，相同物体的像素的特征向量相似，不同物体的像素的特征向量不同. 特征向量是采用语义分割的深度网络模型训练和生成的.这里采用了 DeepLab-ResNet-101 作为特征提取器，但网络训练是采用的是度量学习方法，最大化不同物体的特征间的 L2 距离(稍微修改了 N-Pair loss).<img src="https://www.aiuai.cn/uploads/sina/5ce8dfa2e00e7.jpg" alt="" title="" style="">在 COCO-Stuff 数据集上进行语义分割网络的训练. 采用 guided filter 将网络生成的 feature map 与图像进行边缘对齐. 然后采用 PCA 降低 feature map 维度到 3. 最后，归一化特征向量值到 [0, 1].<img src="https://www.aiuai.cn/uploads/sina/5ce8dfa36d425.jpg" alt="" title="" style=""><h2>2. 分析实验</h2>在 MATLAB 环境，640x480 的图片处理耗时约为 3 分钟.Semantic Soft Segmentation 是 semantic segmentation, neural image matting 和 soft segmentation 的交叉.<h3>2.1. Spectral Matting and Semantic Segmentation</h3><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa3dee7e.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa4792f6.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa529b4c.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa5b4e89.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa633d5c.jpg" alt="" title="" style=""><h3>2.2. Natural Image Matting</h3><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa69b71a.jpg" alt="" title="" style=""><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa72f095.jpg" alt="" title="" style=""><h3>2.3. Soft Color Segmentation</h3><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa7b443d.jpg" alt="" title="" style=""><h3>2.4. Using Semantic Soft Segments for Image Editing</h3><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa83d7b9.jpg" alt="" title="" style=""><h3>2.5. Limitations</h3><img src="https://www.aiuai.cn/uploads/sina/5ce8dfa8dc49f.jpg" alt="" title="" style="">

1. 技术路线

1.1. 低层特征构建 - Nonlocal ColorAffinity

1.2. 高层特征构建 - High-Level Semantic Affinity

1.3. 图像层创建 - Creating the Layers

1.4. 语义特征向量 - Semantic Feature Vectors

2. 分析实验

2.1. Spectral Matting and Semantic Segmentation

2.2. Natural Image Matting

2.3. Soft Color Segmentation

2.4. Using Semantic Soft Segments for Image Editing

2.5. Limitations

9 条评论

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

论文阅读 - Semantic Soft Segmentation

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款