L1 Loss 函数

博主： AIHGF
发布时间：2018 年 10 月 13 日
6211 次浏览
4 条评论
7445字数
分类：深度平台

1. Pytorch nn.L1Loss

torch.nn.L1Loss()
torch.nn.L1Loss() 源码

class torch.nn.L1Loss(size_average=None, reduce=None, reduction='elementwise_mean')

L1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.

L1 Loss 可描述为：

$l(x, y) = L = \lbrace l_1, ..., l_N \rbrace ^T$

其中，$l_n = |x_n - y_n|$，$N$ 为 batch size.

如果 reduce=True 且 size_average=True，则 $l(x, y) = mean(L)$；

如果 reduce=True 且 size_average=False，则 $l(x, y) = sum(L)$；

input x 和 target y 都可以是包含 n 个元素的任意 shape.

Shape:

Input x - (N, * )
Target y - (N, * )
Output - 标量值, 如果reduction=False，则与 Input x 一致，(N, *)

示例：

>>> loss = nn.L1Loss()
>>> input = torch.randn(3, 5, requires_grad=True)
>>> target = torch.randn(3, 5)
>>> output = loss(input, target)
>>> output.backward()

2. Caffe 添加 L1 Loss 层(转)

原文：在caffe中添加新层 L1 Loss layer - isMarvellous
caffe - l1_loss_layer - Github

2.1 L1 Loss 的计算推导

与欧式距离（L2 Loss）相似，L1 Loss也是两个输入向量直接距离的一种度量.

但L2 Loss的梯度在接近零点的时候梯度值也会接近于0，使学习进程变慢，而L1 Loss的梯度是一个常数，不存在这个问题. L1 Loss 和 L2 Loss 还有一些不同的特点，各有使用的场合. 这里主要关注如何在caffe中实现 L1 Loss.

2.1.1 Forward 计算

L1 Loss 前向计算的是两个输入向量 $\mathbf{x}_1$ 和 $\mathbf{x}_2$ 间的距离，即：

$L = \frac{1}{N} \sum_i^N ||\mathbf{x}_1^{(i)} - \mathbf{x}_2^{(i)}||$

$N$ 为输入样本的数量.

2.1.2 Backward 计算

L1 Loss 自身没有参数，只需计算对输入数据的导数即可：

如果 $x_1^{(i)} > x_2^{(i)}$，则 $\frac{\partial L}{\partial \mathbf{x}_1^{(i)}} = \frac{1}{N}$，$\frac{\partial L}{\partial \mathbf{x}_2^{(i)}} = - \frac{1}{N}$

如果 $x_1^{(i)} < x_2^{(i)}$，则 $\frac{\partial L}{\partial \mathbf{x}_1^{(i)}} = - \frac{1}{N}$，$\frac{\partial L}{\partial \mathbf{x}_2^{(i)}} = \frac{1}{N}$

2.2. Caffe 实现

在caffe中添加层一般需要以下几个步骤：

[1] - 在include/caffe/layers/l1_loss_layer.hpp中添加声明
[2] - 在 src/caffe/layers/l1_loss_layer.cpp 中进行实现
[3] - 如果需要GPU版本，在 src/caffe/layers/l1_loss_layer.cu 中进行实现.
[4] - 在 cpp 文件中用 layer_factory.hpp 提供的宏实例化并注册新的层. 假如新的层叫做 L1LossLayer： (好像不需要这一步...)
```
INSTANTIATE_CLASS(L1LossLayer);
REGISTER_LAYER_CLASS(L1Loss);
```
[5] - 在 src/caffe/test/test_l1_loss_layer.cpp 中写测试。

[6] - 编译

make -j
make test -j
make runtest GTEST_FILTER='L1LossLayerTest/*'

2.2.1 Forward 计算

前向计算主要是实现Forward_cpu和Forward_gpu两个函数.

CPU 版本：

// src/caffe/layers/l1_loss_layer.cpp 
template <typename Dtype> 
void L1LossLayer<Dtype>::Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) { 
    int count = bottom[0]->count(); 
    caffe_sub(count, 
              bottom[0]->cpu_data(), 
              bottom[1]->cpu_data(), 
              diff_.mutable_cpu_data()); 
    Dtype loss = caffe_cpu_asum(count, diff_.cpu_data()) / bottom[0]->num(); 
    top[0]->mutable_cpu_data()[0] = loss; 
}

GPU 版本：

template <typename Dtype> 
void L1LossLayer<Dtype>::Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) { 
    int count = bottom[0]->count(); 
    caffe_gpu_sub(count, 
                  bottom[0]->gpu_data(), 
                  bottom[1]->gpu_data(), 
                  diff_.mutable_gpu_data()); 
    Dtype asum; 
    caffe_gpu_asum(count, diff_.gpu_data(), &asum); // gpu函数，使用gpu_data() 
    Dtype loss = asum / bottom[0]->num(); 
    top[0]->mutable_cpu_data()[0] = loss; // 这里没有使用gpu函数，是普通的cpu运算，所以使用cpu_data() 
}

2.2.2 Backward 计算

反向计算主要是实现Backward_cpu和Backward_gpu两个函数.

CPU 版本：

template <typename Dtype> 
void L1LossLayer<Dtype>::Backward_cpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom) { 
    for (int i = 0; i < 2; ++i) { 
        if (propagate_down[i]) { 
            const Dtype sign = (i == 0) ? 1 : -1; // 对两个输入的反向计算的差异仅是正负号，所以根据输入blob的序号确定一个符号即可 
            const Dtype alpha = sign * top[0]->cpu_diff()[0] / bottom[i]->num(); // alpha = 1/N. top[0]->cpu_diff()[0]是weight_loss 
            // 使用diff_的符号来判断两个输入blob哪个大 
            caffe_cpu_sign(bottom[i]->count(), 
                           diff_.cpu_data(), 
                           bottom[i]->mutable_cpu_diff()); 
            // caffe_cpu_scale(n, alpha, x, y): y = alpha * x 
            caffe_cpu_scale(bottom[i]->count(), 
                            alpha, 
                            bottom[i]->cpu_diff(), 
                            bottom[i]->mutable_cpu_diff()); 
        } 
    } 
}

解释一下上面函数中的 top[0]->cpu_diff()[0].

我们知道，每一层回传的梯度是由上一层传回来的梯度乘以本层的梯度得到的. 但我们现在本来就是loss层了，后面没有层了，那这个top[0]->cpu_diff()[0]是什么呢？注意，这里只是取了top[0]->cpu_diff()的第一个元素，其实它就是我们在prototxt中定义的 loss_weight.

GPU 版本：

template <typename Dtype> 
void L1LossLayer<Dtype>::Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom) { 
    for (int i = 0; i < 2; ++i) { 
        if (propagate_down[i]) { 
            const Dtype sign = (i == 0) ? 1 : -1; 
            const Dtype alpha = sign * top[0]->cpu_diff()[0] / bottom[i]->num(); // 这里是cpu运算，使用cpu_diff() 
            caffe_gpu_sign(bottom[i]->count(), 
                           diff_.gpu_data(), 
                           bottom[i]->mutable_gpu_diff()); 
            caffe_gpu_scale(bottom[i]->count(), 
                           alpha, 
                           bottom[i]->gpu_diff(), 
                           bottom[i]->mutable_gpu_diff()); 
        } 
    } 
}

2.3 测试文件

测试文件是用来检查我们编写的层的前向和后向计算是否正确的. 主要分为以下几个部分.

通过 L1LossLayerTest 类中的 TestForward() 成员来检查 loss 是否可以被 loss weight 正确放缩.

void TestForward() { 
    // 不指定loss weight，得到一个loss值loss_weight_1，相当于loss weight为1。
    LayerParameter layer_param; 
    L1LossLayer<Dtype> layer_weight_1(layer_param); 
    layer_weight_1.SetUp(this->blob_bottom_vec_, this->blob_top_vec_); 
    const Dtype loss_weight_1 = layer_weight_1.Forward(this->blob_bottom_vec_, this->blob_top_vec_); 
    // 指定一个特定的loss weight，再得到一个loss值loss_weight_2， 
    // 然后检查loss_weight_2是否被正确地放缩.
    const Dtype kLossWeight = 3.7; 
    layer_param.add_loss_weight(kLossWeight); 
    L1LossLayer<Dtype> layer_weight_2(layer_param); 
    layer_weight_2.SetUp(this->blob_bottom_vec_, this->blob_top_vec_); 
    const Dtype loss_weight_2 = layer_weight_2.Forward(this->blob_bottom_vec_, this->blob_top_vec_); 
    const Dtype kErrorMargin = 1e-5; 
    EXPECT_NEAR(loss_weight_1 * kLossWeight, loss_weight_2, kErrorMargin); 
    // 确保loss不会过小 
    const Dtype kNonTrivialAbsThresh = 1e-1; 
    EXPECT_GE(fabs(loss_weight_1), kNonTrivialAbsThresh); 
}

利用数值方法计算梯度，然后和本层的梯度计算进行比较，检查是否正确. 这是通过调用caffe提供的GradientChecker实现的.

// 通过和数值计算的梯度值对比，检查本层梯度计算是否正确
TYPED_TEST(L1LossLayerTest, TestGradient) { 
    typedef typename TypeParam::Dtype Dtype; 
    LayerParameter layer_param; 
    const Dtype kLossWeight = 3.7; 
    layer_param.add_loss_weight(kLossWeight); 
    L1LossLayer<Dtype> layer(layer_param); 
    layer.SetUp(this->blob_bottom_vec_, this->blob_top_vec_); 
    GradientChecker<Dtype> checker(1e-4, 1e-2, 1701); // 1e-4为梯度数值计算的步长，1e-2为比较的阈值 checker.
    CheckGradientExhaustive(&layer, this->blob_bottom_vec_, this->blob_top_vec_); 
}

3. 其它实现

keras 里的定义：keras/losses.py

from . import backend as K

def mean_absolute_error(y_true, y_pred):
    return K.mean(K.abs(y_pred - y_true), axis=-1)

tensorflow 里的定义 : tf.losses.absolute_difference - Adds an Absolute Difference loss to the training procedure.

tf.losses.absolute_difference(
    labels,
    predictions,
    weights=1.0,
    scope=None,
    loss_collection=tf.GraphKeys.LOSSES,
    reduction=Reduction.SUM_BY_NONZERO_WEIGHTS
)

最后修改：2018 年 10 月 13 日

如果觉得我的文章对你有用，请随意赞赏

4 条评论

北念
December 6th, 2018 at 02:19 pm

请问在caffe里面添加l1_loss,需要在caffe.proto增加对应的LayerParameter message吗？

回复
1. AIHGF
  December 6th, 2018 at 02:39 pm
  
  @北念
  
  是的，参数需要添加到 caffe.proto 中
  
  回复
  1. 北念
    February 23rd, 2019 at 10:37 am
    
    @AIHGF
    
    您好，请问您发给我一份修改过的caffe.proto吗？我改了几次，编译不通过，十分感谢！邮箱2456628333@qq.com
    
    回复
    
    AIHGF
    February 23rd, 2019 at 01:27 pm
    
    @北念
    
    出错的问题是什么？
    
    回复

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

L1 Loss 函数

AIHGF • 2018 年 10 月 13 日

<h2>1. Pytorch nn.L1Loss</h2><blockquote><a class="no-external-link" href="https://pytorch.org/docs/stable/nn.html?highlight=loss#torch.nn.L1Loss" target="_blank">torch.nn.L1Loss()</a><a class="no-external-link" href="https://pytorch.org/docs/stable/_modules/torch/nn/modules/loss.html#L1Loss" target="_blank">torch.nn.L1Loss() 源码</a></blockquote><pre><code class="lang-python">class torch.nn.L1Loss(size_average=None, reduce=None, reduction='elementwise_mean')</code></pre>L1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.L1 Loss 可描述为：$l(x, y) = L = \lbrace l_1, ..., l_N \rbrace ^T$其中，$l_n = |x_n - y_n|$，$N$ 为 batch size.如果 <code>reduce=True</code> 且 <code>size_average=True</code>，则 $l(x, y) = mean(L)$；如果 <code>reduce=True</code> 且 <code>size_average=False</code>，则 $l(x, y) = sum(L)$；input x 和 target y 都可以是包含 n 个元素的任意 shape.Shape:<ul><li>Input x - (N, * )</li><li>Target y - (N, * )</li><li>Output - 标量值, 如果<code>reduction=False</code>，则与 Input x 一致，(N, *)</li></ul>示例：<pre><code class="lang-python">&gt;&gt;&gt; loss = nn.L1Loss()
&gt;&gt;&gt; input = torch.randn(3, 5, requires_grad=True)
&gt;&gt;&gt; target = torch.randn(3, 5)
&gt;&gt;&gt; output = loss(input, target)
&gt;&gt;&gt; output.backward()</code></pre><h2>2. Caffe 添加 L1 Loss 层(转)</h2><blockquote>原文：<a class="no-external-link" href="https://blog.csdn.net/ismarvellous/article/details/79069661" target="_blank">在caffe中添加新层 L1 Loss layer - isMarvellous</a><a class="no-external-link" href="https://github.com/Xiaoyi-Jia/caffe-l1_loss_layer" target="_blank">caffe - l1_loss_layer - Github</a></blockquote><h3>2.1 L1 Loss 的计算推导</h3>与欧式距离（L2 Loss）相似，L1 Loss也是两个输入向量直接距离的一种度量.但L2 Loss的梯度在接近零点的时候梯度值也会接近于0，使学习进程变慢，而L1 Loss的梯度是一个常数，不存在这个问题. L1 Loss 和 L2 Loss 还有一些不同的特点，各有使用的场合. 这里主要关注如何在caffe中实现 L1 Loss.<h4>2.1.1 Forward 计算</h4>L1 Loss 前向计算的是两个输入向量 $\mathbf{x}_1$ 和 $\mathbf{x}_2$ 间的距离，即：$L = \frac{1}{N} \sum_i^N ||\mathbf{x}_1^{(i)} - \mathbf{x}_2^{(i)}||$$N$ 为输入样本的数量.<h4>2.1.2 Backward 计算</h4>L1 Loss 自身没有参数，只需计算对输入数据的导数即可：如果 $x_1^{(i)} &gt; x_2^{(i)}$，则 $\frac{\partial L}{\partial \mathbf{x}_1^{(i)}} = \frac{1}{N}$，$\frac{\partial L}{\partial \mathbf{x}_2^{(i)}} = - \frac{1}{N}$如果 $x_1^{(i)} &lt; x_2^{(i)}$，则 $\frac{\partial L}{\partial \mathbf{x}_1^{(i)}} = - \frac{1}{N}$，$\frac{\partial L}{\partial \mathbf{x}_2^{(i)}} = \frac{1}{N}$ <img src="https://www.aiuai.cn/uploads/sina/5ce8de3f422f0.jpg" alt="" title="" style=""><h3>2.2. Caffe 实现</h3>在caffe中添加层一般需要以下几个步骤：<ul><li>[1] - 在<code>include/caffe/layers/l1_loss_layer.hpp</code>中添加声明</li><li>[2] - 在 <code>src/caffe/layers/l1_loss_layer.cpp</code> 中进行实现</li><li>[3] - 如果需要GPU版本，在 <code>src/caffe/layers/l1_loss_layer.cu</code> 中进行实现.</li><li>[4] - 在 <code>cpp</code> 文件中用 <code>layer_factory.hpp</code> 提供的宏实例化并注册新的层. 假如新的层叫做 <code>L1LossLayer：</code> (好像不需要这一步...)<pre><code class="lang-cpp">INSTANTIATE_CLASS(L1LossLayer);
REGISTER_LAYER_CLASS(L1Loss);</code></pre></li><li>[5] - 在 <code>src/caffe/test/test_l1_loss_layer.cpp</code> 中写测试。</li><li>[6] - 编译<pre><code class="lang-shell">make -j
make test -j
make runtest GTEST_FILTER='L1LossLayerTest/*'</code></pre></li></ul><h4>2.2.1 Forward 计算</h4>前向计算主要是实现Forward_cpu和Forward_gpu两个函数.CPU 版本：<pre><code class="lang-cpp">// src/caffe/layers/l1_loss_layer.cpp 
template &lt;typename Dtype&gt; 
void L1LossLayer&lt;Dtype&gt;::Forward_cpu(const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; bottom, const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; top) { 
 int count = bottom[0]-&gt;count(); 
 caffe_sub(count, 
 bottom[0]-&gt;cpu_data(), 
 bottom[1]-&gt;cpu_data(), 
 diff_.mutable_cpu_data()); 
 Dtype loss = caffe_cpu_asum(count, diff_.cpu_data()) / bottom[0]-&gt;num(); 
 top[0]-&gt;mutable_cpu_data()[0] = loss; 
}</code></pre>GPU 版本：<pre><code class="lang-cpp">template &lt;typename Dtype&gt; 
void L1LossLayer&lt;Dtype&gt;::Forward_gpu(const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; bottom, const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; top) { 
 int count = bottom[0]-&gt;count(); 
 caffe_gpu_sub(count, 
 bottom[0]-&gt;gpu_data(), 
 bottom[1]-&gt;gpu_data(), 
 diff_.mutable_gpu_data()); 
 Dtype asum; 
 caffe_gpu_asum(count, diff_.gpu_data(), &amp;asum); // gpu函数，使用gpu_data() 
 Dtype loss = asum / bottom[0]-&gt;num(); 
 top[0]-&gt;mutable_cpu_data()[0] = loss; // 这里没有使用gpu函数，是普通的cpu运算，所以使用cpu_data() 
}</code></pre><h4>2.2.2 Backward 计算</h4>反向计算主要是实现Backward_cpu和Backward_gpu两个函数.CPU 版本：<pre><code class="lang-cpp">template &lt;typename Dtype&gt; 
void L1LossLayer&lt;Dtype&gt;::Backward_cpu(const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; top, const vector&lt;bool&gt;&amp; propagate_down, const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; bottom) { 
 for (int i = 0; i &lt; 2; ++i) { 
 if (propagate_down[i]) { 
 const Dtype sign = (i == 0) ? 1 : -1; // 对两个输入的反向计算的差异仅是正负号，所以根据输入blob的序号确定一个符号即可 
 const Dtype alpha = sign * top[0]-&gt;cpu_diff()[0] / bottom[i]-&gt;num(); // alpha = 1/N. top[0]-&gt;cpu_diff()[0]是weight_loss 
 // 使用diff_的符号来判断两个输入blob哪个大 
 caffe_cpu_sign(bottom[i]-&gt;count(), 
 diff_.cpu_data(), 
 bottom[i]-&gt;mutable_cpu_diff()); 
 // caffe_cpu_scale(n, alpha, x, y): y = alpha * x 
 caffe_cpu_scale(bottom[i]-&gt;count(), 
 alpha, 
 bottom[i]-&gt;cpu_diff(), 
 bottom[i]-&gt;mutable_cpu_diff()); 
 } 
 } 
}</code></pre>解释一下上面函数中的 <code>top[0]-&gt;cpu_diff()[0]</code>.我们知道，每一层回传的梯度是由上一层传回来的梯度乘以本层的梯度得到的. 但我们现在本来就是loss层了，后面没有层了，那这个<code>top[0]-&gt;cpu_diff()[0]</code>是什么呢？注意，这里只是取了<code>top[0]-&gt;cpu_diff()</code>的第一个元素，其实它就是我们在prototxt中定义的 <code>loss_weight</code>.GPU 版本：<pre><code class="lang-cpp">template &lt;typename Dtype&gt; 
void L1LossLayer&lt;Dtype&gt;::Backward_gpu(const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; top, const vector&lt;bool&gt;&amp; propagate_down, const vector&lt;Blob&lt;Dtype&gt;*&gt;&amp; bottom) { 
 for (int i = 0; i &lt; 2; ++i) { 
 if (propagate_down[i]) { 
 const Dtype sign = (i == 0) ? 1 : -1; 
 const Dtype alpha = sign * top[0]-&gt;cpu_diff()[0] / bottom[i]-&gt;num(); // 这里是cpu运算，使用cpu_diff() 
 caffe_gpu_sign(bottom[i]-&gt;count(), 
 diff_.gpu_data(), 
 bottom[i]-&gt;mutable_gpu_diff()); 
 caffe_gpu_scale(bottom[i]-&gt;count(), 
 alpha, 
 bottom[i]-&gt;gpu_diff(), 
 bottom[i]-&gt;mutable_gpu_diff()); 
 } 
 } 
}</code></pre><h3>2.3 测试文件</h3>测试文件是用来检查我们编写的层的前向和后向计算是否正确的. 主要分为以下几个部分.通过 <code>L1LossLayerTest</code> 类中的 <code>TestForward()</code> 成员来检查 loss 是否可以被 loss weight 正确放缩.<pre><code class="lang-cpp">void TestForward() { 
 // 不指定loss weight，得到一个loss值loss_weight_1，相当于loss weight为1。
 LayerParameter layer_param; 
 L1LossLayer&lt;Dtype&gt; layer_weight_1(layer_param); 
 layer_weight_1.SetUp(this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
 const Dtype loss_weight_1 = layer_weight_1.Forward(this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
 // 指定一个特定的loss weight，再得到一个loss值loss_weight_2， 
 // 然后检查loss_weight_2是否被正确地放缩.
 const Dtype kLossWeight = 3.7; 
 layer_param.add_loss_weight(kLossWeight); 
 L1LossLayer&lt;Dtype&gt; layer_weight_2(layer_param); 
 layer_weight_2.SetUp(this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
 const Dtype loss_weight_2 = layer_weight_2.Forward(this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
 const Dtype kErrorMargin = 1e-5; 
 EXPECT_NEAR(loss_weight_1 * kLossWeight, loss_weight_2, kErrorMargin); 
 // 确保loss不会过小 
 const Dtype kNonTrivialAbsThresh = 1e-1; 
 EXPECT_GE(fabs(loss_weight_1), kNonTrivialAbsThresh); 
}</code></pre>利用数值方法计算梯度，然后和本层的梯度计算进行比较，检查是否正确. 这是通过调用caffe提供的<code>GradientChecker</code>实现的.<pre><code class="lang-cpp">// 通过和数值计算的梯度值对比，检查本层梯度计算是否正确
TYPED_TEST(L1LossLayerTest, TestGradient) { 
 typedef typename TypeParam::Dtype Dtype; 
 LayerParameter layer_param; 
 const Dtype kLossWeight = 3.7; 
 layer_param.add_loss_weight(kLossWeight); 
 L1LossLayer&lt;Dtype&gt; layer(layer_param); 
 layer.SetUp(this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
 GradientChecker&lt;Dtype&gt; checker(1e-4, 1e-2, 1701); // 1e-4为梯度数值计算的步长，1e-2为比较的阈值 checker.
 CheckGradientExhaustive(&amp;layer, this-&gt;blob_bottom_vec_, this-&gt;blob_top_vec_); 
}</code></pre><h2>3. 其它实现</h2>keras 里的定义：<a class="no-external-link" href="https://github.com/keras-team/keras/blob/master/keras/losses.py" target="_blank">keras/losses.py</a><pre><code class="lang-python">from . import backend as K

def mean_absolute_error(y_true, y_pred):
 return K.mean(K.abs(y_pred - y_true), axis=-1)</code></pre>tensorflow 里的定义 : <a class="no-external-link" href="https://www.tensorflow.org/api_docs/python/tf/losses/absolute_difference" target="_blank">tf.losses.absolute_difference</a> - Adds an Absolute Difference loss to the training procedure.<pre><code class="lang-python">tf.losses.absolute_difference(
 labels,
 predictions,
 weights=1.0,
 scope=None,
 loss_collection=tf.GraphKeys.LOSSES,
 reduction=Reduction.SUM_BY_NONZERO_WEIGHTS
)</code></pre>

1. Pytorch nn.L1Loss

2. Caffe 添加 L1 Loss 层(转)

2.1 L1 Loss 的计算推导

2.1.1 Forward 计算

2.1.2 Backward 计算

2.2. Caffe 实现

2.2.1 Forward 计算

2.2.2 Backward 计算

2.3 测试文件

3. 其它实现

4 条评论

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

L1 Loss 函数

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款