Github 项目 - CPN 多人姿态估计

博主： AIHGF
发布时间：2018 年 08 月 23 日
32318 次浏览
33 条评论
7695字数
分类：姿态估计 Github项目

Github 项目 - tf-cpn
论文 - Cascaded Pyramid Network for Multi-Person Pose Estimation

CPN (Cascaded Pyramid Network) 是 COCO 2017 Keypoints 竞赛冠军方法，这里是基于 Tensorflow 的实现的多人姿态识别.
原始实现基于 Face++ (Megvii Inc) 内部深度学习框架(MegBrain) 的实现.

论文阅读 - Cascaded Pyramid Network for Multi-Person Pose Estimation - AIUAI

1. 实现结果

1.1. COCO minival dataset(Single Model)

测试代码需要基于人体检测器.

对于 COCO minival dataset，所采用的人体检测器的精度为 AP=41.1，其中关于人体的精度为 AP=55.3.

Method	Base Model	Input Size	AP @0.5:0.95	AP @0.5	AP @0.75	AP medium	AP large
CPN	ResNet-50	256x192	69.7	88.3	77.0	66.2	76.1
CPN	ResNet-50	384x288	72.3	89.1	78.8	68.4	79.1
CPN	ResNet-101	384x288	72.9	89.2	79.4	69.1	79.9

1.2. COCO test-dev dataset (Single Model)

采用强检测器，对于 COCO test-dev dataset，其精度为 AP=44.5，其中关于人体的精度为 AP=57.2.

Method	AP @0.5:0.95	AP @0.5	AP @0.75	AP medium	AP large
Detectron(Mask R-CNN)	67.0	88.0	73.1	62.2	75.6
CPN(ResNet-101, 384x288)	72.0	90.4	79.5	68.3	78.6

为了进行参考对比，采用 MegDet 的检测器，其精度为 AP=52.1，其中关于人体的检测精度为 AP=62.9，得到的姿态估计结果为：

Method	AP @0.5:0.95	AP @0.5	AP @0.75	AP medium	AP large
MegDet+CPN(ResNet-101, 384x288)	73.0	91.8	80.8	69.1	78.7

MegDet: A Large Mini-Batch Object Detector

2. 实现过程

2.1 MSCOCO 数据集上模型训练

[1] - 克隆项目

git clone https://github.com/chenyilun95/tf-cpn.git

假设本地项目路径为 $CPN_ROOT.

[2] - MSCOCO 图片数据 - http://cocodataset.org/#download. 在 COCO trainvalminusminival 数据集(googledrive) 上训练模型，并在 COCO minival 数据集(googledrive) 上验证模型.
下载的数据集和 Python API 放在路径 $CPN_ROOT/data/COCO/MSCOCO 中.
config.py 定义了所有路径，可以自定义设置.

[3] - 下载 base 模型(ResNet) 权重文件 - tf slim model_zoo，放于路径 $CPN_ROOT/data/imagenet_weights/.

[4] - 设置环境

pip3 install -r requirement.txt

cd $CPN_ROOT/lib
make clean; make all
cd $CPN_ROOT/lib/lib_kernal/lib_nms
./compile.sh

避免出现错误：from lib_kernel.lib_nms.gpu_nms import gpu_nms ImportError: libcudart.so.8.0: cannot open shared object.

[5] - 训练 CPN 模型，采用模型文件夹中的 network.py.

python3 network.py -d 0-1

模型训练后，输出路径 $CPN_ROOT/log/ 中包含的文件类似如下：

log/
|-model_dump/
|    |snapshot_1.ckpt.data-00000-of-00001
|    |snapshot_1.ckpt.index
|    |snapshot_1.ckpt.meta
|    |...
|train_logs.txt

2.2 COCO 数据集上模型验证

运行测试代码：

python3 mptest.py -d 0-1 -r 350

其中，这里假设存在训练 350 epochs 的模型文件.

如果需要指定预训练的模型路径，则可以运行：

python3 mptest.py -d 0-1 -m log/model_dump/snapshot_350.ckpt

提供的测试模型(googledrive)：

人体 boxes 检测模型：

CPN 预训练模型：

3. 图片测试 Demo

测试文件路径内所有图片.
每张图片只简单进行 resize 到网络输入尺寸，未做翻转.

    import os
    import numpy as np
    import argparse
    from config import cfg
    import cv2
    import sys
    import matplotlib.pyplot as plt

    import tensorflow as tf

    from tfflat.base import Tester
    from tfflat.utils import mem_info
    from network import Network

    def analyse(tester, imagefile):
        test_img = cv2.imread(imagefile)
        # test_img = cv2.resize(test_img, (288, 384), interpolation=cv2.INTER_LINEAR)
        height, width, _ = test_img.shape
        scale_height = 384/height
        scale_width = 288/width
        scale_img = cv2.resize(test_img, (0, 0), fx=scale_width, fy=scale_height, interpolation=cv2.INTER_LANCZOS4)

        mean_img = scale_img - cfg.pixel_means
        mean_img = mean_img / 255.
        mean_img = mean_img.transpose(2, 0, 1)
        mean_img = np.asarray(mean_img).astype(np.float32)
        feed = np.zeros((1, mean_img.shape[0], mean_img.shape[1], mean_img.shape[2]))
        feed[0] = mean_img

        res = tester.predict_one([feed.transpose(0, 2, 3, 1).astype(np.float32)])[0]
        res = res.transpose(0, 3, 1, 2)[0]

        cls_skeleton = np.zeros((cfg.nr_skeleton, 3))
        res /= 255.
        res += 0.5
        for w in range(cfg.nr_skeleton):
            res[w] /= np.amax(res[w])
        border = 10
        dr = np.zeros((cfg.nr_skeleton, cfg.output_shape[0] + 2 * border, cfg.output_shape[1] + 2 * border))
        dr[:, border:-border, border:-border] = res[:cfg.nr_skeleton].copy()
        for w in range(cfg.nr_skeleton):
            dr[w] = cv2.GaussianBlur(dr[w], (21, 21), 0)
        for w in range(cfg.nr_skeleton):
            lb = dr[w].argmax()
            y, x = np.unravel_index(lb, dr[w].shape)
            dr[w, y, x] = 0
            lb = dr[w].argmax()
            py, px = np.unravel_index(lb, dr[w].shape)
            y -= border
            x -= border
            py -= border + y
            px -= border + x
            ln = (px ** 2 + py ** 2) ** 0.5
            delta = 0.25
            if ln > 1e-3:
                x += delta * px / ln
                y += delta * py / ln
            x = max(0, min(x, cfg.output_shape[1] - 1))
            y = max(0, min(y, cfg.output_shape[0] - 1))
            cls_skeleton[w, :2] = (x * 4 + 2, y * 4 + 2)
            cls_skeleton[w, 2] = res[w, int(round(y) + 1e-10), int(round(x) + 1e-10)]

        # map back to original images
        plt.imshow(test_img[:,:,::-1])
        for idx in range(cfg.nr_skeleton):
            plt.scatter(cls_skeleton[idx][0] / scale_width, cls_skeleton[idx][1]/scale_height, marker='p', color='r', s=10)
        plt.show()

    if __name__ == '__main__':

        gpu_ids = str(np.argmin(mem_info()))
        test_model = 'tf-cpn/models/COCO.res50.384x288.CPN/snapshot_350.ckpt'

        cfg.set_args(gpu_ids.split(',')[0])
        tester = Tester(Network(), cfg)
        tester.load_weights(test_model)

        images_list = os.listdir('/path/to/test_images')
        for image_file in images_list:
            image_file = os.path.join('/path/to/test_images', image_file)
            analyse(tester, image_file)

        print('Done.')

PyTorch CPN 实现

最后修改：2019 年 04 月 17 日

如果觉得我的文章对你有用，请随意赞赏

33 条评论

哈哈
March 22nd, 2022 at 12:39 am

res /= 255.
res += 0.5
博主这两个是什么意思呢，为什么用cpn他的得分会大于1 呀

回复
rain699
July 30th, 2019 at 12:18 pm

请问训练时CPU占用率太高，达到300%。怎么解决呢？

回复
1. AIHGF
  July 30th, 2019 at 12:25 pm
  
  @rain699
  
  是计算溢出了吗？我暂时还没遇到过.
  
  回复
duan
June 28th, 2019 at 10:31 am

博主您好！请教下您一个问题，我在训练COCO.res50.256x192.CPN 过程中发现一个问题，开始starting training...之后，CPU占用率一直在上升，可能会崩掉。我尝试在config中将dpflow_enable 置为False，但是重新训练仍然是CPU一直上升，无法正常训练的问题，请问下您训练的时候也这样吗？怎样做一下处理？非常希望您能够指点一下！谢谢！

回复
1. rain699
  July 30th, 2019 at 12:17 pm
  
  @duan
  
  我也遇到了这个情况，请问您解决了吗？
  
  回复
colin
May 25th, 2019 at 05:48 pm

你好，我想问一下这个网络处理单张图片的速度大概是多少（在GPU下）。

回复
1. AIHGF
  May 27th, 2019 at 09:39 pm
  
  @colin
  
  以前在 980Ti 上测过速度，现在有点记不得了.
  
  回复
大公鸡
April 26th, 2019 at 03:39 pm

请问博主对于人体检测是怎么做的？我用的FPN先检测人体框，然后送入CPN，结果发现如果框的质量不好会很影响CPN的结果；对于一些密集的场景或者是发生变形的体态，FPN检测的人体框可能会与其他框重合，这样送入CPN的crop内容可能不止一个人体，这种情况如何处理呢？

回复
1. JY
  March 21st, 2020 at 09:42 am
  
  @大公鸡
  
  您好，我想请问一下，您FPN人体检测框结果送入CPN是什么意思，是什么数据送进去了？刚接触这部分内容，不太理解。
  
  回复
2. AIHGF
  April 26th, 2019 at 05:35 pm
  
  @大公鸡
  
  two-stages 的多人姿态估计，一般都会收到人体检测器的影响，如果是重叠的多人姿态估计，可能确实不好解决. alphapose 好像有关于 crowd 的部分.
  
  回复
  1. 大公鸡
    April 26th, 2019 at 06:14 pm
    
    @AIHGF
    
    AlphaPose还没试过，OpenPose的效果我觉得可以接受，速度精度都还行，但是文章说Top-Bottom的方式在精度上是要比Bottom-Top好的，感觉只是在keypoints上的检测好一些，涉及多人情况还是要看Bottom-Top的，AlphaPose我去试一下
    
    回复
    
    AIHGF
    April 26th, 2019 at 06:34 pm
    
    @大公鸡
    
    这个可能要根据应用场景具体情况具体分析.
    
    回复
糖三匙
April 17th, 2019 at 10:00 am

hello~能请问一下图片测试Demo中的第61行是什么意思嘛？我直接粘贴代码到python会报错呢？

回复
1. AIHGF
  April 17th, 2019 at 10:17 am
  
  @糖三匙
  
  已修改.
  
  回复
xiang
March 7th, 2019 at 09:11 pm

您遇到过，ImportError：Building module pycocotools_mask failed:["distutils.errors.CompileError: command 'gcc' failed with exit status 1\n"]的错误吗？

回复
1. AIHGF
  March 7th, 2019 at 09:58 pm
  
  @xiang
  
  没遇到过，可能是 pycocotools api 没正确安装.
  
  回复
xiang
March 7th, 2019 at 08:35 pm

您好，我将下载的train2014放入data/COCO/MSCOCO中，一直是read no image，是我的路径不对吗？

回复
1. LC
  April 8th, 2019 at 02:54 pm
  
  @xiang
  
  你好，我也遇到了这个问题，我想问问你有解决了？
  
  回复
2. AIHGF
  March 7th, 2019 at 08:45 pm
  
  @xiang
  
  有没有确认下 image 文件是否存在？
  
  回复
  1. xiang
    March 7th, 2019 at 09:36 pm
    
    @AIHGF
    
    方便加下您的微信或qq吗？
    
    回复
    
    AIHGF
    March 7th, 2019 at 10:00 pm
    
    @xiang
    
    qq:2258922522
    
    回复
  2. xiang
    March 7th, 2019 at 09:19 pm
    
    @AIHGF
    
    image不是下载的train2014文件吗？
    
    回复
    
    AIHGF
    March 7th, 2019 at 09:59 pm
    
    @xiang
    
    可以尝试下单步运行，定位错误位置及原因.
    
    回复
    
    xiang
    March 7th, 2019 at 09:20 pm
    
    @xiang
    
    PythonAPI我如果放在MSCOCO文件夹下的话，怎么会出现我刚刚说的importError呀？
    
    回复
    
    knight
    May 14th, 2019 at 03:54 pm
    
    @xiang
    
    你好我也出现了同样的问题，想问你解决了吗？
    
    回复
zhepherd
January 18th, 2019 at 07:53 pm

tfflat 是是什么？

回复
1. AIHGF
  January 18th, 2019 at 08:28 pm
  
  @zhepherd
  
  代码里的一个库，https://github.com/chenyilun95/tf-cpn/blob/master/lib/tfflat
  
  回复
luan
January 14th, 2019 at 11:32 am

谢谢，已经解决了

回复
1. 小银是猪
  June 11th, 2019 at 02:05 pm
  
  @luan
  
  你是怎么解决的呢？我也发现了这个问题。
  
  回复
luan
January 12th, 2019 at 09:50 pm

您好？请问用的python3还是python2啊？functools32只能用于python2.7，希望看到后能够回复，谢谢

回复
1. AIHGF
  January 12th, 2019 at 10:01 pm
  
  @luan
  
  我当时用的是 python3.
  
  回复
  1. luan
    January 13th, 2019 at 10:06 am
    
    @AIHGF
    
    感谢！可是functools32怎么安装的呢？我使用python3.6尝试了下，pip functools32时，说它只适用于python2.7
    
    回复
    
    AIHGF
    January 13th, 2019 at 02:25 pm
    
    @luan
    
    functool32 安装？代码里应该是有 from functools import partial，但未遇到你说的问题. 具体点呢？
    
    回复

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

Github 项目 - CPN 多人姿态估计

AIHGF • 2018 年 08 月 23 日

<blockquote><span class="external-link"><a class="no-external-link" href="https://github.com/chenyilun95/tf-cpn" target="_blank"><i data-feather="external-link"></i>Github 项目 - tf-cpn</a></span><br><span class="external-link"><a class="no-external-link" href="https://arxiv.org/abs/1711.07319" target="_blank"><i data-feather="external-link"></i>论文 - Cascaded Pyramid Network for Multi-Person Pose Estimation</a></span></blockquote><p>CPN (Cascaded Pyramid Network) 是 COCO 2017 Keypoints 竞赛冠军方法，这里是基于 Tensorflow 的实现的多人姿态识别.<br>原始实现基于 Face++ (Megvii Inc) 内部深度学习框架(MegBrain) 的实现.</p><blockquote><a href="https://www.aiuai.cn/aifarm446.html">论文阅读 - Cascaded Pyramid Network for Multi-Person Pose Estimation - AIUAI</a></blockquote><h2>1. 实现结果</h2><h3>1.1. COCO minival dataset(Single Model)</h3><p>测试代码需要基于人体检测器.</p><p>对于 COCO minival dataset，所采用的人体检测器的精度为 AP=41.1，其中关于人体的精度为 AP=55.3.</p><table><thead><tr><th>Method</th><th>Base Model</th><th>Input Size</th><th>AP @0.5:0.95</th><th>AP @0.5</th><th>AP @0.75</th><th>AP medium</th><th>AP large</th></tr></thead><tbody><tr><td>CPN</td><td>ResNet-50</td><td>256x192</td><td>69.7</td><td>88.3</td><td>77.0</td><td>66.2</td><td>76.1</td></tr><tr><td>CPN</td><td>ResNet-50</td><td>384x288</td><td>72.3</td><td>89.1</td><td>78.8</td><td>68.4</td><td>79.1</td></tr><tr><td>CPN</td><td>ResNet-101</td><td>384x288</td><td>72.9</td><td>89.2</td><td>79.4</td><td>69.1</td><td>79.9</td></tr></tbody></table><h3>1.2. COCO test-dev dataset (Single Model)</h3><p>采用强检测器，对于 COCO test-dev dataset，其精度为 AP=44.5，其中关于人体的精度为 AP=57.2.</p><table><thead><tr><th>Method</th><th>AP @0.5:0.95</th><th>AP @0.5</th><th>AP @0.75</th><th>AP medium</th><th>AP large</th></tr></thead><tbody><tr><td>Detectron(Mask R-CNN)</td><td>67.0</td><td>88.0</td><td>73.1</td><td>62.2</td><td>75.6</td></tr><tr><td><strong>CPN(ResNet-101, 384x288)</strong></td><td><strong>72.0</strong></td><td><strong>90.4</strong></td><td><strong>79.5</strong></td><td><strong>68.3</strong></td><td><strong>78.6</strong></td></tr></tbody></table><p>为了进行参考对比，采用 <span class="external-link"><a class="no-external-link" href="https://arxiv.org/abs/1711.07240" target="_blank"><i data-feather="external-link"></i>MegDet</a></span> 的检测器，其精度为 AP=52.1，其中关于人体的检测精度为 AP=62.9，得到的姿态估计结果为：</p><table><thead><tr><th>Method</th><th>AP @0.5:0.95</th><th>AP @0.5</th><th>AP @0.75</th><th>AP medium</th><th>AP large</th></tr></thead><tbody><tr><td>MegDet+CPN(ResNet-101, 384x288)</td><td>73.0</td><td>91.8</td><td>80.8</td><td>69.1</td><td>78.7</td></tr></tbody></table><blockquote><span class="external-link"><a class="no-external-link" href="https://arxiv.org/abs/1711.07240" target="_blank"><i data-feather="external-link"></i>MegDet: A Large Mini-Batch Object Detector</a></span></blockquote><h2>2. 实现过程</h2><h3>2.1 MSCOCO 数据集上模型训练</h3><p>[1] - 克隆项目</p><pre><code class="lang-shell">git clone https://github.com/chenyilun95/tf-cpn.git</code></pre><p>假设本地项目路径为 <code>$CPN_ROOT</code>.</p><p>[2] - MSCOCO 图片数据 - <span class="external-link"><a class="no-external-link" href="http://cocodataset.org/#download" target="_blank"><i data-feather="external-link"></i>http://cocodataset.org/#download</a></span>. 在 <span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/15loPFQCMQnJqLK1viSMeIwTFT-KbNzdG?usp=sharing" target="_blank"><i data-feather="external-link"></i>COCO trainvalminusminival 数据集(googledrive)</a></span> 上训练模型，并在 <span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/15loPFQCMQnJqLK1viSMeIwTFT-KbNzdG?usp=sharing" target="_blank"><i data-feather="external-link"></i>COCO minival 数据集(googledrive)</a></span> 上验证模型.<br>下载的数据集和 <span class="external-link"><a class="no-external-link" href="https://github.com/cocodataset/cocoapi/tree/master/PythonAPI" target="_blank"><i data-feather="external-link"></i>Python API</a></span> 放在路径 <code>$CPN_ROOT/data/COCO/MSCOCO</code> 中.<br><code>config.py</code> 定义了所有路径，可以自定义设置.</p><p>[3] - 下载 base 模型(ResNet) 权重文件 - <span class="external-link"><a class="no-external-link" href="https://github.com/tensorflow/models/tree/master/research/slim" target="_blank"><i data-feather="external-link"></i>tf slim model_zoo</a></span>，放于路径 <code>$CPN_ROOT/data/imagenet_weights/</code>.</p><p>[4] - 设置环境</p><pre><code class="lang-shell">pip3 install -r requirement.txt</code></pre><pre><code class="lang-shell">cd $CPN_ROOT/lib
make clean; make all
cd $CPN_ROOT/lib/lib_kernal/lib_nms
./compile.sh</code></pre><blockquote>避免出现错误：from lib_kernel.lib_nms.gpu_nms import gpu_nms ImportError: libcudart.so.8.0: cannot open shared object.</blockquote><p>[5] - 训练 CPN 模型，采用模型文件夹中的 <code>network.py</code>.</p><pre><code class="lang-shell">python3 network.py -d 0-1</code></pre><p>模型训练后，输出路径 <code>$CPN_ROOT/log/</code> 中包含的文件类似如下：</p><pre><code>log/
|-model_dump/
|    |snapshot_1.ckpt.data-00000-of-00001
|    |snapshot_1.ckpt.index
|    |snapshot_1.ckpt.meta
|    |...
|train_logs.txt</code></pre><h3>2.2 COCO 数据集上模型验证</h3><p>运行测试代码：</p><pre><code class="lang-shell">python3 mptest.py -d 0-1 -r 350</code></pre><p>其中，这里假设存在训练 350 epochs 的模型文件.</p><p>如果需要指定预训练的模型路径，则可以运行：</p><pre><code class="lang-shell">python3 mptest.py -d 0-1 -m log/model_dump/snapshot_350.ckpt</code></pre><p><strong>提供的测试模型(googledrive)：</strong></p><p>人体 boxes 检测模型：</p><ul><li><span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/1BllF9--dN9uV3FRROcmuIbwNCcn7cCP0?usp=sharing" target="_blank"><i data-feather="external-link"></i>Person detection results in COCO Minival</a></span></li><li><span class="external-link"><a class="no-external-link" href="https://drive.google.com/open?id=1RNnWuLjLuqzemYzOjuoihQvLrBdwiVnu" target="_blank"><i data-feather="external-link"></i>Person detection results in COCO test-dev</a></span></li></ul><p>CPN 预训练模型：</p><ul><li><span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/16hoq9KBVtR_zpJ1xUKweB-tbjFrao4sL?usp=sharing" target="_blank"><i data-feather="external-link"></i>COCO.res50.256x192.CPN</a></span></li><li><span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/1wP2agjJkDaBLl_1UcTmlmyl2Vw3CKlJa?usp=sharing" target="_blank"><i data-feather="external-link"></i>COCO.res50.384x288.CPN</a></span></li><li><span class="external-link"><a class="no-external-link" href="https://drive.google.com/drive/folders/1X0kcPG1KSn3aeWm9fvqVMziGK3XIvJv9?usp=sharing" target="_blank"><i data-feather="external-link"></i>COCO.res101.384x288.CPN</a></span></li></ul><h2>3. 图片测试 Demo</h2><p>测试文件路径内所有图片.<br>每张图片只简单进行 resize 到网络输入尺寸，未做翻转.</p><pre><code class="lang-python">    import os
    import numpy as np
    import argparse
    from config import cfg
    import cv2
    import sys
    import matplotlib.pyplot as plt

import tensorflow as tf

from tfflat.base import Tester
    from tfflat.utils import mem_info
    from network import Network

def analyse(tester, imagefile):
        test_img = cv2.imread(imagefile)
        # test_img = cv2.resize(test_img, (288, 384), interpolation=cv2.INTER_LINEAR)
        height, width, _ = test_img.shape
        scale_height = 384/height
        scale_width = 288/width
        scale_img = cv2.resize(test_img, (0, 0), fx=scale_width, fy=scale_height, interpolation=cv2.INTER_LANCZOS4)

mean_img = scale_img - cfg.pixel_means
        mean_img = mean_img / 255.
        mean_img = mean_img.transpose(2, 0, 1)
        mean_img = np.asarray(mean_img).astype(np.float32)
        feed = np.zeros((1, mean_img.shape[0], mean_img.shape[1], mean_img.shape[2]))
        feed[0] = mean_img

res = tester.predict_one([feed.transpose(0, 2, 3, 1).astype(np.float32)])[0]
        res = res.transpose(0, 3, 1, 2)[0]

cls_skeleton = np.zeros((cfg.nr_skeleton, 3))
        res /= 255.
        res += 0.5
        for w in range(cfg.nr_skeleton):
            res[w] /= np.amax(res[w])
        border = 10
        dr = np.zeros((cfg.nr_skeleton, cfg.output_shape[0] + 2 * border, cfg.output_shape[1] + 2 * border))
        dr[:, border:-border, border:-border] = res[:cfg.nr_skeleton].copy()
        for w in range(cfg.nr_skeleton):
            dr[w] = cv2.GaussianBlur(dr[w], (21, 21), 0)
        for w in range(cfg.nr_skeleton):
            lb = dr[w].argmax()
            y, x = np.unravel_index(lb, dr[w].shape)
            dr[w, y, x] = 0
            lb = dr[w].argmax()
            py, px = np.unravel_index(lb, dr[w].shape)
            y -= border
            x -= border
            py -= border + y
            px -= border + x
            ln = (px ** 2 + py ** 2) ** 0.5
            delta = 0.25
            if ln &gt; 1e-3:
                x += delta * px / ln
                y += delta * py / ln
            x = max(0, min(x, cfg.output_shape[1] - 1))
            y = max(0, min(y, cfg.output_shape[0] - 1))
            cls_skeleton[w, :2] = (x * 4 + 2, y * 4 + 2)
            cls_skeleton[w, 2] = res[w, int(round(y) + 1e-10), int(round(x) + 1e-10)]

# map back to original images
        plt.imshow(test_img[:,:,::-1])
        for idx in range(cfg.nr_skeleton):
            plt.scatter(cls_skeleton[idx][0] / scale_width, cls_skeleton[idx][1]/scale_height, marker='p', color='r', s=10)
        plt.show()

if __name__ == '__main__':

gpu_ids = str(np.argmin(mem_info()))
        test_model = 'tf-cpn/models/COCO.res50.384x288.CPN/snapshot_350.ckpt'

cfg.set_args(gpu_ids.split(',')[0])
        tester = Tester(Network(), cfg)
        tester.load_weights(test_model)

images_list = os.listdir('/path/to/test_images')
        for image_file in images_list:
            image_file = os.path.join('/path/to/test_images', image_file)
            analyse(tester, image_file)

print('Done.')</code></pre><blockquote><span class="external-link"><a class="no-external-link" href="https://github.com/GengDavid/pytorch-cpn" target="_blank"><i data-feather="external-link"></i>PyTorch CPN 实现</a></span></blockquote>

1. 实现结果

1.1. COCO minival dataset(Single Model)

1.2. COCO test-dev dataset (Single Model)

2. 实现过程

2.1 MSCOCO 数据集上模型训练

2.2 COCO 数据集上模型验证

3. 图片测试 Demo

33 条评论

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Github 项目 - CPN 多人姿态估计

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款