MatthewHsw-CSDN博客

原创 Towards Accurate Human Pose Estimation in Videos of Crowded Scenes

ACM MM 2020 人体姿态估计挑战赛的第二名，作者来自新加坡国立大学和依图实验室。作者列表里有个熟悉的名字 Xuecheng Nie，就是之前 SPM 模型的一作。附 ACM MM 2020 人体姿态挑战赛的leaderboard，话说参赛人员数量不高啊~~~文章整体流程图如下图所示，因为是刷榜打比赛，所以不考虑速度，只考虑精度，所以各个模块的模型都是用了很大的模型。整体有三个大的模块，分别是：1）human detector 2）pose estimator 3）optical flow smoo

2020-10-24 20:54:01 358

原创 Whole-Body Human Pose Estimation in the Wild

财大气粗的商汤出的第一个全身关键点数据集，直接对COCO数据集进行了扩展，将脸上的68个点，躯干的23个点（body17+feet6），以及手的23个点全部进行了标注，并将label进行了开源，地址：https://github.com/jin-s13/COCO-WholeBody，果然是大佬风范，佩服三连~除了很????的推出了第一个large-scale whole body pose dataset，还针对如何训练whole body pose提出了ZoomNet，网络结构如下所示：因为face

2020-09-02 20:58:05 1154 2

原创 Multi-Person Pose Regreesion via Pose Filtering and Scoring

大连理工大学出的一篇基于bottom-up方法的多人人体姿态估计。整体思路和SPM很像，主要有以下几点不同：没有像SPM那样预先定义好的人体多级连接结构，而是类似于centernet一样，直接从一个中心点回归所有的pose offset中心点不仅仅是一个点，而是位于人体中心的一块区域。人体中心不再是通过box的中心确定，而是通过人体姿态组成的最小box来确定，这样保证中心点更合理，如图所示训练时是用了个refine module来进一步优化pose，送进refine module的是通过OKSFil

2020-07-26 21:26:05 304

原创 Point-Set Anchors for Object Detection, Instance Segmentation and Pose Estimation

微软亚洲研究院新出的一篇很有意思的文章，从另外一个角度统一了object detection、instance segmentation、pose estimation。对于object detection和pose estimation任务而言，之前有过像CenterNet、SPM等通过检测中心点回归的方法来统一这两个方向的任务，但作者认为这样做有一些问题：仅仅使用中心点做回归能够利用的特征信息太少。像CenterNet，通过中心点回归object的中心点和宽高，如果是人的话，还可以回归N个关键点，这

2020-07-18 17:24:45 1015

原创 BlazePose: On-device Real-time Body Pose tracking

（吐槽：标题为啥最后一个单词是tracking而不是Tracking）谷歌研究院提出的用于边缘设备上运行的单人人体姿态估计算法，思路很清奇，和之前的做法有很大的不同。使用face detector检测人体而不是body detector。作者发现，使用body detector的话受场景中密集人群遮挡的影响，而且遮挡严重状态下，body detector的confidence值不会很高。而人的头部一是不容易被遮挡，二是在神经网络中该出的响应值往往是最高的。因为，文章使用了一个face detect，并

2020-07-15 20:46:17 3471

原创 RePose: Learning Deep Kinematic Priors for Fast Human Pose Estimation

单人pose模型文章，提出了一种基于kinematic structure来辅助模型对关键点进行定位，整体结构如下：模型是一个仿U-Net结构的网络结构，忽略U-Net的底部，先看下输出，模型会在不同的scale下进行upsample到原图分辨率大小进行heatmap输出，所以是个包含有多个loss的网络结构，重点看下上图中的绿色部分，也即是文章提出的Kinematic Features Updates结构。Kinematic Features Updates这个结构相当于是根据先验知识对人体姿态进行

2020-06-05 14:15:45 579

原创 Anchor Loss: Modulating Loss Scale based on Prediction Difficulty

一篇比较有意思的文章，用来增强模型对易混淆样本的学习，有别于传统的CE和Focal Loss。文章链接：arxivcode: githubwhy need this理由很简单，我们在做类似分类任务的时候，模型最终往往都会输出一个概率，我们会在输出的所有类别的概率中挑选其中最大的一个作为模型的输出。大部分情况下这种做法是没有问题的，但对于一些易混淆的任务来说，例如图片分类中一些看着相似但类别不一致的图片，人体姿态估计中两个相对的左右关节，这些都会对模型的输出造成一定的困扰。如文章中图1所示：对于人体

2020-06-04 19:36:14 365

空空如也

空空如也