自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 收藏
  • 关注

原创 Towards Accurate Human Pose Estimation in Videos of Crowded Scenes

ACM MM 2020 人体姿态估计挑战赛的第二名,作者来自新加坡国立大学和依图实验室。作者列表里有个熟悉的名字 Xuecheng Nie,就是之前 SPM 模型的一作。附 ACM MM 2020 人体姿态挑战赛的leaderboard,话说参赛人员数量不高啊~~~文章整体流程图如下图所示,因为是刷榜打比赛,所以不考虑速度,只考虑精度,所以各个模块的模型都是用了很大的模型。整体有三个大的模块,分别是:1)human detector 2)pose estimator 3)optical flow smoo

2020-10-24 20:54:01 358

原创 Whole-Body Human Pose Estimation in the Wild

财大气粗的商汤出的第一个全身关键点数据集,直接对COCO数据集进行了扩展,将脸上的68个点,躯干的23个点(body17+feet6),以及手的23个点全部进行了标注,并将label进行了开源,地址:https://github.com/jin-s13/COCO-WholeBody,果然是大佬风范,佩服三连~除了很????的推出了第一个large-scale whole body pose dataset,还针对如何训练whole body pose提出了ZoomNet,网络结构如下所示:因为face

2020-09-02 20:58:05 1154 2

原创 Multi-Person Pose Regreesion via Pose Filtering and Scoring

大连理工大学出的一篇基于bottom-up方法的多人人体姿态估计。整体思路和SPM很像,主要有以下几点不同:没有像SPM那样预先定义好的人体多级连接结构,而是类似于centernet一样,直接从一个中心点回归所有的pose offset中心点不仅仅是一个点,而是位于人体中心的一块区域。人体中心不再是通过box的中心确定,而是通过人体姿态组成的最小box来确定,这样保证中心点更合理,如图所示训练时是用了个refine module来进一步优化pose,送进refine module的是通过OKSFil

2020-07-26 21:26:05 304

原创 Point-Set Anchors for Object Detection, Instance Segmentation and Pose Estimation

微软亚洲研究院新出的一篇很有意思的文章,从另外一个角度统一了object detection、instance segmentation、pose estimation。对于object detection和pose estimation任务而言,之前有过像CenterNet、SPM等通过检测中心点回归的方法来统一这两个方向的任务,但作者认为这样做有一些问题:仅仅使用中心点做回归能够利用的特征信息太少。像CenterNet,通过中心点回归object的中心点和宽高,如果是人的话,还可以回归N个关键点,这

2020-07-18 17:24:45 1015

原创 BlazePose: On-device Real-time Body Pose tracking

(吐槽:标题为啥最后一个单词是tracking而不是Tracking)谷歌研究院提出的用于边缘设备上运行的单人人体姿态估计算法,思路很清奇,和之前的做法有很大的不同。使用face detector检测人体而不是body detector。作者发现,使用body detector的话受场景中密集人群遮挡的影响,而且遮挡严重状态下,body detector的confidence值不会很高。而人的头部一是不容易被遮挡,二是在神经网络中该出的响应值往往是最高的。因为,文章使用了一个face detect,并

2020-07-15 20:46:17 3471

原创 RePose: Learning Deep Kinematic Priors for Fast Human Pose Estimation

单人pose模型文章,提出了一种基于kinematic structure来辅助模型对关键点进行定位,整体结构如下:模型是一个仿U-Net结构的网络结构,忽略U-Net的底部,先看下输出,模型会在不同的scale下进行upsample到原图分辨率大小进行heatmap输出,所以是个包含有多个loss的网络结构,重点看下上图中的绿色部分,也即是文章提出的Kinematic Features Updates结构。Kinematic Features Updates这个结构相当于是根据先验知识对人体姿态进行

2020-06-05 14:15:45 579

原创 Anchor Loss: Modulating Loss Scale based on Prediction Difficulty

一篇比较有意思的文章,用来增强模型对易混淆样本的学习,有别于传统的CE和Focal Loss。文章链接:arxivcode: githubwhy need this理由很简单,我们在做类似分类任务的时候,模型最终往往都会输出一个概率,我们会在输出的所有类别的概率中挑选其中最大的一个作为模型的输出。大部分情况下这种做法是没有问题的,但对于一些易混淆的任务来说,例如图片分类中一些看着相似但类别不一致的图片,人体姿态估计中两个相对的左右关节,这些都会对模型的输出造成一定的困扰。如文章中图1所示:对于人体

2020-06-04 19:36:14 365

原创 HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation (CVPR2020)

official pytorch codepaper link恭喜文章被CVPR 2020接收。本来19年的时候在arxiv上找到了这篇文章,当时还是叫做"Bottom-up Higher-Resolution Networks for Multi-Person Pose Estimation",今天一看arxiv上已经更新到v3了,名字也改了。HigherHRNet是在HRNet和Simp...

2020-03-13 23:25:45 3006

原创 Simple Baselines for Human Pose Estimation and Tracking

官方github文章地址

2020-03-12 23:26:05 1843

原创 Learning Delicate Local Representations for Multi-Person Pose Estimation

arxivofficial pytorch implemention旷视研究院最新关于人体姿态估计的力作,最优模型在COCO test-dev刷到了79.2,rank no.1,关键还是几位实习生做的,还是个98年的大佬~~前言人体姿态估计是一个对位置精度要求很高的任务,它不像图像分类对location信息要求不那么严格,而是和语义分割一样,准确的location信息对它帮助很大。之前的很...

2020-03-11 21:00:56 2771 12

原创 Convolution Pose Machines (CPM)

https://arxiv.org/pdf/1602.00134.pdfCPM基本上可以算是第一个end-to-end的单人姿态全卷积神经网络(同时期还有个Hourglass,两者时间差不多)。CPM是在之前PM(Pose Machines)基础上,加入卷积神经网络得到,CPM整体流程如下所示:(a)和(b)就是PM中的结构,(c)(d)则是CPM对应(a)(b)做的改进。CPM分为多个sta...

2020-03-08 14:07:00 495

原创 Benchmarking and Error Diagnosis in Multi-Instance Pose Estimation

这篇文章不是介绍怎么设计网络去提高多人姿态检测在数据集上的mAP值,而是去找出姿态估计算法为啥得分这么低的原因,更直白的讲就是,这个模型效果不好,这个效果不好具体是哪些地方效果不好,文章探究的是这个更底层的原因,而不是简单粗暴的堆trick提高mAP。文章是2017年发表的,当时比较出名的两个多人人体姿态估计网络是Google的GRMI和CMU的OpenPose,文章就是根据这两个模型来查找原因。...

2020-03-07 15:36:15 524

原创 Simple Pose: Rethinking and Improving a Bottom-up Approach for Multi-Person Pose Estimation

arxiv: https://arxiv.org/pdf/1911.10529.pdfgithub:https://github.com/jialee93/Improved-Body-Parts既然是Rethinking, 那么就要先只出需要rethinking的内容. 文章主要针对于人体姿态估计中的bottom-up的方法, 提出了关于bottom-up方法里的一些问题的思考:人体姿...

2019-12-10 15:06:27 1834

原创 tensorflow 2.0模式下训练的模型如何转成 tf1.x 版本的pb模型

升级到tf 2.0后, 训练的模型想转成1.x版本的.pb模型, 但之前提供的通过ckpt转pb模型的方法都不可用(因为保存的ckpt不再有.meta)文件, 尝试了好久, 终于找到了一个方法可以迂回转到1.x版本的pb模型.Note: 本方法首先有些要求需要满足:可以拿的到模型的网络结构定义源码网络结构里面的所有操作都是通过tf.keras完成的, 不能出现类似tf.nn 的tensor...

2019-11-22 18:00:16 5455 6

原创 tensorflow 2.0 分布式训练(单机多卡模式)

方式一:import tensorflow as tffrom nets.single_posenet import singlePosenet from configs.spn_config import paramsfrom dataset.dataset import get_datasetimport osimport timeif __name__ == '__main...

2019-10-17 12:16:58 5709 1

原创 Single-Stage Multi-Person Pose Machines

昨天在arxiv上发现的一篇非常有意思的论文,特来记录一下,惯例发链接为什么文章叫Single-Stage,首先,针对多人pose这方面,主流的方法分为两类:Top-Down solution。先用一个detector检测出来图像上的所有行人,然后针对每一个检测的出来的human box,做单人pose预测,总共需要2步Bottom-Up solution。先用一个cnn检测出来图像上所有...

2019-09-04 19:38:17 3156 12

原创 tensorflow ckpt转pb,修改pb里面的节点信息,pb转tvm里的一些坑

之前写过一篇文章有关tensorflow ckpt和pb模型之间转换的操作, 这次再详细说下里面的一些坑.ckpt 转 pb如果只有ckpt文件,例如三个ckpt文件model-xxx.data, model-xxx.meta, model-xxx.index, 转成pb文件方式很简单,按照上面的链接就可以,只需要确定好输出节点名称就可以。如果不知道,可以打印ckpt里面的节点名称,或者使用t...

2019-08-20 20:44:15 4482 2

原创 tensorflow 2.0 learning_rate schedules

除了可以使用tensorflow自己定义好的learning_rate schedules外,我们也可以自定义tensorflow的learning_rate schedule,由于2.0的eager模式,这个改变十分简单:def lr_fn(epoch, base_lr=1e-4): # based on your strategy to change lr for epoch in...

2019-08-14 19:44:19 1838

原创 tensorflow2.0-数据处理

首先生成个list或者numpy, 然后初始化dataset:dataset = tf.data.Dataset.from_tensor_slices(img_ids)img_ids 是包含所有需要训练的图片id集合, 这行代码执行完之后, 在dataset里面的每一个元素都是一个tensor, 每个tensor的值是图片id.执行shuffle, 在这里先执行shuffle而不是之...

2019-08-14 19:43:15 5326

原创 tensorfow estimator: WarmStartSettings

tensorflow version: v 1.13在tf.estimator.WarmStartSettings里, 是可以设置具体restore哪些变量, 里面有两个参数,ckpt_to_initialize_from, 就是需要restore的ckpt地址, 例如xx/model.ckpt-xxvars_to_warm_start, 就是判断哪些变量需要被restore的. 需...

2019-07-01 18:26:58 1953 1

原创 OpenPifPaf: encoder过程

OpenPifPaf 的encoder过程图像预处理源代码train.py中给出了两个方案,一个是带有data augmentation的, 一个是不带的, 因为图像预处理无非是对图像和对应的label进行处理使其满足网络的输入条件, 因此就以不带data augmentation的预处理过程简单梳理下.首先是读入传入的coco label, 根据传入的coco label, 使用PIL ...

2019-06-28 16:10:41 2488 2

原创 OpenPifPaf decode源码解析

openpifpaf 的decode过程:网络的输出:pif, 原始的输出共有4个, 分别为:joint_intensity_fields, shape 为 [17, output_h, output_w]. 其实就是输出的每个位置上的confidence map, 17表示channel数, 在pose检测里面表示总共有多少个关键点需要检测.joint_offset_fields,...

2019-06-26 16:06:39 3257 4

原创 Anchor-free Object Detector综述(不定时更新)

DenseBox (2015) (https://arxiv.org/abs/1509.04874)densebox最早提出来是用来检测人脸的, 其有两个主要贡献, 第一是提出使用一个完整的FCN来预测box而不需要预先的proposal, 而且是end2end的训练过程; 第二是提出了用目标上已有的关键点信息来辅助box的定位.为了节省训练时间, densebox没有直接把一整张图片都丢进...

2019-04-29 19:33:11 4744 1

原创 FCOS: Fully Convolution One-Stage Object Detection

今年的CVPR目标检测方向出现了很多类似anchor-free的工作, 先挑一篇看着比较新颖的文章读一下arxiv地址: https://arxiv.org/abs/1904.01355github地址: https://github.com/tianzhi0549/FCOS既然是anchor-free, 那么就得说明白为啥要anchor-free. 文章列了几个anchor-based d...

2019-04-17 19:41:13 1200

原创 PifPaf: Composite Fields for Human Pose Estimation

发表于arxiv, 一个bottom-up的方法, 用来预测单张图片中多个人体的关节点位置, 已开源arxiv地址: https://arxiv.org/abs/1903.06593github地址: https://github.com/vita-epfl/openpifpafcontributionbottom-up, box-free, end-to-end cnn arc...

2019-03-28 11:21:17 4867 6

原创 Towards Accurate Multi-person Pose Estimation in the Wild

一篇比较老的文章, CVPR 2017的, 链接地址概括论文采用了top-down的方法, 即先检测出人, 然后再坐单人pose检测. 检测人的方法使用了faster-rcnn, 单人pose方法是已reset结构为基础的网络. 关于faster-rcnn我不是很了解而且网上介绍很多, 略去不表, 下面着重介绍pose检测这块.pose estimationperson box cro...

2019-03-22 20:51:34 1464

原创 HetConv: Heterogeneous Kernel-Based Convolutions for Deep CNNs

CVPR 2019的文章, arxiv链接为了设计一个轻量化的深度学习网络, 文章提出了名叫Heterogeneous Kernel-Based Convolution, 简称HetConv的卷积操作. 首先回顾下之前提出来的轻量型网络的结构方式, 主要分为以MobileNet为代表的深度可分离卷积+逐点卷积(DWC+PWC), 及以ShuffleNet为代表的分组卷积+逐点卷积(GWC+PWC...

2019-03-14 21:10:12 1105 3

原创 Learning to Refine Human Pose Estimation

翻到的一篇18年的老文章, 讲的是如何对关键点预测网络预测出的关键点进行修正, arxiv链接.论文目的对已有的pose estimation model产生的pose进行修正论文方法训练一个新的模型, 来对某个pose estimation model产生的pose进行修正, 新模型文章命名为 PoseRefiner.输入: 原始图片Image, 原始图片Image与其经过pose ...

2019-03-11 18:34:57 1358 2

转载 [OpenPose翻译] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields ∗原文翻译(注释版)

转载自here, 写的非常好. 论文原文地址:https://arxiv.org/abs/1611.08050(在网页右上角附近,有“PDF”字样,点击即可下载)本论文有提供代码,最新网址:https://github.com/CMU-Perceptual-Computing-Lab/openpose代...

2019-03-11 10:19:03 1362

原创 ubuntu16.04 安装opencv 3.4.x + opencv_contrib 3.4.x

从github上下载对应版本的opencv和opencv_contrib.解压缩文件夹, 并将opencv_contrib放在opencv目录下安装必要的依赖项:sudo apt-get install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev li...

2019-03-08 14:45:27 489

转载 Deep High-Resolution Representation Learning for Human Pose Estimation

推荐一篇文章:Deep High-Resolution Representation Learning for Human Pose Estimation, 已开源, 效果看非常不错.附上公众号"我爱计算机视觉"的解读: 链接

2019-02-28 20:22:13 817

原创 tensorflow模型转ncnn

第一步把tensorflow保存的.ckpt模型转为pb模型, 并记下模型的输入输出名字.第二步去ncnn的github上把仓库clone下来, 按照上面的要求装好依赖并make.第三步是修改ncnn的CMakeList, 具体修改的位置有:ncnn/CMakeList.txt 文件, 在文件开头处加入add_definitions(-std=c++11), 末尾处加上add_subdir...

2019-02-28 20:06:35 3866 5

原创 tensorflow反卷积 tf.layers.conv2d_transpose 和 tf.nn.conv2d_transpose

首先, 引用一篇博文的图,讲解的很清楚,这篇博文讲解的也很清楚,还有手写代码实现,我就说下我自己的理解.tensorflow的反卷积也被成为转置卷积, 在执行反卷积的时候, tensorflow通常会做以下几个操作:根据设置的stride对featuremap填充0, 具体来说, 就是将featuremap填充至(h*stride+1, w*stride+1)大小. 填充方式为在原来的fea...

2019-02-26 19:18:51 3049 2

原创 tensorflow tf.space_to_batchnd函数理解

最近需要将tensorflow转ncnn模型, 发现无论是普通的卷积还是分组卷积, 只要有dilation > 1的情况出现, tensorflow在做空洞卷积的时候, 就会执行:SpaceToBatchND操作conv操作BathToSpaceND操作其中, 第二步的conv操作已经是普通的卷积操作了, 即dilation=1的普通卷积.tensorflow这样做的目的, 是...

2019-02-16 20:21:11 4336 2

原创 tensorflow获取模型节点名称及将.ckpt转为.pb文件

将tensorflow的ckpt模型转为pb文件, 需要知道网络的输出节点名称, 如果不指定输出节点名称, 程序就不知道该freeze哪些节点, 就没有办法保存模型.获取ckpt模型中的节点名称from tensorflow.python import pywrap_tensorflowcheckpoint_path = 'model.ckpt-xxx'reader = pywrap_te...

2019-02-14 16:39:11 11709 7

原创 Human Poe Estimation with Spatial Contextual Information

文章地址链接:arxiv百度研究院和香港科技大学联合出品的一篇单人pose检测文章.主要创新点有两个:提出了Cascade Prediction Fusion网络用来预测关键点提出了Pose Graph Neural Network, 用来对1预测的关键点进行修正第二个创新点用到了GRU及一些图的知识, 不是很了解,重点讲下第一个创新点.现有的pose estimation网络,自从...

2019-01-11 15:52:13 1879

原创 Rethinking on Multi-Stage Networks for Human Pose Estimation

无聊翻arxiv发现的文章,先放地址: 文章地址. 本来一开始觉得是和凯明大神那篇’rethinking imagenet pretrain’ 文章一样,干货满满, 读完之后略有失望.这篇文章是Face++团队出品的,旨在设计出一个好的multi-stage的pose 检测. 这篇文章的主要目的,是为了设计一个随着网络stage数目增加, 模型的预测能力逐步提高的网络. 而不是像之前的hourg...

2019-01-08 16:08:00 2551 5

原创 PoseFix: Model-agnostic General Human Pose Refinement Network

arxiv上新放出的一篇pose refine的文章. 类似于top-down的方法,只针对单个人的pose refine操作. 多人的pose refine可以通过分别对单人的pose refine操作完成.文章的意思很明确,就是对目前所有pose模型的输出做refine. 根据另外一篇文章的说法,目前基本上所有的pose estimation模型的得到的pose都是存在特定的误差分布的. 这...

2018-12-18 20:11:40 1347

原创 pip install

安装pip3sudo apt-get install python3-pip安装ipythonsudo pip3 install ipythonpip升级sudo pip3 install --upgrade pipsudo pip install --upgrade pippip升级后出现ImportError: can not import name main编辑/usr/bi...

2018-12-17 15:09:25 1623

原创 python相关问题

安装python 3.6sudo add-apt-repository ppa:jonathonf/python-3.6sudo apt-get updatesudo apt-get install python3.6调整python3.6的优先级,使其为系统默认值sudo update-alternatives --install /usr/bin/python3 python3 /u...

2018-12-17 15:03:11 258

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除