自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tongshen的博客

面对复杂,保持欢喜、

  • 博客(62)
  • 收藏
  • 关注

翻译 CenterNet-Objects as Points论文翻译

点即是目标  建模一个对象为一个单个的点——即目标框的中心点。我们的检测器使用关键点估计来找到中心点并且回归出全部其他的目标属性,比如大小,3D位置,方向甚至姿势。我们基于中心点的方法称为CenterNet,是一个端到端可微的检测方法,比起基于目标框的检测器更简单,更快而且更准确。尤其是姿势估计部分的关键点分组,比起openpose的复杂的后处理,该论文的方法更巧妙,通过对各个关键点直接回...

2020-03-30 14:45:27 1282

原创 《Deep Snake for Real-Time Instance Segmentation》

《Deep Snake for Real-Time Instance Segmentation》  论文借鉴了snake算法,将snake算法做成了轮廓结构化特征学习的方法。DeepSnake是基于轮廓的两阶段实例分割的方法,初始化建议轮廓,然后对建议轮廓进行变形,是其对目标更加贴合。论文使用了循环卷积取得了比通用的图卷积能更好的挖掘轮廓的周期图结构。Key Words:Snake、Tw...

2020-03-18 22:40:00 3551 1

原创 Real-Time实例分割DeepSnake使用篇

Real-Time实例分割DeepSnakeDeep Snake for Real-Time Instance Segmentationgit地址:DeepSnake使用DeepSnake模型对于任何一个深度学习模型来说都需要以下四部分信息:dataset,network,trainer和evaluator。dataset: 提供用于训练和测试的数据(data和target的数据格...

2020-03-18 11:28:43 5169 33

原创 Pytorch\Onnx\TensorRT

1

2022-08-25 14:50:40 606 1

原创 一行shell解决Mac文件乱码问题

《一行shell解决Mac文件乱码问题》  使用Mac工作的小伙伴,经常面对一个问题就是,同事发来的一个文件是乱码的,尝试各种工具进行解码,如果文件少还好,文件多,几乎是崩溃的,所以本文记录了一个利用一行shell就能够解决乱码问题的代码,其功能是对当前文件夹下所有的GB18030编码的文件进行转码为UTF-8Key Words:Mac接受文件乱码 Beijing, 2020 Agile Pioneer  单个文件转换iconv -f GB18030 -t UTF-8 ./yo.

2020-06-15 18:24:07 492

原创 零阶矩、一阶矩、二阶矩...

《零阶矩、一阶矩、二阶矩…》  数学中矩的概念来自物理学。在物理学中,矩是表示距离和物理量乘积的物理量,表征物体的空间分布。矩在统计学和图像中都有很重要作用,本文将介绍各阶矩的理解和不同场景的应用。Key Words:矩的意义、统计矩、图像矩 Beijing, 2020作者:Su Rui Agile Pioneer  文章目录意义物理意义数学意义应用概率分布图像矩图像的...

2020-04-23 14:47:55 17183

原创 OpenCV C++ 常用功能

《OpenCV C++ 常用功能》  Key Words:C++、OpenCV、Mat、 Beijing, 2020 Agile Pioneer  文章目录MatMat各种初始化Mat 元素访问Mat 切片运算Mat 求和MatMat各种初始化//参数说明: //int rows:高 //int cols:宽 //int type:参见"Mat类型定义" ...

2020-04-16 19:48:03 271

原创 ncnn数据归一化和结果解析

《ncnn数据归一化和结果解析》  近两年都在使用ncnn进行工程化部署,这里记录一下ncnn进行数据归一化的运算,以及得到的结果ncnn::Mat如何解析。Key Words:ncnn、数据归一化、结果解析 Beijing, 2020 Agile Pioneer  inference 数据标准化// for color imageconst float mean_v...

2020-04-16 13:36:43 2099

原创 《 ATSS:Adaptive Training Sample Selection》

《ATSS:Adaptive Training Sample Selection》  此论文一出感觉是在告诉像我们这样的小朋友根本没有深入理解目标检测。论文醍醐灌顶的指出了影响Anchor-based和Anchor-free效果的关键在于正负训练样本的选择。而且证明了铺设过多的锚点框其实是不必要的。论文提出的自适应的训练样本选择方法能够缩小Anchor-based和Anchor-free效果...

2020-04-15 15:24:00 744

转载 卷积神经网络发展简史

写的真好http://www.lunarnai.cn/2018/07/03/Brief_history_CNN/

2020-04-10 17:37:46 875

原创 Objects as Points论文总结

1、下采样4倍得到一个低分辨率的图,在这个图上来定义关键点而后生成heatMap2、返回原图的中心点会因为输出步长的量化导致偏移,预测一个偏移量来弥补3、能够用简单的方法来代替目前复杂的目标检测方法是一个质的飞越。4、以往的目标检测模型大多数是不可端到微分的不可训练的,那什么情况下是可微分的可训练的呢?5、为什么图像的特征可以回归出图像的坐标呢,如果直接回归肯定是不可以的。6、使用二维联...

2020-04-02 11:19:14 335

原创 笔记本无线网通过网线共享给其他主机

笔记本无线网通过网线共享给其他主机  这篇博客记录了我是如何使用自己的笔记本电脑通过无线网卡连接wifi然后通过有线连接主机进行网络共享的过程,也了解了一些网络的基础知识比如网卡,DNS之类的。Key Words:无线网共享、有线网共享、DNS Agile Pioneer  Windows共享网络给Mac新款Mac需要买一个usb网口,才能连接网线Windows需要连接无...

2020-03-26 18:12:24 2827

原创 解决Mac按列浏览图加载慢的问题

《解决Mac按列浏览图加载慢的问题》  本人是做计算机视觉相关工作的,所以经常会人工筛选一些图片,或者查看图片的结果,我发现经常是随着浏览时间的增加,以及开机时间的增加,图像加载的速度是越来越慢的,这时候我的做法就是重启Mac,但是这样是很麻烦的,需要重新打开很多App… Agile Pioneer  Mac的Finder浏览文件的方式as icons - 缩略图as lis...

2020-03-18 16:08:43 2344

原创 目标检测小工具

敏捷开发 - 目标检测  工作中经常会有一些重复的工作,写过的脚本找起来很费劲,有时候还需要重新写,比如生成训练模型所需要的voc格式的label、json转voc、解析voc画在原图上方便查看…文章目录解析voc格式的label并checkjson转voc解析json生成dictdict生成voc解析voc格式的label并check<annotation> &lt...

2020-03-16 17:11:37 869

原创 CenterLoss

《A Discriminative Feature Learning Approach for Deep Face Recognition》  可鉴别性的特征学习用于人脸识别,对每个类别维护一个Center vector,然后对损失函数增加一项到Center向量的L2损失。使得各个类别的类内分布变小实现intra-class的compactness,从而特征更具区分性,对于人脸识别来说能够...

2020-03-15 16:14:32 192

原创 你真的弄清楚FocalLoss的细节了吗?

Focal Loss for Dense Object DetectionICCV2017作者:RBG和Kaiming聚焦于学习困难样本的方法,该方法普适性很强。FocalLoss公司定义如下:  One-stage的目标检测算中存在正负样本不均衡的情况,以及困难样本难以分类的情况。核心思想解决正负样本不均衡问题 α∈(0,1)\alpha \in (0, 1)α∈(...

2020-03-14 16:52:24 942

原创 LabelSmooth

Cross Entropy  我们在刻画两个分布间的距离时候经常使用交叉熵,至于为什么使用交叉熵而不是使用均方误差,我之前也有疑问,自从看了大神的论证才豁然开朗,原来分类问题在对模型求梯度的时候,均方误差在过大的时候会瘫痪,具体去看文章吧。  SoftMax的定义如下(即在输入为x的条件下,推理类别为k的概率):  其中ziz_izi​一般叫做logits ,即未被归一化的对数概率。我们用...

2020-03-14 16:28:53 370

原创 Pytorch中的collate_fn函数用法

Pytorch中的collate_fn函数用法官方的解释:  Puts each data field into a tensor with outer dimension batch size  即用于对单个样本生成batch的函数,如果没有特殊需求其实不用自己写collate_fn方法,有默认的default_collate方法。collate_fn方法用在如下位置:DataLo...

2020-03-11 14:45:34 12142 1

原创 TypeError: tensor is not a torch image.

运行写好的dataLoader类报错如下TypeError: tensor is not a torch image.原因是transforms.Compose里面函数的顺序问题导致的,normalize需要在ToTensor的后面。错误的顺序:self.normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], ...

2020-03-11 13:38:55 3639 2

原创 python小trick持续更新~

文章目录python忽略warning执行输出输出添加颜色效果python忽略warning执行输出python -W ignore run.py输出添加颜色效果pip install termcolor使用。其基本方法有:colored,cprint。其中cprint相当于print(colored(something))。两个函数的参数完全相同:cprint('somete...

2020-03-10 11:11:20 209

原创 OpenCV图像的编解码读取

图像编码为bytesimport cv2# 指定编码为JPEG格式的,要和图片存储的格式一致img_encode = cv2.imencode('.jpg', img)[1]data_encode = np.array(img_encode) str_encode = data_encode.tostring()with open('img_encode.txt', 'w') a...

2020-03-05 16:08:01 1064

原创 Mac与Windows或Linux的键鼠共享神器Synergy

键鼠共享神器 SynergySynergy官网:https://symless.com/synergy硬件环境本人一台mac本,一台Ubuntu的联想工作站,两套键鼠,非常不方便。官网下载synergy软件serial key7B76313B62617369633B63687269732077616E673B313B66656C697835323137403136332E636F...

2020-01-22 16:10:42 1489

原创 C++常用代码

C++创建文件夹和读写文件字体颜色const std::string red("\033[0;31m");const std::string green("\033[1;32m");const std::string yellow("\033[1;33m");const std::string cyan("\033[0;36m");const std::string magenta("...

2020-01-22 11:07:25 1010

原创 Ubuntu安装sqllite3并使用

Ubuntu安装sqllite3并使用1 安装sqllite3sudo apt-get install sqlite3# 如果安装出现404 Not Found,更新apt-get即可sudo apt-get update2 常用命令2.1 key wordssqlite3 test.db // 打开或创建一个数据库.database //每个.db...

2020-01-20 09:48:54 566

原创 TF ckpt转pb脚本

import tensorflow as tffrom tensorflow.python.framework import graph_utildef freeze_graph(input_checkpoint,output_graph): ''' :param input_checkpoint: :param output_graph: PB模型保存路径 ...

2020-01-19 20:12:58 249

原创 Python使用XGBoost

import xgboostfrom xgboost import XGBClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scorefrom sklearn.externals import joblibimport numpy as np...

2020-01-19 20:11:44 267

原创 Ubuntu操作U盘相关

Ubuntu操作U盘相关1、解决Ubuntu 下不能读取exfat格式的u盘问题sudo apt-get install exfat-utils安装完成后重启即可2、命令行挂载U盘步骤# 一般硬盘顺序# /dev/sda 是你机器的第一块硬盘 # /dev/sdb 是你机器的第二块硬盘# 查看U盘位置1sudo fdisk -l# 查看U盘位置2 都在/dev下lsblk...

2020-01-19 10:54:43 146

原创 vulkan 利用GPU加速ENet

ncnn vulkan 利用GPU加速ENet使用caffe训练ENet模型代码地址:https://github.com/TimoSaemann/ENet我本机的gpu型号是NVIDIA的Quadro P600文章目录ncnn vulkan 利用GPU加速ENet合并卷积和BN层使用vulkan加速Build for Linux x86使用vulkanvulkan加速...

2020-01-02 18:42:47 2507

原创 Batch Normalization的意义

Batch Normalization 的意义这是一个非常好的问题,因为它涵盖了候选人在使用神经网络模型时需要知道的大部分知识。你可以用不同的方式回答,但需要阐明以下主要观点:Batch Normalization 是训练神经网络模型的一种有效方法。该方法的目标是将特征(每层激活后的输出)归一化为均值为 0,标准差为 1。所以问题在于非零的均值是如何影响模型训练的:首先,可以理解为非...

2020-01-02 14:32:39 223

原创 OpenCV Error: Unsupported format or combination of formats (Unsupported combination of input and out

OpenCV Error: Unsupported format or combination of formats (Unsupported combination of input and output array formats) in reduce一般出现这种问题都是由于调用OpenCV中某个函数时,数据类型不对导致的,我在使用opencv的cpp api的reduce函数时候遇到了这个...

2019-12-24 21:17:32 4844

原创 C++多线程map读写加锁

# C++多线程代码参考定义线程函数用map接受线程返回数据void threadClsTask(int begin, int end, vector<Mat> imgList, BSMobileNet *bsMobileNet, map<int, int> *bsInfo){ int clsRes = bsMobileNet->inference(im...

2019-12-24 16:22:30 9290

原创 Ubuntu18.04快捷键

Ubuntu18.04快捷键文章目录Ubuntu18.04快捷键锁屏打开终端快速显示桌面关闭当前网页显示应用程序菜单程序切换移动当前窗口位置切换到通知栏切换输入法关闭应用窗口打开活动搜索界面【重要】最毕的功能:切换工作区建议挨个试一遍,之后你会感谢我的锁屏win + lctrl + alt + l打开终端ctrl + alt + t快速显示桌面win + dctrl + a...

2019-12-24 11:15:56 203

原创 python从语音生成MFCC特征

python从语音生成MFCC特征文章目录python从语音生成MFCC特征MFCC特征原理引入必要的库生成MFCC特征MFCC特征原理@TODO引入必要的库import osimport waveimport numpy as npimport matplotlib.pyplot as pltimport scipy.io.wavfile as wavfrom python_...

2019-12-24 10:53:41 948

原创 python从语音生成语谱图

python从语音生成语谱图生成语谱图的过程参考文档预增强汉宁加窗补零FFTReshape引入必要的库import osimport cv2import numpy as npimport soundfile as sfimport matplotlib.pyplot as pltfrom cough_detector.utils.bd_spectrogram import *...

2019-12-23 21:14:55 1663 2

原创 python语音信号快速傅里叶变换

python语音信号快速傅里叶变换文章目录python语音信号快速傅里叶变换快速傅里叶变换的原理引入必要的库快速傅里叶变换函数用法快速傅里叶变换的原理引入必要的库import numpy as npimport matplotlib.pyplot as pltfrom scipy.fftpack import fft, ifft, rfft快速傅里叶变换函数用法def buil...

2019-12-23 15:38:50 3557 3

原创 python语音读取

python语音读取文章目录python语音读取导入必要的库读取音频文件通过时间点截取音频存储音频文件导入必要的库import osimport numpy as npimport soundfile as sf读取音频文件def read_audio(audio_path): """ :param audio_path: :return: audio[语音信号 np.arr...

2019-12-23 14:28:32 2179 2

原创 Python使用with语句:记录时间&检查路径

# coding:utf-8 # @Time : 23/08/2018 16:49# @Author : SuRuiimport timeclass Timer(object): def __init__(self, verbose=False): self.verbose = verbose def __enter__(self): self.start = time...

2019-12-22 17:25:15 181

原创 watershed用法详解

OpenCV 利用watershed方法进行图像分割def watershed_ori(image_path): """ 输入图像 -> 灰度 -> 二值化(二值化之后注意一下前景是255还是0) -> 距离变换 -> 寻找种子 -> 生成Marker -> 分水岭变换 -> 输出图像 """ image_name = i...

2019-12-22 17:13:56 2341

原创 opencv多目标追踪容器

opencv多目标追踪容器之前做过一个多目标追踪的项目,尝试了一下opencv提供的追踪容器,个人感觉效果一般。# coding:utf-8 # @Time : 14/12/2018 17:07# @Author : SuRuiimport cv2from functools import wrapsdef GetFps(func): @wraps(func) def wr...

2019-12-22 17:09:31 215

原创 Markdown数学公式参考表

Markdown常用数学公式参考表# 文章开头的空格&emsp;&emsp;# 公式内部的空格\space\frac{a}{b}ab\frac{a}{b}ba​\sum_{i}^{j}{x_{n}^{m}}∑ijxnm\sum_{i}^{j}{x_{n}^{m}}i∑j​xnm​a \times ba×ba \times ba×b...

2019-12-22 10:48:37 209

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除