一呆飞仙-CSDN博客

原创 pytorch 网络预处理与后处理中基于numpy操作的GPU加速

0、背景python脚本运行在服务器端的卷积神经网络往往需要将图片数据从cv2(numpy.ndarray)->tensor送入网络，之后进行inference，再将结果从tensor-> numpy.ndarray的过程。由于cv2读取的数据存于内存中，以pytorch框架举例，在把数据送入GPU前会产生如下的数据转换：GPU准备进行inference之前会判断torch.c...

2019-11-04 09:51:33 3571 2

原创 Mask RCNN训练自己的数据集

该版本为tensorflow+keras版本的，官方版本刚开源10个小时（caffe2），以后再更新..一、工具cuda与cudnn安装请参考我之前博客： http://blog.csdn.net/l297969586/article/details/53320706 http://blog.csdn.net/l297969586/article/details/67632608 ...

2018-06-05 15:33:36 121551 451

vm配置：http://blog.csdn.net/u013142781/article/details/50529030 CMakeLists.txt：http://blog.csdn.net/z_h_s/article/details/50699905 莫烦python：https://morvanzhou.github.io/ 廖雪峰git与python：https://www.lia...

2018-03-27 16:01:48 11389 3

原创用自己的数据，制作python版本的cifar10数据集

前期准备：3通道图片60000张，如果你没有那么大的数据量，需要改变cifar-10-API中的定义，下面会具体说到。如果你的图片是灰度图（单通道）可以用这种方法来改为三通道： opencv将灰度图转化为RGB三通道图像要求为python2.7版本，由于cifar10就是在python2.7下面定义的，用python3版本与2.7版本最主要的不同是在2.7版本中打包模块为cPickle...

2017-04-24 15:20:27 16820 106

原创解决matplotlib画图中文乱码

一、下载字体以SimHei字体为例，下载SimHei.ttf文件在python环境下输入import matplotlibprint(matplotlib.__path__)输出matplotlib的安装环境，放在该路径下的mpl-data/fonts/ttf/二、修改配置文件修改matplotlib的安装环境下的，mpl-data/matplotlibrc文件，解开以下三行的注释font.family : sans-serif font.sans-seri

2020-06-10 10:09:17 489 1

原创解决Linux docker不能显示中文

三步可解决问题1、打开profile文件sudo vim /etc/profile2、将下述命令添加进文件末尾，并保存退出export LANG="C.UTF-8”3、执行命令，即可正常显示中文 source /etc/profile

2020-06-09 18:40:41 911

原创 ncnn中Yolov3DetectionOutput层参数含义

Yolov3DetectionOutput 125 3 1 104 114 124 125 0=4 1=3 2=0.300000 3=0.450000 -23304=18,15.000000,15.000000,30.000000,30.000000,60.000000,60.000000,60.000000,60.000000,90.000000,90.00000...

2019-12-02 18:08:34 2789 5

原创 cupy与numpy、pytorch Tensor转换

一、cupy与numpy互转import cupy as cpimport numpy as np#cupy->numpynumpy_data = cp.asnumpy(cupy_data)#numpy->cupycupy_data = cp.asarray(numpy_data)注：cupy->numpy过程较慢二、cupy与pytorch Tensor互转...

2019-10-30 18:12:52 12773 6

原创简易命令登陆ssh服务器

登陆ssh服务器需要账号与密码，而往往我们需要频繁的登陆与登出或者切换服务器，会很繁琐。其实可以使用expect来实现简易命令登陆ssh服务器，比如一个“go”～一、安装expect#ubuntusudo apt-get install expect#Mac需要源码编译安装tcl与expect，自行搜索若不成功，先更新下源再安装sudo apt-get update二、登陆脚本...

2019-10-11 14:20:09 549 1

原创解决ssh服务器自动断开连接

针对于mac或者ubuntu操作系统sudo vim /etc/ssh/sshd_config新行添加ServerAliveInterval 50ServerAliveCountMax 3亲测有效

2019-10-11 13:43:10 1530

原创计算caffe模型的参数量params与flops

一、脚本calc_params.pyimport syssys.path.insert(0, "/home/ubuntu/workspace/caffe-advance/python")import caffecaffe.set_mode_cpu()import numpy as npfrom numpy import prod, sumfrom pprint import ppr...

2019-09-03 18:46:53 2879

原创 pytorch版本yolov3模型转caffe

目前我有一个pytorch版本的yolov3模型，该模型有 X.cfg和X.pt两个文件该格式可以与两个主流pytorch工程一致：https://github.com/ultralytics/yolov3https://github.com/eriklindernoren/PyTorch-YOLOv3由于caffe没有yolov3所需的upsample层与yolo层，所以需要自己来实现...

2019-08-22 20:32:23 4020 2

原创 caffe编译错误:.build_release/lib/libcaffe.so: undefined reference to `cv::VideoWriter::write×××

解决方法一：caffe默认OpenCV版本为2.×，如果OpenCV为3.X可能出现上述问题#Makefile.configOPENCV_VERSION := 3取消注释解决方案二：#Makefile.config添加一行LIBRARIES += opencv_core opencv_highgui opencv_imgproc opencv_imgcodecs opencv_vid...

2019-08-14 11:59:19 2155 1

原创 ubuntu安装与卸载opencv与opencv_contrib

最近要用到CSRT跟踪器，要求opencv_contrib版本3.4.2及其以上，记录下安装过程（之前opencv和opencv_contrib版本都是3.4.0）零、安装依赖项注：只是更新版本的请忽略sudo apt-get install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config lib...

2019-08-01 17:15:20 1928 1

原创 TensorRT与pycuda配置运行yolov3

一、pycuda安装http://pypi.python.org/pypi/pucuda点击左侧download files，下载最新版本的pycuda#解压tar xfz pycuda-VERSION.tar.gz##编译 VERSION为你自己的版本号cd pycuda-VERSIONpython configure.py##此时会生成siteconf.py配置文件pyth...

2019-05-10 11:28:10 2575 2

原创目标检测mAP计算详解

首先说明计算mAP有多个版本，每个数据集和比赛用的版本和方式也不同，下以VOC与COCO举例说明。精确度（precision），召回率（recall）分别为：常规的mAP计算为（这是一个N类检测任务）：1、计算单张图片中class1的精度P（VOC默认IOU大于0.5即为TP，COCO稍复杂些，下文再说）2、循环所有测试集图片，重复1过程求所有图片P的均值即为class1的AP3、对...

2019-05-07 12:35:38 23955 12

原创待研究论文

1、CenterNet（无anchor 检测：bbox keypoint）、知乎：https://zhuanlan.zhihu.com/p/62836519论文：https://arxiv.org/pdf/1904.07850.pdfgithub：https://github.com/xingyizhou/CenterNet同时还有FoveaBox：博文：https://mp.weixi...

2019-04-18 17:56:49 544

原创无人驾驶bdd数据集转voc格式

直接上脚本import osimport os.path as ospimport jsonfrom xml.etree.ElementTree import Element, SubElementfrom xml.etree import ElementTreefrom xml.dom import minidomfrom PIL import Imagefrom tqd...

2019-04-12 17:30:56 2222

原创 caffe：同步Batch Normalization(syncbn)作用

1、BN训练与测试过程BN层有4个参数，gamma、beta、moving mean、moving variance。其中gamma、beta为学习参数，moving mean、moving variance为数据集统计均值与方差，不可学习。在训练过程中：y为BN层输出，此时归一化的均值与方差为当前mini-batch的均值与方差。同时也记录moving mean、moving varianc...

2019-02-19 17:14:08 4456 3

原创反卷积参数确定

反卷积输出o = (i-1)*stride+ kernel_size-2pad但是caffe官方文档建议参数比如下：layer { name: "upsample", type: "Deconvolution" bottom: "{{bottom_name}}" top: "{{top_name}}" convolution_param {

2019-01-15 21:03:23 1843

原创 protobuf版本冲突问题解决

1、proto/caffe.pb.h:17:2: error: #error This file was generated by an older version of protoc如果你装有anaconda，以及tensorflow，或者在编译protobuf时候很容易出现这些问题，最有可能的原因是你的系统里有多个protoc。之前的解决方法1、在.bashrc中注释anaconda...

2018-05-31 17:13:20 37060 18

原创 Realtime_Multi-Person_Pose_Estimation demo.ipynb代码注释

该部分可以帮助很好的理解论文的实现部分源码地址：https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation 论文地址：https://arxiv.org/abs/1611.08050# -*- coding:utf-8 -*-import sysfrom configobj import ConfigObjcaffe_...

2018-05-17 09:37:23 2942 3

原创远程操作工具 Teamviewer

linux：https://www.teamviewer.com/zhcn/download/linux/ windows：https://www.teamviewer.com/zhcn/download/windows/windows按照提示一步步安装即可。 linux安装：1、下载32位版本的2、安装依赖库sudo apt-get install libjp...

2018-03-28 17:04:47 1989

原创 caffe中卷积层反向传播原理

参考：https://blog.csdn.net/buyi_shizi/article/details/51512848，首先十分感谢该博主对caffe中反向传播原理的讲解，但是感觉该文章中对convlution layer的表述有问题。以下为本人的理解，如有错误还请批评指正一、caffe卷积层反向传播代码实现CAFFE_ROOT/src/caffe/layers/conv_layer...

2018-03-26 23:00:56 4073

原创 opencv通过邻域像素填补图片噪点

该demo为将像素值为0标注为噪点，图片为灰度图（可自行修改为RGB），填补方式为8邻域像素均值填补，只修复噪点#include <iostream>#include <opencv2/opencv.hpp>#include <stdio.h>using namespace std;using namespace cv;int main()...

2018-01-24 18:49:36 1882

原创 opencv将16位灰度图片转化为8位

大家在加载灰度图时，一定要看准图片存储格式位数 opencv默认为8位读取，如果该图为16位，则读取为全0，导致程序出错以下代码只需修改路径，可以批量处理图片#include <iostream>#include <opencv2/opencv.hpp>#include <string>#include <stdio.h>usi...

2018-01-24 18:28:52 40777 24

原创 Kinect V2.0得到RGB图像各个像素点对应的三维坐标（相机坐标系）

Kinect2.0 SDK中有函数原型如下的映射机制，可得到1920*1080的RGB图像中各个像素点对应的相机坐标系下的三维坐标public:HRESULT MapColorFrameToCameraSpace( UINT depthPointCount, const UINT16 *depthFrameData, UINT cam...

2017-12-29 13:41:37 19347 23

原创 Tensorflow与Keras自适应使用显存

Tensorflow支持基于cuda内核与cudnn的GPU加速，Keras出现较晚，为Tensorflow的高层框架，由于Keras使用的方便性与很好的延展性，之后更是作为Tensorflow的官方指定第三方支持开源框架。但两者在使用GPU时都有一个特点，就是默认为全占满模式。在训练的情况下，特别是分步训练时会导致显存溢出，导致程序崩溃。可以使用自适应配置来调整显存的使用情况。一、Ten...

2017-12-26 18:07:46 8771

原创基于curl的linux与windows通信服务搭建

一、环境准备windows：curl、json、base64、visual studio linux：自带的swgi模块、base64、json二、curl配置下载最新的curl版本：http://curl.haxx.se/latest.cgi?curl=tar.gz 解压到自定义的一个文件夹里，假设为 D:\curl 找到你的visual studio安装目录中vcvar...

2017-12-26 10:30:46 1176

原创 Mask R-CNN翻译（主要技术点解析）

今年何凯明大神再放大招，运用不多的策略就打败了去年实例分割的冠军，并且在去除mask分支的基础上达到了目标检测（class、box）的最好成绩。废话不多说，马上进入正题~ note：以下仅为个人理解，如有错误还请各位留言纠正策略一：采用并行训练策略Mask R-CNN仅仅是在Faster R-CNN的基础上添加了一个预测mask分支（FCN）掩码的，达到像素级别的分类目标，并且与以往...

2017-12-08 17:16:46 1653

原创 python脚本：根据视差图制作npy格式的深度信息文件

前提：你有一些disp（视差）图，例如我是在“”/home/lj/workspace/open-npy/img_d/”文件夹下有disp_1.bmp、disp_2.bmp、disp_3.bmp、disp_4.bmp四张视差图，来制作disp_re_1.npy、disp_re_2.npy、disp_re_3.npy、disp_re_4.npy深度信息的numpy格式压缩文件视差图转深度信息就不在...

2017-11-06 11:25:27 2123

原创 Dex-Net 3.0 论文翻译

一、绪论1、研究目的：研究深度学习在机器人吸附抓取领域的应用 2、研究意义：提高在对具有复杂几何外形的物体进行吸附抓取是鲁棒性较低的问题 3、研究思路： (1). 设计物理模型 (2). 构建Dex-Net 3.0数据集 (3). 训练GQ-CNN网络二、柔性吸附接触模型（一）问题描述 1、目标：对于由深度相机给出的点云，我们的目标是找到一个鲁棒性最高的吸附抓取方式。 2、假设：为了便

2017-11-04 15:54:55 3882 1

原创 Dex-Net 2.0 论文翻译

一、绪论1）本文的主要贡献 1、制作dex-net2.0数据集，该数据集包括670万点云数据，又从1500个 3D模型通过GWS（抓手运行空间分析）得到手爪的运行规划 2、设计Grasp Quality Convolutional Neural Network (GQ-CNN)，去得到一系列鲁棒性良好的抓取规划 3、设置一种抓取机制，可以对得到的鲁棒性良好的一组抓取规划进行 rank排序，

2017-11-04 15:44:01 7913 5

原创 Dex-Net 1.0 论文翻译

一、概述DEX-NET1.0（Dex-Net），一种新的数据集和相关算法，以研究大数据和云计算对鲁棒抓握规划的扩展效应。该算法使用具有相关奖励的多臂老虎机模型来利用当前包含超过10,000个独立3D物体模型和250万个平行颚爪抓取方式的不断增长的数据集中的先验抓取方式和3D物体模型。每个抓取方式包括在物体和夹持器姿态和摩擦不确定性下的力闭合概率的估计。 Dex-Net 1.0使用多视图卷积神经网络

2017-11-04 11:43:58 3879 2

转载 cvSetimageROI使用

上一次介绍了多图像单窗口的使用，其中很重要甚至可以说是至关重要的一步就是cvSetimageROI函数以及其他函数配合使用的地方！代码如下（详细请参考“openCV入门----单窗口多图片显示”博客）：cvSetImageROI(DispImage, cvRect(x, y, (int)(w / scale), (int)(h / scale)));// Resize the input imag...

2017-10-09 16:35:31 1772

转载 openCV中 cvSeq的用法说明

openCV中 cvSeq的用法说明函数原型说明CvSeq* cvCreateSeq(int seq_flags,int header_size,int elem_size,CvMemStorage* storage)功能：创建一序列参数：seq_flags为序列的符号标志。如果序列不会被传递给任何使用特定序列的函数，那么将它设为0，否则从预定义的序列类型中选择一合适的类型。Header_siz...

2017-10-09 15:38:26 1178

原创 ubuntu 查找包含关键字的文件

如果想在当前文件夹查看后缀为.txt中含有“Base”关键字的文件，只需find ./ -name "*.txt" | xargs grep "Base"格式为：find 文件夹路径 -name "用通配符表示要搜索的文件" | xargs grep "要搜索的key值"对于通配符，根据自己需求进行修改，如对.txt文件搜索为 “*.txt” 无要求（即所有文件全部搜...

2017-09-26 16:04:26 3972

原创 ubuntu修改图片格式（jpg、jpeg、pbm等）

方法一：imagemagick#安装sudo apt-get install imagemagick#转化convert 1.jpeg 1.jpg方法二：opencv#include <iostream>#include<opencv2/core/core.hpp> #include<opencv2/highgui/highgui....

2017-09-26 11:23:46 6508

原创 Faster-RCNN_TF代码解读20：blob.py

2017-09-19 09:42:58 1322 1

原创 Faster-RCNN_TF代码解读19：bbox.pyx

2017-09-19 09:42:11 2499 1

base64工具

用自己的数据制作python版本cifar10数据集

用自己的数据制作cifar10数据集

NCVPixelOperations.hpp

空空如也