图像小白鼠-CSDN博客

原创 RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor

运行Faster rcnn FPN网络，出现的bug：RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor解决办法： anchor_target_layer_fpn.py", line 136: num_examples = torch.sum(labels[i] >= 0) ...

2019-09-02 23:11:51 1854

原创 RuntimeError: Expected object of type torch.FloatTensor but found type torch.cuda.FloatTensor for ar

运行FPN faster rcnn 进行模型继续训练时出现的BUG，查看了网上的原因，发现时数据格式不匹配，必须得改为cuda格式，所以修改： if args.resume: load_name = os.path.join(output_dir, 'fpn_{}_{}_{}.pth'.format(args.checksession, args.checkepoch, a...

2019-09-02 22:55:00 1764

原创 ROI Align 代码解析个人心得（仅供参考）

关于ROI Align的算法原理讲解，博客有很多，但是暂时没发现有讲解源码的，笔者最近使用Faster rcnn代码时就想仔细了解一下roi align的代码。于是就读了一下其代码，代码由C语言写的，也不是非常难理解，在这里贴一下自己对代码的理解，若有错误，欢迎大家批评指正。void ROIAlignForwardCpu(const float* bottom_data, const float...

2019-08-15 15:58:48 3531 5

原创 win10keras版本yolo3显示中文标注

之前的博文被检测到非原创，我只能更改为转载，所以在这里补充一下网友问到中文标注的问题，在此补充说明一下：**博主尝试过各种诸如utf-8 转换格式等操作均不行，后来经过打印信息才发现是显示的字体问题：想显示中文标注，在yolo.py中找到这句代码： font = ImageFont.truetype(font='font/FiraMono-Medium.otf', ...

2019-08-05 15:59:02 883 1

原创 YOLO3+WIN10+Keras+自己的训练集

@YOLO3+WIN10+Keras+自己的训练集YOLO3+WIN10+Keras+自己的训练集在深度学习的目标检测领域也已经有一段时间了，从之前的学习基础知识到读别人的代码，中间读了很多的博客，这里写下自己的一些经验。训练集的准备训练集我尝试过两种格式，一种是xml格式，一种是json格式，两种格式都可以进行训练，只不过需要修改一下转换脚本。首先先从GitHub上面下载文件，并解压...

2019-08-05 15:55:45 2893 16

原创 numpy实现GIOU代码

笔者使用numpy实现了GIOU，废话不多说，直接贴上代码：import numpy as npdef GIOU (boxes1 , boxes2 ): "calculate GIOU " ''' boxes1 shape : shape (n, 4) boxes2 shape : shape (k, 4) gious: shape (n, k) ...

2019-07-29 22:28:14 836

原创手撕NMS，numpy实现目标检测的常用模块NMS

目标检测领域的一个重要组件，NMS，非极大值抑制，用于在检测领域剔除同一目标的多重框标注，图示效果如下:NMS过后图片为网络上查找的，侵删。首先，来了解一下NMS，NMS非极大值抑制，即一个目标有多个框的时候，我们进行筛选，选取最好的框，筛选掉那些重复标注的框。那么它是怎么筛选的呢？首先，一个目标在检测过程中，往往会有许多的预测框出现，这些框的score不同，坐标位置也不同。NMS首先...

2019-07-27 16:56:08 1604

原创 GIOU（generalized IoU）笔记

论文的地址为：https://arxiv.org/abs/1902.09630github代码地址：https://github.com/generalized-iou这篇论文出自CVPR2019，这篇论文提出了一种优化边界框的新方式即GIOU。IOU中文叫并交比，即两者公共的面积占总面积的比值，在目标检测中，常用于衡量bbox的位置准确与否，与GT(ground truth)的IOU越大往...

2019-07-26 22:35:29 2875

原创线下数据增强：对图像进行上下随机颜色填充，并修改对应的xml文件

项目数据不够的时候，往往需要进行数据扩增，此文介绍一种简单的扩增方式，用于线下数据增强。首先贴上代码#此脚本用于填充图片，使得图片变成1280*1280大小import osimport numpy as npfrom PIL import Imagefrom xml.etree.ElementTree import parse, ElementJPEGfilepath = 'JP...

2019-07-22 15:43:15 1014

原创批量将图片与白色图进行叠加（仅作记录）

import numpy as npfrom PIL import Image# Image创建一张(1280，1024)的白色图片newIm= Image.new('RGB', (1280,1024 ), (255,255,255))#此处设置的大小为1280*1024#若需要针对不同的大小可以在循环中读取每张图片的宽高再创建，在图片宽高固定时先创建避#免每个循环都创建白色图片impo...

2019-07-20 21:51:10 447

原创脚本批量转为灰度图并重新命名

#生成灰度图from PIL import Imageimport osinput_dir = 'JPEGImages/' #待处理照片的文件夹out_dir = 'NewJPEGImages/' #输出文件夹a = os.listdir(input_dir)for i in a: print(i) I = Image.open(input_dir + i) ...

2019-07-20 17:29:17 163

原创批量修改XML文件中的filename，并对修改文件名

import osfrom xml.etree.ElementTree import parse, Elementout_dir = 'NewAnnotations/' ##这里是保存的目标文件夹b = os.listdir('Annotations/')for i in b: print(i) dom = parse('Annotations/'+i) roo...

2019-07-20 17:25:14 4063 7

原创 VOC转coco脚本，仅用于目标检测，非分割任务

首先进行VOC2007转为coco数据集的格式：从github上下载voc转coco的脚本，该脚本不包含语义分割的segmentation，只能用于目标检测的坐标转换下载的传送门：https://github.com/jiachen0212/voc2coco-pattern修改其中的xml2json.py脚本（1）voc_clses= …(此处加上__background__)即填写n加1...

2019-07-19 17:26:31 2862 7

原创 object detection 目标检测算法综述（记录）

最近找了一些目标检测算法综述，这篇比较好，特此记录一下。对应的博客地址 https://blog.csdn.net/Gentleman_Qin/article/details/84421435

2019-07-19 17:19:25 287

原创 ubuntu16.04配置深度学习环境

显卡驱动添加驱动源sudo apt-get purge nvidia*sudo add-apt-repository ppa:graphics-drivers/ppasudo apt-get update然后在软件和更新的附加驱动里面就可以找到自己显卡的驱动了！一定要等到显示重新启动再重启。也可以直接命令：sudo apt-get install nvidia-384 nvid...

2019-07-19 17:14:05 641

原创 YOLO3算法个人算法理解心得

经过一段时间的代码解读和反复试验，加上与各位网友的交流，写下一点个人理解，希望对大家有所帮助。yolo3算法属于one-stage算法，主要体现在，可以直接输出框和类型，这一点和faster-rcnn不一样。在faster-rcnn中，会先进行rpn网络进行proposal的提取，得到roi，随后再与特征图进行roi-pooling，得出结果。而yolo3直接由输入图片和kmean预先设定尺寸的...

2019-04-13 21:27:53 2328 1

qq_43088746的博客