自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor

运行Faster rcnn FPN网络,出现的bug:RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor解决办法: anchor_target_layer_fpn.py", line 136: num_examples = torch.sum(labels[i] >= 0) ...

2019-09-02 23:11:51 1854

原创 RuntimeError: Expected object of type torch.FloatTensor but found type torch.cuda.FloatTensor for ar

运行FPN faster rcnn 进行模型继续训练时出现的BUG,查看了网上的原因,发现时数据格式不匹配,必须得改为cuda格式,所以修改: if args.resume: load_name = os.path.join(output_dir, 'fpn_{}_{}_{}.pth'.format(args.checksession, args.checkepoch, a...

2019-09-02 22:55:00 1764

原创 ROI Align 代码解析个人心得(仅供参考)

关于ROI Align的算法原理讲解,博客有很多,但是暂时没发现有讲解源码的,笔者最近使用Faster rcnn代码时就想仔细了解一下roi align的代码。于是就读了一下其代码,代码由C语言写的,也不是非常难理解,在这里贴一下自己对代码的理解,若有错误,欢迎大家批评指正。void ROIAlignForwardCpu(const float* bottom_data, const float...

2019-08-15 15:58:48 3531 5

原创 win10keras版本yolo3显示中文标注

之前的博文被检测到非原创,我只能更改为转载,所以在这里补充一下网友问到中文标注的问题,在此补充说明一下:**博主尝试过各种诸如utf-8 转换格式等操作均不行,后来经过打印信息才发现是显示的字体问题:想显示中文标注,在yolo.py中找到这句代码: font = ImageFont.truetype(font='font/FiraMono-Medium.otf', ...

2019-08-05 15:59:02 883 1

原创 YOLO3+WIN10+Keras+自己的训练集

@YOLO3+WIN10+Keras+自己的训练集YOLO3+WIN10+Keras+自己的训练集在深度学习的目标检测领域也已经有一段时间了,从之前的学习基础知识到读别人的代码,中间读了很多的博客,这里写下自己的一些经验。训练集的准备训练集我尝试过两种格式,一种是xml格式,一种是json格式,两种格式都可以进行训练,只不过需要修改一下转换脚本。首先先从GitHub上面下载文件,并解压...

2019-08-05 15:55:45 2893 16

原创 numpy实现GIOU代码

笔者使用numpy实现了GIOU,废话不多说,直接贴上代码:import numpy as npdef GIOU (boxes1 , boxes2 ): "calculate GIOU " ''' boxes1 shape : shape (n, 4) boxes2 shape : shape (k, 4) gious: shape (n, k) ...

2019-07-29 22:28:14 836

原创 手撕NMS,numpy实现目标检测的常用模块NMS

目标检测领域的一个重要组件,NMS,非极大值抑制,用于在检测领域剔除同一目标的多重框标注,图示效果如下:NMS过后图片为网络上查找的,侵删。首先,来了解一下NMS,NMS非极大值抑制,即一个目标有多个框的时候,我们进行筛选,选取最好的框,筛选掉那些重复标注的框。那么它是怎么筛选的呢?首先,一个目标在检测过程中,往往会有许多的预测框出现,这些框的score不同,坐标位置也不同。NMS首先...

2019-07-27 16:56:08 1604

原创 GIOU(generalized IoU)笔记

论文的地址为:https://arxiv.org/abs/1902.09630github代码地址:https://github.com/generalized-iou这篇论文出自CVPR2019,这篇论文提出了一种优化边界框的新方式即GIOU。IOU中文叫并交比,即两者公共的面积占总面积的比值,在目标检测中,常用于衡量bbox的位置准确与否,与GT(ground truth)的IOU越大往...

2019-07-26 22:35:29 2875

原创 线下数据增强:对图像进行上下随机颜色填充,并修改对应的xml文件

项目数据不够的时候,往往需要进行数据扩增,此文介绍一种简单的扩增方式,用于线下数据增强。首先贴上代码#此脚本用于填充图片,使得图片变成1280*1280大小import osimport numpy as npfrom PIL import Imagefrom xml.etree.ElementTree import parse, ElementJPEGfilepath = 'JP...

2019-07-22 15:43:15 1014

原创 批量将图片与白色图进行叠加(仅作记录)

import numpy as npfrom PIL import Image# Image创建一张(1280,1024)的白色图片newIm= Image.new('RGB', (1280,1024 ), (255,255,255))#此处设置的大小为1280*1024#若需要针对不同的大小可以在循环中读取每张图片的宽高再创建,在图片宽高固定时先创建避#免每个循环都创建白色图片impo...

2019-07-20 21:51:10 447

原创 脚本批量转为灰度图并重新命名

#生成灰度图from PIL import Imageimport osinput_dir = 'JPEGImages/' #待处理照片的文件夹out_dir = 'NewJPEGImages/' #输出文件夹a = os.listdir(input_dir)for i in a: print(i) I = Image.open(input_dir + i) ...

2019-07-20 17:29:17 163

原创 批量修改XML文件中的filename,并对修改文件名

import osfrom xml.etree.ElementTree import parse, Elementout_dir = 'NewAnnotations/' ##这里是保存的目标文件夹b = os.listdir('Annotations/')for i in b: print(i) dom = parse('Annotations/'+i) roo...

2019-07-20 17:25:14 4063 7

原创 VOC转coco脚本,仅用于目标检测,非分割任务

首先进行VOC2007转为coco数据集的格式:从github上下载voc转coco的脚本,该脚本不包含语义分割的segmentation,只能用于目标检测的坐标转换下载的传送门:https://github.com/jiachen0212/voc2coco-pattern修改其中的xml2json.py脚本(1)voc_clses= …(此处加上__background__)即填写n加1...

2019-07-19 17:26:31 2862 7

原创 object detection 目标检测算法综述 (记录)

最近找了一些目标检测算法综述,这篇比较好,特此记录一下。对应的博客地址 https://blog.csdn.net/Gentleman_Qin/article/details/84421435

2019-07-19 17:19:25 287

原创 ubuntu16.04配置深度学习环境

显卡驱动添加驱动源sudo apt-get purge nvidia*sudo add-apt-repository ppa:graphics-drivers/ppasudo apt-get update然后在软件和更新的附加驱动里面就可以找到自己显卡的驱动了!一定要等到显示 重新启动 再重启。也可以直接命令:sudo apt-get install nvidia-384 nvid...

2019-07-19 17:14:05 641

原创 YOLO3算法个人算法理解心得

经过一段时间的代码解读和反复试验,加上与各位网友的交流,写下一点个人理解,希望对大家有所帮助。yolo3算法属于one-stage算法,主要体现在,可以直接输出框和类型,这一点和faster-rcnn不一样。在faster-rcnn中,会先进行rpn网络进行proposal的提取,得到roi,随后再与特征图进行roi-pooling,得出结果。而yolo3直接由输入图片和kmean预先设定尺寸的...

2019-04-13 21:27:53 2328 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除