自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shY Pa

开启AI视觉之路

  • 博客(46)
  • 收藏
  • 关注

原创 ubuntu中redis+mysql安装使用

redis、mysql

2023-08-09 17:42:53 475

原创 OCR数据生成之SynthText场景文本

自然场景的文字识别的数据生成至关重要,可以大量降低人工标注的成本,这里详细介绍SynthText的安装和使用,并生成自己的bg数据集对应的图片以及优化引入生成垂直文本的功能。SynthText官方示例生成效果https://github.com/ankush-me/SynthText直接下载工程,和工程开源的SynthText.h5等数据,直接python gen.py即可。我这里使用的是工程中的python3分支Adding New ImagesSegmentation and dept.

2021-01-10 11:33:53 3464 4

原创 NNI(自动超参数搜索)工具环境配置及使用

本文主要介绍如何搭建Microsoft的NNI工具环境以及使用NNI进行Mnist分类任务的超参数搜索。NNI简介NNI (Neural Network Intelligence) 是一个轻量但强大的工具包,帮助用户自动的进行特征工程,神经网络架构搜索,超参调优以及模型压缩。NNI 管理自动机器学习 (AutoML) 的 Experiment,调度运行由调优算法生成的 Trial 任务来找到最好的神经网络架构和/或超参,支持各种训练环境,如本机,远程服务器,OpenPAI,Kubeflow,基于 K

2020-12-22 16:37:32 2762 2

原创 TensorRT的环境搭建及使用

本文主要简要介绍TensorRT的环境搭建及如何使用。环境安装我这里使用的是TensorRT-5.1.5.0版本,其他版本可能会有一些出入。安装好的TensorRT环境的docker镜像(docker pull 857470845/hvd_trt_apex_torch:v1)可供下载使用。示例运行主要测试两种示例:1、利用安装好的convert_to_uff.py脚本将tensorflow的pb模型文件(lenet)转成uff格式文件,并测试mnist数据;将TensorRT-5.1.5.0项

2020-12-22 16:35:17 872 2

原创 conda/pip/linux软件源替换提高软件下载速度

本文主要提供好用的软件源地址配置。1、.condarc主要用于conda install时的软件源,需要安装conda环境;mv .condarc ~/##.condarcchannels: - defaultsshow_channel_urls: truechannel_alias: https://mirrors.tuna.tsinghua.edu.cn/anacondadefault_channels: - https://mirrors.tuna.tsinghua.edu.c

2020-12-22 16:32:49 173

原创 COCOAPI评价指标解析及改进

本文主要解析目标检测中常用的COCOAPI工具计算mAP的过程,以及增加相关功能用于更好的提供模型优化的方向。程序入口python eval_coco.py特别说明results_test.json格式如下:[{“image_id”: 19, “category_id”: 1, “bbox”: [121.4, 116.02, 560.56, 303.83], “score”: 0.97}, {“image_id”: 19, “category_id”: 1, “bbox”: [119.3, 74

2020-12-15 19:36:55 3022 1

原创 OCR资料汇总

https://blog.csdn.net/u012968002/article/details/80015136https://blog.csdn.net/zx_good_night/article/details/88715206?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-taskhttps://blog.csdn.net/wsp_113888611

2020-05-13 22:58:45 256

原创 competition汇总

1、推荐算法:http://tech.gmw.cn/2018-09/30/content_31465739.htmhttps://baijiahao.baidu.com/s?id=1634223908882244382&wfr=spider&for=pchttps://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2...

2020-05-13 15:21:27 250

原创 DL知识总结

1、优化方法https://blog.csdn.net/yinyu19950811/article/details/90476956---精读,讲的非常好https://blog.csdn.net/u011984148/article/details/99800544--RADAMhttp://wulc.me/2019/03/18/Adam%E9%82%A3%E4%B9%88%E6%A...

2020-04-14 18:45:54 2043

原创 window10下vscode运行python和C++程序需要的配置过程

1、pychram、vscode、jupyter notebook都可以运行python,是有界面的编辑器;还可以安装Anacanda;不过这里是使用vscode配置python和C++运行过程,下面时亲试有效的链接:使用vscode运行python使用vscode配置C++(win10、ubuntu16.04)visual studio 2017配置注意配置C++时,按照上述...

2020-03-27 13:05:51 695

原创 ttc、otf、ttf文件制作以及相关数据增强(OCR)

1、ttc、ttf、otf、otc‘的含义https://wenku.baidu.com/view/7bc6861f964bcf84b9d57b97.html简要说明:High-Logic FontCreator字体编辑器使用方法

2020-03-17 19:24:37 5739

原创 process-on在线绘制架构图,xmind绘制思维导图

对于IT行业从业者来说,绘制架构图非常重要,这里推荐一款可以在线绘图并保存下载图片的软件process-on,该软件类似于微软的vison,但是process-on不需要安装任何环境,在线绘制就可以,并且有很多免费的模板可以使用:地址:https://www.processon.com/;同时使用xmind软件可以绘制清晰明了的思维导图,非常方便用于知识总结;...

2020-03-16 17:35:38 2827

原创 leetcode刷题总结(python版)

1、字符串查找有两个字符串,str1,str2,在str1里面找str2字符串,如果存在,返回str2在str1中的第一个字符的位置,不存在,返回-1;例如str1=‘abcds’,str2=‘bcd’,返回1;str2='bce',返回-1;思路:在str1中设置循环,循环从位置0到str1的长度减去str2长度+1的位置,每循环一次,在str1中取出str2长度的子字符串,和str...

2020-03-14 12:01:40 3109 1

原创 windows批处理得到文件夹下所有文件名、根据文件名txt进行copy、批量修改文件夹下文件后缀

1、批量修改后缀名:ren *.html *.asphttps://jingyan.baidu.com/article/22a299b5f2627c9e19376acd.html2、得到文件夹下所有文件名:DIR *.jpg /B >LIST.TXThttps://blog.csdn.net/Jo_liver/article/details/100625833?depth_1-...

2020-02-26 18:32:18 1905

原创 python2、3的文本及终端显示的中文编解码问题

1、python2和python3的中文编解码有很大的不同,其中python2的字符串str类型和Unicode类型是不同的,而python3的str字符串类型和unicode是相同的,因此操作会有不同。2、终端显示中文的问题:终端显示中文需要知道sys和locale的默认编码设置,windows和linux系统对应的是不同的,一般windows稍微sys.getdefaultencoding...

2020-01-08 23:56:34 514

原创 Typora编写md文件

跟Vscode中装些许插件,例如MarkdownPDF可以将md文件转成html、pdf等格式的文件,但是当md文件中存在目录连接时,转换后的pdf、html文件中链接会失效,同时这种方式很难在md文件中插入latex公式,并且背景版式也很难修改,而这些问题在利用Typora软件编写md文件时很容易解决,Typora是一款仅支持MarkDown文件书写的软件,支持多种格式的导出;软件下载路径...

2019-11-21 10:29:30 3747

原创 VScode写markdown并转换成pdf、html等文件

Vscode安装Markdown PDF插件,即可将vscode编写得md文件转换成pdf、html等文件格式输出;https://www.jianshu.com/p/f1029409f468https://jingyan.baidu.com/article/eae07827794d661fed54854c.htmlmarkdown文件(.md)语法:https://gith...

2019-11-19 14:23:37 4041

原创 U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization

论文题目:U-GAT-IT: Unsupervised Generative Attentional Networks with AdaptiveLayer-Instance Normalization for Image-to-Image Translation(2019-7-25)code:https://github.com/taki0112/UGATIT(tensorflow版本)/...

2019-08-07 23:09:48 4257 4

原创 知识总结

1、cudnn.enabled = True和cudnn.benchmark = True作用:提高运行效率;https://blog.csdn.net/qq_27061325/article/details/875411672、pytorch的loss:https://blog.csdn.net/ls83776736/article/details/80979470https:/...

2019-08-04 15:54:48 341

原创 论文解读:Exploring Object Relation in Mean Teacher for Cross-Domain Detection

论文题目:Exploring Object Relation in Mean Teacher for Cross-Domain Detection(CVPR 2019)论文主要贡献:该论文主要也是为了解决跨域的目标检测问题,但是与之前的基于判别的特征方法有很大的不同,主要是利用了半监督学习中SOTA方法Mean Teacher(NIPS 2017:Mean teachers are bette...

2019-08-04 13:30:08 1537

原创 论文解读:Detach and Adapt: Learning Cross-Domain Disentangled Deep Representation

论文题目:Detach and Adapt: Learning Cross-Domain Disentangled Deep Representation(CVPR2018 spotlight)论文思路:主要提出跨域表征分离网络CDRD(Cross-Domain Representation Disentangler (CDRD))以及将CDRD和条件图像翻译相结合的拓展网络ECDRD(Ext...

2019-08-04 11:21:45 857

原创 论文解读:Multi-level Domain Adaptive learning for Cross-Domain Detection

论文题目:Multi-level Domain Adaptive learning for Cross-Domain Detection(Task-CV workshop ICCV2019)论文主要贡献:已有的目标检测自适应方法主要基于全局的特征自适应,没有考虑局部特征自适应(其实是不对的,现有的检测自适应方法有基于全局的,也有局部和实例的特征自适应,分割和分类主要是全局自适应),因此本论文提...

2019-07-30 23:32:36 1143

原创 论文解读:Adapting Object Detectors via Selective Cross-Domain Alignment

论文题目:Adapting Object Detectors via Selective Cross-Domain Alignment(CVPR2019)论文主要贡献:以往的域自适应的方法在分类和分割中应用较多,检测中的相关论文比较少,顶会论文大概就4-5篇,而以往的域适应的方法主要针对全局的特征对齐(在loss和距离度量上做文章),这在分类和分割上没什么问题,但是检测任务更多的不是基于全局的...

2019-07-29 23:00:40 2461

原创 论文解读:Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent

论文题目:Taking A Closer Look at Domain ShiftCategory-level Adversaries for Semantics Consistent Domain Adaptation(CVPR2019)代码地址:https://github.com/RoyalVane/CLAN论文主要贡献:现有的分割自适应方法没有考虑不同类别的对齐差异,有的类别...

2019-07-28 15:36:58 3676

原创 论文解读:Conditional Generative Adversarial Network for Structured Domain Adaptation

论文题目:Conditional Generative Adversarial Network for Structured Domain Adaptation论文主要贡献:通过条件生成网络提高分割模型的域自适应能力;论文主要网络结构:基础结构:VGG-19+FCN-8s创新点:在conv1成提取的low-level特征结合noise(通过concat)条件生成出特征和conv...

2019-07-28 11:52:43 1008

原创 论文解读:Towards Instance-level Image-to-Image Translation

论文题目:Towards Instance-level Image-to-Image Translation(CVPR2019)项目地址:http://zhiqiangshen.com/projects/INIT/index.html论文背景:通过t-sne可视化,同一种颜色表示同一个域的全局style和实例style,可以看到即使是同一个域的图片,全局的style和实例的styl...

2019-07-28 11:14:16 1456 1

原创 论文解读:Generating large labeled data sets for laparoscopic image processing tasks using unpaired image

论文题目:Generating large labeled data sets for laparoscopic image processing tasks using unpaired image-to-image translation(2019-7-5)数据集和代码地址:http://opencas.dkfz.de/image2image/论文主要贡献:通过修改MUINT网络生...

2019-07-28 10:20:03 394

原创 SSIM(MSSSIM)loss和相似功能的loss总结

1、tensorflow版本https://www.e-learn.cn/index.php/content/wangluowenzhang/2498702、pytorch版本(SSIM、MSSSIM)https://github.com/jorge-pessoa/pytorch-msssim/tree/master3、contextual loss(作用同SSIM)https...

2019-07-25 14:04:42 12392

原创 pytorch知识小结

https://blog.csdn.net/weixin_41990278/article/details/90311313https://blog.csdn.net/jacke121/article/details/82733197https://blog.csdn.net/qxqsunshine/article/details/82973979https://blog.csdn.n...

2019-07-24 22:46:34 150

原创 后台运行程序及一些常用指令

1、nohup XXX > XXX.txt 2>&1 &:后台运行程序2、python XXX.py > XXX.txt3、python XXX.py | tee XXX.txthttps://blog.csdn.net/zsytoyota/article/details/84871719https://blog.csdn.net/qq_15505...

2019-07-17 22:48:35 698

原创 训练DL相关程序的一些小问题

1、程序kill后,GPU内存没有完全释放https://blog.csdn.net/jzrita/article/details/80719297如root用户通过ps aux|grep root|grep python,然后删除对应的id即可;实验证明可行;2、后台运行程序nohup python xxx.py > xxx.txt 2>&1 &注...

2019-07-16 23:10:23 147

原创 loss训练时的不下降、nan或者为0

1、loss不下降:https://blog.csdn.net/qq_19329785/article/details/84260201https://blog.csdn.net/zongza/article/details/89185852https://blog.csdn.net/liuweiyuxiang/article/details/808569912、检测中faster...

2019-07-16 23:03:19 5455

原创 深度学习的具体优化求解过程

1、https://blog.csdn.net/qq_27261889/article/details/82915598https://mp.weixin.qq.com/s?__biz=MzIwMjgyMDM3MQ%3D%3D&chksm=96d998e6a1ae11f0842316044cc783f67aa410a359c8b1728e794ae8560da2752124ff5f9c...

2019-07-16 22:55:50 454

原创 All about Structure: Adapting Structural Information across Domains for Boosting 语义分割代码流程

code:https://github.com/a514514772/DISE-Domain-Invariant-Structure-Extraction1、代码流程如下,backbone是deeplabv2,以res101为骨干网络,不过可以看到在layer3和4,该程序修改了原始的res101的layer3和4,原始的分别是2倍下采样,这里改成了空洞卷积,并且不下采样,同时在这两个层输出预...

2019-07-15 00:26:05 542

原创 strong-weak-faster-rcnn整体流程(pytorch)思路

code: https://github.com/VisionLearningGroup/DA_Detection代码相当于在faster-rcnn的第一阶段加上了2个分支的判别器,低级特征的判别和高级特征的判别器,因此先详解faster-rcnn的流程,然后笔记中画出来strong-weak的整体流程1、训练过程:本程序虽然有两处具体处理batch的数据(1、im_list_to_blo...

2019-07-14 23:27:48 411 2

原创 pytorch下输入输出图像尺寸计算

1、https://blog.csdn.net/qq_21997625/article/details/87252780https://blog.csdn.net/u012932178/article/details/80731735https://blog.csdn.net/g11d111/article/details/82665265https://blog.csdn.net/g...

2019-07-14 23:24:28 7734 2

原创 深度学习环境搭建-docker篇

1、先根据gpu型号从nvidia官网(http://www.geforce.cn/drivers)下载相应得驱动具体安装步骤参考如下博客:https://blog.csdn.net/hjq376247328/article/details/79816992https://blog.csdn.net/sunnydream1112/article/details/80587047...

2019-06-30 23:28:50 906

原创 linux下torch-0.4.0安装流程及心得

1、https://pytorch.org/:可以按照官网下载对应的whl文件;如果官网打不开,参考网址https://blog.csdn.net/m0_37615398/article/details/83510891或https://blog.csdn.net/qq_34374211/article/details/80156517的说明安装,注意可以根据自己的硬件平台选择cuda8.0编...

2019-06-27 22:44:16 5241

原创 Deep Learning项目实用技巧总结

1、https://blog.csdn.net/luqian0110/article/details/80342887拷贝文件夹时过滤一些文件夹不拷贝2、https://blog.csdn.net/u013991521/article/details/80528647linux下合并两个txt文件3、https://blog.csdn.net/fqlovetb/article/de...

2019-06-26 23:50:29 138

原创 语义分割:Effective use of synthetic data for urban scene semantic segmentation论文解读

Effective use of synthetic data for urban scene semantic segmentation通过高效利用合成数据用于城市场景语义分割---ECCV18(Australian Centre of Excellence for Robotic Vision)背景:现有的分割自适应的方法中特征自适应和输出空间自适应存在一定的弊端,首先现有得自适应方法...

2019-06-26 23:31:20 518

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除