13 Arnold-FY-Chen

尚未进行身份认证

我要认证

On the way to AI Fellow...

等级
TA的排名 3w+

Cudnn占用大量内存问题

近来在对一个3D图像识别模型做部署裁剪时发现,做了一些有效的裁剪后,模型启动后占用的内存虽然减少了两三百个M,但是再继续对网络做裁剪缺减少不明显了,包含封装调用这个模型的deepstream插件在内始终占用800多个M,感觉很奇怪,于是花了些时间,捣腾琢磨网络本身的C++实现代码,找出哪些代码执行后占用了可观的内存,最后发现,其他跟训练有关的可减的都减了也没见省多少内存,但是模型启动的过程中,当cudnn的API被第一次调用时,启动有卡顿,同时看着内存一路不停飙升,把相关网络层的代码注释掉试试,...

2020-09-30 22:29:08

NVIDIA Jetson板子上安装nvidia docker需要注意的问题

一般来说,使用NVIDIA官网上下载的sdk image烧写入SD卡或者使用sdk manager/jet package连到板子安装全部软件后,里面什么都有了,包括docker和nvidia docker里面都有了,使用nvidia docker可以把GPU用起来,但是如果误删或者不小心弄坏了docker,或者为了减少发布系统的image的大小,尽量减少不需要安装的软件包,比如想从最基本的Basic Packages for L4T 开始根据需要一点一点的添加,那么自己安装nvidia doc...

2020-08-22 12:54:23

DeepStream插件启动出错问题

NVIDIA DeepStream是基于GStreamer框架开发的,增加了一些适应视频识别推理跟踪方面的自己定制的扩展以及内置了提供了YOLO和Faster-RCNN的实现而已,需要简单看一下DeepStream的文档https://docs.nvidia.com/metropolis/deepstream/dev-guide/index.html(说实话那些文档写得真的很不咋样,超简单,很多都没说清楚的,没有GStreamer的基础估计理解也费劲,尤其API文档更是估计使用的doxygen机...

2020-08-08 12:36:17

如何在vscode下将C++代码格式化成Google Style

Eclipse有个很好的功能就是能一键将源码全部格式化成标准好看的格式,不用自己在写代码时时时刻刻去注意缩进和行长度等那些烦人的细节,但是实验了一下Eclipse最新的2020-06版本,C/C++版Eclipse没有arm版本的,只有X86版,同时C/C++版还不能安装CppStyle插件(就是相当于vscode下的cpplint插件),Java版本当然是支持,但是用Eclipse Market Client安装上CppStyle后,发现貌似工作不正常,可能是CppStyle对最新版支持不好的问题...

2020-08-01 23:44:08

解决github上大项目的git clone经常失败的问题

国内访问github的速度很慢且不稳定,当github上项目文件很多或者有几百M的大文件时,使用git clone下载到本地可能会经常失败,例如,报得比较常见的错误: RPC failed; curl 56 GnuTLS recv error (-9): A TLS packet with unexpected length was received RPC failed; curl 18 transfer closed with outstanding read data ...

2020-08-01 23:10:44

Xavier NX上安装Deepstream导致NX不断的重启

使用安装SDK Manager后再使用JetPack安装板子的方式非常慢而且由于网络慢容易出错,所以直接使用SD Image烧写TF卡是最快的安装方式,将image写入TF卡后,启动板子可以看到Ubuntu18.04和和TensorRT等大部分工具软件已经打包在image内一起安装了,但是Deepstream却没有包含进去,这点很奇怪。 我们使用的SD Image是6月份从NVIDIA官网上下载的nv-jetson-nx-sd-card-image-r32.4.2,为何不下载使用最新...

2020-07-25 19:52:22

ImportError: cannot import name ‘__check_build‘ from partially initialized module ‘sklearn‘

同事的本子上用pip install scikit-learn 安装时报错说:sklearn\\datasets\\tests\\data\\openml\\1119\\api-v1-json-data-list-data_name-adult-census-limit-2-data_version-1.json.gz'再执行一次pip install scikit-learn居然不报错了说安装成功了!但是使用到sklearn时报错:C:\Users>python signal_no...

2020-07-03 20:54:18

我的AI之路(51)--用自己的UCF101数据集训练3D识别模型video-caffe

C3D(C3D project website)的初始版本https://github.com/facebookarchive/C3D太老了,下载一个比较新的版本的源码: https://github.com/chuckcho/video-caffe安装video-caffe的编译环境支持包: apt install libopencv-dev apt-get install git cmake apt install cmake-qt-gui a...

2020-06-27 19:07:12

我的AI之路(50)--用Darknet训练YOLOv3和YOLOv3 Tiny

首先获得darknet的官方源码并做配置修改并编译:git clone https://github.com/pjreddie/darknet.gitcd darknetvi Makefile修改如下项目:GPU=1CUDNN=1OPENCV=1OPENMP=0DEBUG=0ARCH= -gencode arch=compute_30,code=sm_30 \ -gencode arch=compute_35,code=sm_35 \ -gencod...

2020-06-27 17:51:53

git常用命令及github如何提交大文件

批量添加文件:git add . 添加新文件和被修改文件,不包括被删除文件,包括子目录,但是不包括空目录,并且会根据.gitignore做过滤git add * 会忽略.gitignore把任何文件都加入git add -u 监控已经被add的文件, 不会提交新文件git add -A 添加所有状态的文件,是上面两个功能的合集只添加指定文件:git add filename.txtgit add *.txt查看文件:git ls-files 查看已存放文件git...

2020-06-26 00:14:54

我的AI之路(49)--安装华为modelarts sdk

像安装其他特定公司的工具包一样,使用对应公司的服务器应该是最快的,安装华为的工具包可以设置配置文件~/.pip/pip.conf文件如下: [global] index-url = http://repo.myhuaweicloud.com/repository/pypi/simple format = columns [install] ...

2020-05-04 23:06:35

我的AI之路(48)--用同一自有数据集训练和比较CenterNet、EfficientDet、Cascade-RCNN的实际识别效果

目标检测模型的发布论文一般给出了基于VOC或COCO等数据集的AP和AR等指标值,这个可以作为比较选择模型的一个参考,实际效果怎么样还是得自己动手实验了才知道真实效果是怎么样,最好采用需要在实际项目中应用的自己制作的同一数据集来训练和比较比较直观和有说服力。 近两个月来断断续续用一部分时间使用同一自有数据集(内有1个类别)完成了CenterNet、EfficientDet(b...

2020-04-19 18:17:00

Ubuntu里设置docker容器内的服务随开机自动启动

要让docker容器内的服务能在开机加电后自动启动,要解决三个问题:1.docker服务能随OS启动而启动2.docker容器能随docker服务启动而启动3.docker容器内的服务能随docker容器启动而启动 Ubuntu18.04上,docker service 默认没有enable,所以Ubuntu18.04启动后不会自动启动docker service...

2020-04-19 16:04:20

我的AI之路(47)--使用自己的数据集训练EfficientDet

训练用的服务器的芯片一般都是X86架构的,所以可以直接从hub.docker.com上拉个安装了pytorch的镜像下来作为训练用的环境,省去了很多安装步骤,例如拉取pytorch/pytorch:1.3-cuda10.1-cudnn7-devel(注意一般不要使用runtime镜像,runtime镜像里面只安装了最小的支持环境,很多工具都没安装,devel镜像一般是比较全面的):...

2020-04-12 23:06:11

我的AI之路(46)--在Xavier上的自制dock镜像内安装支持部署EfficientDet和CenterNet模型以及mmdetection序列模型的环境

按照制作支持GPU的用于部署AI模型的ARM64版docker镜像一文中的步骤制作出基础镜像并创建容器后,连到这个容器,执行下列步骤,进行支持部署EfficientDet和CenterNet模型以及mmdetection序列模型的环境的安装:1) EfficientDet apt-get update sudo apt-get install apt-file...

2020-04-12 21:52:20

制作支持GPU的用于部署AI模型的ARM64版docker镜像

hub.docker.com上绝大部分镜像都是只能在X86平台上使用的,arm上的很少,arm64上的装有Ubuntu18.04的只找到个arm64v8/ubuntu:18.04镜像,pull下来后使用过,里面很多东西没安装,连基本的vim都没有安装,而且安装完一些支持包后使用nvidia-docker run 创建的容器里面GPU设备总是找不到,GPU测试通不过,虽然CUDA和cuD...

2020-04-12 21:05:13

配置NVIDIA Jetson AGX Xavier

首先调整一个Xavier的运行模式和风扇速度,Xavier加电时默认没有启动风扇,运行一段时间后会非常烫,长期这样可能容易坏,所以至少需要把风扇启动起来。Xavier的Ubuntu18.04桌面的右上方有菜单可以选择设置运行的功耗模式,也可以使用下面的nvpmodel命令来设置: sudo nvpmodel --query #查看当前的模式,默认为2, 功耗15W ...

2020-04-12 18:01:04

安装和使用NVIDIA Jetson AGX Xavier

对近几个月在Nvidia Jetson AGX Xavier上的工作做一下记录备忘,Xavier是NVIDIA的边缘计算板子的最新版本也是最高配的序列,NVIDIA Jetson序列板子的具体配置可参见下图: 因机器人上需要部署网络层次深体量大的高精度AI图像识别物体检测模型,一般的边缘计算板子扛不住,于是让公司购买了NVIDIA Jetson AGX...

2020-04-12 14:47:43

我的AI之路(45)--使用自己的数据集训练CenterNet

CenterNet是anchor-free类型网络,具有识别精度高且速度快的特点,根据作者的论文中列出的数据来看,指标综合考虑来看比较牛了: 最后那个CenterNet-HG,也就是backbone使用的Hourglass-104网络的AP值只比FSAF低一点了(但是FSAF目前貌似还没有源码放出来),比YOLO序列和RCNN序列都强很多,虽然FPS自有7.8,但是对一般实...

2020-03-01 23:31:43

如何查看并准确找到占用GPU的程序

有时多人都在一段时间内同时使用公司共用的服务器上的GPU训练,有的网络的代码写得不好,虽然是按需获取GPU内存但停止训练了却仍然占用GPU没放,有的则采取的是预分配机制,一开始运行加载训练好了的模型时就占用大量内存(比如9-10G),没有进行识别推理也占用内存不放,多人共用的环境如果有人用完不及时停掉相关程序,很多GPU就被占了但空闲在那里,但又不好随便乱杀进程来释放,首先得确认一下...

2020-03-08 13:06:24

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。