无人不智能，机器不学习-CSDN博客

原创 DEFT: Detection Embeddings for Tracking论文解读

DEFT: Detection Embeddings for Tracking论文解读摘要大多数现代多目标跟踪（MOT）系统遵循按检测跟踪的模式，由检测器和将检测关联到轨迹的方法组成。在结合运动和外观特征以提供对遮挡和其他挑战的鲁棒性的跟踪研究方面已有很长的历史，但是这通常伴随着更复杂和更慢的实现的权衡。最近在流行的2D跟踪基准上取得的成功表明，通过使用最先进的检测器和依赖于单帧空间偏移的相对简单的关联，可以获得最高分，这显著优于利用学习的外观特征帮助重新识别丢失轨迹的现代方法。在本文中，我们提出了一个

2021-02-09 19:06:27 1058

原创非常简单：linux系统如何使用图形化界面？

linux系统如何使用图形化界面？下载VNC windows版本然后安装，然后服务器上同样安装VNC。命令：yum install vnc vnc-server 安装tigervnc-server：yum install tightvnc-server点击windows系统上的vnc软件中file下面的New connection 配置一下服务器和端口。需要注意的是端口不能是已经被使用的端口，可以使用ps -aux | grep vnc 查看哪些端口已经被使

2020-11-04 20:37:10 4824

原创如何使用vs code连接服务器每次不用再输密码

如何使用vs code连接服务器每次不用再输密码首先在windows系统的cmd里面输入ssh-keygen保存公钥和私钥。一般保存在C盘的用户下面的.ssh隐藏文件夹。然后为了区分之前生成的私钥和公钥可以将这一对进行重命名。2. 在vs code 的配置文件里配置如下：IdentityFile C:/Users/用户/.ssh/vscode_rsa如图Host 10.168.4.15HostName 10.168.4.15User yckj3304IdentityFile C:/

2020-10-30 12:01:34 2992

原创简单几句话告诉你如何利用vs code连接服务器上的docker环境

VS code连接服务器上的docker环境docker run的时候要指定端口确保容器上有ssh设置ssh用密码连接：passwd然后记得service ssh start 和service ssh restartvs code 这要进行配置：Host name_of_you_loveHostName IP_of_you_want_to_connectPort 8088User root其中Host是可以自己指定的名字，HostName是要连接的iP User是root，如果是连接宿

2020-09-24 08:50:45 766

原创图像预处理如何快速便捷的实现keep ratio操作

图像预处理如何快速便捷的实现keep ratio操作def get_input(img, shape_hw, keep_raito=True): import mmcv if not isinstance(img, np.ndarray): img = mmcv.imread(img) assert shape_hw[0] % 32 == 0 and shape_hw[1] % 32 == 0 if keep_raito: img, scal

2020-09-02 20:27:01 832

原创 tensorboard的快捷使用方法

tensorboard使用方法建议不要使用docker来进行使用，因为直接使用的是文件，所以可以直接使用外部的环境。使用pip install tensorboard 进行安装。然后使用tensorboard --logdir log路径 --port 6007然后修改xshell里面的属性里面的隧道。代码里面的操作：首先 from tensorboardX import SummaryWriter在log处log = Logger()log.write(boneName)writer = Su

2020-09-01 20:49:38 249

原创最新多目标跟踪算法综述-2020年08月23日

最新多目标跟踪算法综述-2020年08月23日多目标跟踪：SORT和Deep SORT1. 多目标跟踪是什么？多目标跟踪，即Multiple Object Tracking(MOT)，主要任务中是给定一个图像序列，找到图像序列中运动的物体，并将不同帧的运动物体进行识别，也就是给定一个确定准确的id，当然这些物体可以是任意的，如行人、车辆、各种动物等等，而最多的研究是行人跟踪，由于人是一个非刚体的目标，且实际应用中行人检测跟踪更具有商业价值。绝大多数MOT算法无外乎这四个步骤：①检测 ②特征提取、运动

2020-08-23 14:50:50 9075 1

原创如何利用opencv读取图片并且转换成pytorch可以使用的形式？

如何利用opencv读取图片并且转换成pytorch可以使用的形式？1.首先需要注意的是opencv读取图片的格式以及维度，后续转换需要注意opencv读取图片后的维度是B,H,W,C 并且读取的是bgr2.如何利用opencv读取图片并且转换成pytorch可以使用的形式：img = cv2.imread(img_dir)resized_img = cv2.resize(img, new_size, interpolation=cv2.INTER_LINEAR)#resized_img_rgb

2020-08-06 20:16:27 2896

原创 Pytorch如何加载多卡预训练模型以及如何解决此次训练所用卡数与之前卡数不同的问题？

Pytorch如何加载多卡预训练模型以及如何解决此次训练所用卡数与之前卡数不同的问题？当我们使用Pytorch多卡训练得到一个模型然后再使用单卡加载时可能就会报错。或者多卡加载单卡训练的模型也有可能出错，这主要是因为训练的模型记录了相关的信息，那么如何解决如何问题呢，只需要按照如下方式进行预训练模型的加载即可。 # If specified we start from checkpoint &nbs

2020-07-11 15:33:41 2926

原创几句大白话告诉你如何上传文件夹到github或者gitlab上

几句大白话告诉你如何上传文件夹到github或者gitlab上1.首先git clone 一个仓库到本地或者服务器2.然后在克隆的文件夹下进行操作，如建立文件夹或者修改相关的操作3.然后使用git add . 命令进行添加，将所有的修改都添加上去，如果只想添加一个文件就用文件名取代点4. git commit -m "做了哪些操作”5. git push 然后输入用户名和密码（github或者gitlab上的用户名和密码）就可以了。中间可能会提示输入user.name 和user.email按

2020-06-19 20:52:16 1328

原创如何使用Pytorch冻结你不想要其参数被改变的层

如何使用Pytorch冻结你不想要其参数被改变的层我猜下面的内容应该是你想要的！#---------------------------model define ------------------------------------#class YourModel(nn.Module): def __init__(self, feat_dim): # input the dim of output fea-map of Resnet: super(YourModel, s

2020-06-07 14:46:55 899

原创编译安装yolo v4 c版遇到的问题及解决方法（最全踩坑）

编译安装yolo v4 c版遇到的问题及解决方法（最全踩坑）要十分注意，在一开始一定记得加-gpus all建立docker1.首先编译安装cmake下载cmake的安装包。（1）解压，然后执行./configure遇到问题提示然后安装ssl，执行如下命令：apt-get install libssl-dev提示：然后执行命令：apt-get update然后再执行apt-get install libssl-dev然后接下来就make -j接下里在root用户下或者sudo

2020-05-28 10:13:53 2437 1

原创 Docker的使用要点

Docker的使用要点1.docker包含三个概念：镜像，容器和仓库。其中仓库可以看作是一个代码控制中心，用来保存镜像。解释：容器可以看作是一个独立运行的一个应用，是镜像运行的实体。2. docker允许你在容器内运行应用程序，使用dockers run命令来在容器内运行一个应用程序。# 实例：Docker 以 ubuntu15.10 镜像创建一个新容器，然后在容器里执行 bin/echo "Hello world"，然后输出结果。runoob@runoob:~$ docker run ubunt

2020-05-23 10:26:16 352

原创 # 为我所用之SENet

为我所用之SENet1. SENet是Squeeze-and-Excitation Networks的简称，拿到了ImageNet2017分类比赛冠军，其效果得到了认可，其提出的SE模块思想简单，易于实现，并且很容易可以加载到现有的网络模型框架中。SENet主要是学习了channel之间的相关性，筛选出了针对通道的注意力，稍微增加了一点计算量，但是效果比较好。class SELayer(nn.Module): def __init__(self, channel, reduction=16):

2020-05-23 10:15:12 1431

原创一种值得借鉴的RPN：GARPN | Region Proposal by Guided Anchoring

GARPN | Region Proposal by Guided Anchoring**基于语义特征指导anchor生成。**主要思想是定位可能的目标中心点，然后根据中心点设置最优的anchor box。该方法联合预测各个位置可能的目标的中心点以及相应的尺度和宽高比。训练时相比于RPN：（1）GA-RPN产生的正样本数目更多，而且高IoU的proposal占的比例更大。（2）GA-RPN采用更高的阈值、使用更少的样本（3）使用高质量proposal的前提是根据proposal的分布调整训

2020-05-23 10:12:12 1667

原创 OCR之端到端任意形状的场景文字识别 ICCV2019 End-to-End Text Spotting

OCR之端到端任意形状的场景文字识别 ICCV2019 End-to-End Text Spotting端到端文本识别（End-to-End TextSpotting）是将文本阅读问题看成一个整体来解决，其基本思想是设计一个同时具有检测单元和识别单元的模型，共享其中两者的CNN特征，并联合训练。在推断阶段，此端到端模型可以在一个前向传播中预测场景图像中的文本位置和内容信息。这篇文章是谷歌...

2020-04-10 12:00:53 2793

原创 Pytorch学习要点整理

Pytorch学习要点整理PyTorch是一个基于Torch的Python开源机器学习库，用于自然语言处理等应用程序。它主要由Facebookd的人工智能小组开发，不仅能够实现强大的GPU加速，同时还支持动态神经网络，这一点是现在很多主流框架如TensorFlow都不支持的。 PyTorch提供了两个高级功能：1.具有强大的GPU加速的张量计算（如Numpy）2.包含自动求导系统的深度神经...

2020-04-07 13:38:45 704

原创 Linux 链接概念及其理解

Linux 链接概念及其理解Linux 链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln 命令产生硬链接。硬连接硬连接指通过索引节点来进行连接。在 Linux 的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在 Linux 中，多个文件名指向同一索引节点是存...

2020-03-30 09:38:25 331

原创 2020CVPR解读之何恺明新作PointRend：将图像分割视作渲染问题，显著提升语义/实例分割性能

2020CVPR解读之何恺明团队新作PointRend：将图像分割视作渲染问题，显著提升语义/实例分割性能论文原文源码【导读】Facebook人工智能实验室何恺明团队提出一种高效、高质量的目标和场景图像分割新方法。他们提出了一个独特的视角，将图像分割视为一个渲染问题，提出PointRend神经网络模块。建立在现有的最先进的模型之上，PointRend可以灵活地应用于实例分割和语义分割任务。...

2020-03-29 14:23:28 7409 1

原创 2020CVPR-目标检测论文解读之FSOD：Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

2020CVPR-目标检测论文解读之FSOD：Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector数据集参考1.摘要传统的目标检测方法通常需要大量的训练数据，而准备这样高质量的训练数据是非常劳动密集的。本文提出了一种新的少镜头目标检测网络，该网络只需少量的标注实例，就可以检测出不可见类的目标。该方法的...

2020-03-15 17:06:20 9346

原创 2020CVPR解读之百度的人脸检测HAMBox：Delving into Online High-quality Anchors Mining for Detection

2020CVPR解读之百度的HAMBox：Delving into Online High-quality Anchors Mining for Detection个人认为原文论文中貌似有一些细节的错误，个人能力有限，如有理解错误请见谅！OuterFace: 异常人脸，由于人脸尺度过小或者人脸尺度与anchor尺度不匹配，造成训练时匹配不到足够多的anchor（小于阈值K），影响了这些人脸的...

2020-03-13 22:28:36 2459

原创 2020CVPR解读之ATSS：Bridging the Gap Between Anchor-based and Anchor-free Detection

2020CVPR论文解读之ATSS：Bridging the Gap Between Anchor-based and Anchor-free Detection论文源码思考与学习1.论文详细解释了anchor-free与anchor-based的本质区别，此外，使用ATSS去尝试解决label assignment的问题2.ATSS是目标检测中可以学习借鉴的点，解决正负样本的选取问题。...

2020-03-09 19:27:19 2759

原创 DenseFusion(6D姿态估计)解读-2019cvpr

DenseFusion(6D姿态估计)解读-2019cvpr资源论文作者源码他人修改过代码作者的想法我们在研究中发现，从 RGB-D 输入中提取 6D 姿态信息时，很多点是被其他对象遮挡住的，这就会导致识别性能发生明显下降。在前人的工作中，一种流行的方法是利用全局特征进行 6D 位姿估计。但是当发生了遮挡，全局特征很大程度上会受到影响，导致预估测结果不佳。在这项工作中，我们生成了基于像...

2020-03-09 12:44:04 4789

原创大白话解读2020CVPR-GhostNet论文以及相关代码: 超越MobileNetV3的轻量级网络

大白话解读GhostNet论文以及相关代码: 超越MobileNetV3的轻量级网络华为源码源码为了减少神经网络的计算消耗，论文提出Ghost模块来构建高效的网络结果。该模块将原始的卷积层分成两部分，先使用更少的卷积核来生成少量内在特征图，然后通过简单的线性变化操作来进一步高效地生成ghost特征图。从实验来看，对比其它模型，GhostNet的压缩效果最好，且准确率保持也很不错，论文思想...

2020-03-01 12:15:17 4168

原创云从的多粒度网络（MGN）的结构设计与技术实现-ReID行人重识别

云从的多粒度网络（MGN）的结构设计与技术实现-ReID1.摘要全局特征和局部特征的结合是提高人的再识别（re-ID）任务识别性能的一种有效方法。以前的基于部分的方法主要集中在定位具有特定预定义语义的区域来学习局部表示，这增加了学习的难度，但对具有较大方差的场景却没有效率或鲁棒性。本文提出了一种融合不同粒度判别信息的端到端特征学习策略。我们仔细设计了多粒度网络（MGN），这是一个多分支的深层网...

2020-02-29 17:48:43 3551 1

原创大白话解读行人重识别-ReID之DG-Net

综述参考：from:ReID综述(上）https://www.leiphone.com/news/201712/4Mvj2NBIxCN5bQZI.htmlfrom：ReID综述（下）https://www.leiphone.com/news/201712/JdVuO1BWAIrkPSyx.html一.DG-Net源码1. 摘要和简介利用生成数据去改进行人ReID：使用一种联合学习框架，...

2020-02-28 21:03:37 2764 1

原创如何将Google的AutoAugment应用于实际问题

结合PIL使用from autoaugment import ImageNetPolicyimage = PIL.Image.open(path)policy = ImageNetPolicy()transformed = policy(image)结合Pytorch使用from autoaugment import ImageNetPolicydata = ImageFolder...

2020-02-09 11:03:11 1051 5

原创 EfficientNet的pyTorch版本的使用和训练方法

EfficientNet的pyTorch版本的训练和测试1. efficientNet 的pyTorch版本的测试和使用第三方PyTorch代码# pytorch 的efficientNet安装Install via pip:pip install efficientnet_pytorchOr install from source:git clone https://github...

2020-02-07 15:10:44 32096 10

原创利用Anaconda管理包和环境以及分享环境

利用Anaconda管理包和环境以及分享环境1.管理包1.安装了 Anaconda 之后，管理包是相当简单的。要安装包，请在终端中键入 conda install package_name。例如，要安装 numpy，请键入 conda install numpy。2.大多数命令都是很直观的。要卸载包，请使用 conda remove package_name。要更新包，请使用 conda u...

2020-02-05 11:09:44 2046

原创大白话讲解MobileNet-v3

大白话讲解MobileNet-v3MobileNet-v3可以说是轻量化网络的集大成者，所以在介绍MobileNet-v3之前我们有必要了解一下目前的一些轻量化网络及特点。1.轻量化网络在移动端部署深度卷积网络，无论什么视觉任务，选择高精度的计算量少和参数少的骨干网是必经之路。轻量化网络是移动端的研究重点，目前的一些主要的轻量化网络及特点如下：SqueezeNet：提出Fire Modul...

2019-12-09 21:33:41 22182 2

原创大白话告诉你如何使用pipenv管理项目的虚拟环境-使用指南

大白话告诉你如何使用pipenv管理项目的虚拟环境-使用指南一. pipenv本身的安装首先是 pipenv的安装：pip install pipenv二. 为项目创建虚拟环境pipenv管理虚拟环境是按项目来的, 要为你的某个项目新建一个虚拟环境, 只需要在项目目录下运行如下命令:pipenv –twopipenv --three 会使用当前系统的Python3创建环境pipenv...

2019-12-05 20:37:31 1399 2

原创谷歌团队告诉你如何选择目标检测的架构！！！

谷歌团队告诉你如何选择目标检测的架构！！！Github已有60k个star（太多技巧可以学习）谷歌团队在2017年CVPR上发表了一篇论文，主要讲述了从业者该如何选择目标检测的架构。以及根据应用场合及需要的条件进行速度及精度的权衡。本文主要是原论文的翻译。原论文链接现代卷积目标检测器的速度/精度权衡摘要本文的目的是作为选择一种检测架构的指南，该架构能够为给定的应用程序和平台实现正确的速度...

2019-12-04 17:21:34 622

原创你需要的conda命令都在这里！

你需要的conda命令都在这里！1.获取版本号 conda --version2.获取帮助 conda -h3.查看环境命令的全部帮助 conda env -h4.创建一个环境 conda create --name your env创建包含某些包的环境 conda create --name your env scipy创建指定python版本下包含某些包的环境 conda cre...

2019-11-24 21:11:18 273

原创你想要的最新的目标检测算法在这里！

你想要的最新的目标检测算法在这里！自从2012年以来，基于深度学习的目标检测技术发展了很多，主要思想也发生了很大变化。下图展示了基于深度学习卷积神经网络的目标检测技术的主要里程碑。技术发展趋势是基于 anchor-free 的目标检测器（红色线）和 AutoML 技术（绿色线），这两项技术可能成为未来重要的研究方向。基于关键点的目标检测算法1.什么是基于关键点的目标检测算法（free-a...

2019-11-21 15:56:43 1745

原创 YOLO V3实践最全问题解决方案，比如couldn't open file: data/coco.names

YOLO V3实践最全问题解决方案，比如couldn’t open file: data/coco.names1. 第一步安装Darknetgit clone https://github.com/pjreddie/darknet.gitcd darknetmake如果这行得通，您应该会看到一大堆编译信息：mkdir -p objgcc -I/usr/local/cuda/incl...

2019-11-20 11:15:08 2608

原创 EfficientNet的细节理解及解读

Efficientnet网络学习源码论文第三方PyTorch代码一、总览卷积神经网络通常都是先在固定资源预算下开发设计，然后如果资源有多余的话再将模型结构放大以便获得更好的精度。在本篇论文中，我们系统地研究了模型缩放并且仔细验证了网络深度、宽度和分辨率之间的平衡可以导致更好的性能表现。基于这样的观察，我们提出了一种新的缩放方法——使用一个简单高效的复合系数来完成对深度/宽度/分辨率所有维...

2019-11-08 11:13:45 6032

原创 ICCV2019 最佳论文解读：SinGAN

SinGAN：Learning a Generative Model from a Single Natural Image (用一张自然图片，学出一个生成模型) 。ICCV 2019论文源码这篇论文提出了一种可以从单幅自然图像学习的非条件生成模型–SinGAN，能够捕捉图像的内部块分布信息，生成具有相同视觉内容的高质量、多变的样本。SinGAN包含一个金字塔结构的全卷积GAN，每个GAN...

2019-11-07 21:01:47 1960 1

原创多个优秀的OCR算法解读

论文1：ICCV2019 End-to-End Text Spotting端到端任意形状的场景文字识别解读这篇文章是谷歌发表再2019ICCV上面的一篇文章，主要解决了自然场景下任意形状的文字识别问题，而且是一种端到端的方法。端到端文本识别（End-to-End Text Spotting）是将文本阅读问题看成一个整体来解决，其基本思想是设计一个同时具有检测单元和识别单元的模型，共享其中...

2019-11-06 22:16:21 13356

原创非常好的python扩展包--非正式网址

非常好的python扩展包–非正式网址通过这个网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely （这是一个非常好的扩展包非正式网址，建议大家mark起来

2019-10-28 16:41:23 158

原创云从科技的Pixel-Anchor论文解读

云从科技的Pixel-Anchor论文解读导读参考目前基于深度学习的文本检测框架可以分为两类，一类是基于像素级别的图像语义分割，另一类是来源于通用的物体检测框架，譬如基于锚 (anchor) 的检测和回归。基于像素分割的文本检测框架首先通过图像语义分割获得可能的文本像素，之后通过像素点直接回归或者对文本像素的聚合得到最终的文本定位；而基于锚检测回归的文本检测框架是在通用物体检测的基础之上，通...

2019-10-28 16:38:49 408

空空如也

空空如也