Jeremy_lf-CSDN博客

原创 CVPR2020论文阅读——超强通道注意力模块ECANet！

Abstract最近，通道注意机制已被证明在改善深度卷积神经网络（CNN）的性能方面具有巨大潜力。然而，大多数现有方法致力于开发更复杂的注意模块以实现更好的性能，这不可避免地会增加模型的复杂性。为了克服性能和复杂性折衷之间的矛盾，本文提出了一种有效的信道注意（ECA）模块，该模块仅包含少量参数，同时带来明显的性能提升。通过剖析SENet中的通道注意模块，我们从经验上表明避免降维对于学习通道注意很重要，并且适当的跨通道交互可以在保持性能的同时显着降低模型的复杂性。因此，我们提出了一种无需降维的局部跨通.

2020-07-02 17:11:11 16426 11

原创【目标检测】FCOS：Fully Convolutional One-Stage Object Detection【附pytorch实现】

Abstract我们提出了一种完全卷积的一阶段目标检测器（FCOS），以按像素预测的方式来解决对象检测，类似于语义分割。几乎所有最新的物体检测器（例如RetinaNet，SSD，YOLOv3和Faster R-CNN）都依赖于预定义的锚框。相反，我们提出的目标检测器FCOS不含锚点和锚框。通过消除预定义的锚框，FCOS完全避免了与锚框相关的复杂计算，例如在训练过程中计算重叠。更重要的是，我们还避免了所有与锚框相关的超参数，这些超参数通常对最终检测性能非常敏感。借助唯一的后处理非最大抑制（NMS），带有Re

2020-06-29 20:44:28 766 1

原创 VoVNet：一种实时高效的目标检测Backbone网络【pytorch代码详解】

Pytorch实现代码2.Factors of Efficient Network Design在设计轻量级网络时，FLOPs和模型参数是主要考虑因素，但是减少模型大小和FLOPs不等同于减少推理时间和降低能耗。比如ShuffleNetv2与MobileNetv2在相同的FLOPs下，前者在GPU上速度更快。所以除了FLOPs和模型大小外，还需要考虑其他因素对能耗和模型推理速度的影响。这里考虑两个重要的因素：内存访问成本（Memory Access Cost，MAC）和GPU计算效率。2.1. Mem

2020-06-23 12:47:27 1953

原创【实例分割】论文阅读-CenterMask: Real-Time Anchor-Free Instance Segmentation

2.2. Architecture图2显示了CenterMask的总体架构。 CenterMask由三部分组成：（1）用于特征提取的主干，（2）FCOS [33]detection head和（3）Mask head。 Mask的生成过程包括：从FCOS [33]中检测物体，然后以像素为单位预测裁剪区域内部的分割Mask。2.3. Adaptive RoI Assignment Function在FCOS [33]box head 中预测候选框后，CenterMask使用与Mask RCNN相同的预

2020-06-16 11:27:23 1204

原创【实例分割】论文阅读：YOLACT Real-time Instance Segmentation

论文：YOLACT Real-time Instance Segmentation （ICCV2019）作者：Daniel Bolya Chong ZhouAbstract我们为实时实例分割提供了一个简单的全卷积模型，该模型在单个Titan Xp上以33.5 fps的速度在MS COCO上达到了==29.8 mAP，==这比以前的任何竞争方法都快得多。此外，我们仅在一个GPU上训练后即可获得此结果。我们通过将实例分割分为两个并行的子任务来完成此任务：（1）生成一组原型Mask，以及（2）预测每个实.

2020-06-08 14:58:37 612

原创论文阅读—图像分割方法综述(一)（arXiv:[cs:cv]20200410）

论文：Image Segmentation Using Deep Learning:A Survey作者：Shervin Minaee, Yuri Boykov, Fatih Porikli, Antonio Plaza1、Abstract图像分割是图像处理和计算机视觉中的关键主题，其应用包括场景理解，医学图像分析，机器人感知，视频监控，增强现实和图像压缩等。在文献中已经开发了用于图像分割的各种算法。最近，由于深度学习模型在各种视觉应用中的成功，已经有大量旨在利用深度学习模型开发图像分割方法的工作.

2020-06-02 17:11:28 2074

原创目标检测网络—SPPNet详解

翻译论文：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition概述当前深度卷积神经网络（CNNs）都需输入固定的图像尺寸(fixed-size),如224×224）。这种需要是“人为”的，并且当面对任意尺寸或比例的图像时，识别精度会降低。而论文中提出的**“空间金字塔池化”(spatial p...

2020-05-03 14:09:47 2643 3

原创深度学习之NLP学习笔记（三）—文本分类

文本分类是NLP领域最经典的应用场景之一，其实现方法我们可以划分为两类。其一是基于传统机器学习的文本分类，如 TF-IDF文本分类。其二便是基于深度学习方法的文本分类，如Facebook开源的FastText文本分类，Text-CNN 文本分类，Text-CNN 文本分类等。下面我们详细介绍这两种方法。一、机器学习方法文本分类任务可被划分为特征工程和分类器两部分，具体流程如下图所示：特...

2020-05-01 16:25:39 1702

原创深度学习之NLP学习笔记（二）—文本处理与特征工程

文本处理在现有数据中，文本是最非结构化的形式，里面有各种各样的噪声；如果没有预处理，文本数据都不能分析。清理和标准化文本的整个过程叫做文本预处理（text preprocessing）其作用是使文本数据没有噪声并且可以分析。具体包含以下三个内容：去噪声；词汇归一化；目标标准化去噪声噪声是指和需要的输出没有关系的文本。例如：语言的停用词(is，am, the, of等），URLs, 链接，社...

2020-04-28 01:27:15 975

原创深度学习之NLP学习笔记（一）—词嵌入及Word2Vec

一、词嵌入参考文章：什么是词嵌入词嵌入是单词的一种数值化表示方式，一般情况下会将一个单词映射到一个高维的向量中（词向量）来代表这个单词。词嵌入实际上是一种将各个单词在预定的向量空间中表示为实值向量的一类技术。每个单词被映射成一个向量（初始随机化），并且这个向量可以通过神经网络的方式来学习更新。因此这项技术基本集中应用与深度学习领域。这项技术的关键点在于如何用密集的分布式向量来表示每个单词。...

2020-04-27 14:47:37 1032

原创机器学习之决策树基本知识点

决策树是一种常用分类模型，优点是可读性强，分类速度快，学习时利用训练数据根据损失函数最小化的原则建立树模型。建立决策树的三个步骤：特征选择、决策树的生成、决策树的修剪（预修剪、后修剪）对于特征的选择，对于不同的算法有不同的方法，但是本质目的其实是为了降低模型的不确定性，基于其评价指标的不同，主要有ID3算法，C4.5算法和CART算法，其中ID3算法的评价指标是信息增益，C4.5算法的评价指标...

2020-04-23 00:41:02 447

原创关于目标检测之Faster-RCNN的理解

Faster-RCNN(2015年)该目标检测算法是基于Fast-RCNN的基础上，进行了改进，主要是对RCNN和Fast-RCNN中的用Selective Research方法生成的候选框进行改进。提出了一种RPN生成候选框的方法。FasterRCNN由两个模型组成，第一个就是RPN（深层全卷积网络）生成候选区域，第二个就是使用FastRCNN对候选区域进行检测。相比FASTER-RCNN...

2020-04-02 17:59:19 450

原创关于目标检测RCNN(Fast-RCNN/Faster-RCNN)系列的理解

目前较为成熟的目标检测算法可总结如下：RCNN（2014年）RCNN是一个多阶段训练模型，包括生成候选区域，CNN微调，SVM分类训练以及边界框回归等多个步骤（Selective Research+CNN+SVM）。整体流程类似于滑动窗口思想，R-CNN 采用对区域进行识别的方案，具体是：1、给定一张输入图片，从图片中提取 2000 个类别独立的候选区域。2、对于每个区域利用 CNN...

2020-04-02 00:56:07 878

原创关于目标检测中的候选区域Region Proposal的理解

目标检测指的是在一张图像中能够检测出物体所在的区域并且给出物体类别概率，其核心可以分为定位与识别两大模块。定位指的是我们在目标图像中锁定物体所在的区域，然后送入分类网络完成物体的识别。图像定位常用方法具体介绍如下：滑窗法—sliding window滑窗法是指用不同大小的窗口在整个图像上进行滑动，然后对每个窗口区域进行检测，复杂度极大，效率低下，此外还必须考虑到高宽比例不一致的情况，搜索变得...

2020-03-31 23:01:31 3059

原创关于K-means聚类算法重点理解

介绍k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法。聚类步骤1、预将数据分为K组，则随机选取K个对象作为初始的聚类中心；2、然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。3、聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断...

2020-03-26 23:14:32 1540 1

原创 SVM算法的理解及其Python实现多分类和二分类

原理SVM被提出于1964年，在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法，在人像识别、文本分类等模式识别（pattern recognition）问题中有得到应用。支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear clas...

2020-03-15 01:22:06 35452 5

原创关于CRNN文本识别算法的理解

一、简介常用文本识别算法有两种：CNN+RNN+CTC（CRNN+CTC）CNN+Seq2Seq+Attention其中CTC与Attention相当于是一种对齐方式，具体算法原理比较复杂，就不做详细的探讨。其中CTC可参考这篇博文，关于Attention机制的介绍，可以参考我的另一篇博文。CRNN 全称为 Convolutional Recurrent Neural Networ...

2020-03-12 02:09:00 3361 2

原创 RNN最全变体形式详解

参考：https://blog.csdn.net/bestrivern/article/details/90723524一.概述RNN用于处理序列数据。在传统的神经网络模型中，是从输入层到隐含层再到输出层，层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如，你要预测句子的下一个单词是什么，一般需要用到前面的单词，因为一个句子中前后单词并不是独...

2020-03-11 15:45:27 3489

原创【Pytorch】在修改后的网络结构上加载Pre-trained模型以及Fine-tuning

在实际工作或者学习当中，为了节省时间提高效率，我们在深度学习训练中，一般会使用已经训练好的开源模型（一般都是基于ImageNet数据集），但通常情况下我们自己涉及的模型和别人训练好的有很多地方不一样。难道我们就没法用了吗？当然不是，我们可以有很多种方法去实现我们想要的。其实并不是为了学习，只是在等湖人打快船比赛Pre-trained目前共有三种加载Pre-trained模型的方法：...

2020-03-09 18:57:53 1803 3

原创 Numpy常用函数及属性记录

一、数组常用属性Dimension transformation.reshape(shape) : 不改变当前数组，依shape生成.resize(shape) : 改变当前数组，依shape生成.swapaxes(ax1, ax2) : 将两个维度调换.flatten(): 对数组进行降维，返回折叠后的一位数组ndarray’s createnp.arange(n) : 元素从0...

2020-03-05 17:45:11 220

原创 Python常用函数记录

extend() 函数用于在列表末尾一次性追加另一个序列中的多个值（用新列表扩展原来的列表）list.extend(seq)实例：#!/usr/bin/pythonaList = [123, 'xyz', 'zara', 'abc', 123];bList = [2009, 'manni'];aList.extend(bList)print "Extended List : "...

2020-03-02 00:04:31 180

原创详细剖解Levenshtein距离算法（附python实现）

在实习期间，看到同事在做文字识别的相关项目，用Levenshtein距离作为评价模型好坏的标准之一。由于是行外人，当时对这个算法并没有任何了解，只听他介绍是用来判断两个字符是否相似的一种指标吧，直到后来自己也做NLP相关的项目，才好好钻研了一番，特此记录。一、Levenshtein距离一般的，我们在NLP中评价模型的时候，经常会使用计算得到的Levenshtein距离作为模型的评分（正确率...

2020-02-29 01:38:06 9653 2

原创 BP(BackPropagation)神经网络算法详解

一、BP神经网络背景BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念，是一种按照误差逆向传播算法训练的多层前馈神经网络，是应用最广泛的神经网络。在人工神经网络的发展历史上，感知机(Multilayer Perceptron，MLP)网络曾对人工神经网络的发展发挥了极大的作用，但是，随着研究工作的深入，人们发现它还存在不...

2020-02-27 22:37:51 11567

原创 MTCNN+FaceNet实现人脸检测与识别

人脸识别人脸识别包括两个模块人脸检测（人脸定位）+人脸识别。常用的人脸检测的算法有Dilb，OpenCV，OpenFace，MTCNN等。常用人脸识别的算法包括FaceNet，InsightFace模型等。本文以MTCNN结合FaceNet实现人脸的检测与识别。1、MTCNNMTCNN（Multi-task convolutional neural network，多任务卷积神经网络）是2...

2020-02-26 23:13:47 5770

原创遗传算法与进化策略的对比

基于对生物进化机制的模仿，共产生进化算法的四种典型模型：①遗传算法 Genetic Algorithm,GA②进化规划 Evolutionary Programming,EP③遗传规划 Genetic Programming,GP④进化策略 Evolution Strategy, E一、遗传算法（GA）遗传算法是仿真生物遗传学和自然选择机理，通过人工方式所构造的一类搜索算法，从某种程度...

2020-02-26 00:13:22 8655

原创关于NLP中词嵌入—Word Embedding的理解

词嵌入（word-embedding）又被称为词向量。在图像分类中一般使用One-hot编码，比如有五类，如果一个物体属于第二类的话，就可以用编码（0,1,0,0,0）来表示其类别。对于分类问题，十分简单明了。但在自然语言处理中，单词的数目过多，这样做就行不通了。比如有10000个单词，用one-hot方式来定义效率就特别低，每个单词的维度都是10000维的向量，其中只有一个是1，其他的都是0。...

2020-02-16 21:08:02 898

原创关于RNN的理解

简单循环神经网络一个简单的循环神经网络如，它由输入层、一个隐藏层和一个输出层组成：如果把上面有W的那个带箭头的圈去掉，它就变成了最普通的全连接神经网络。x是一个向量，它表示输入层的值（这里面没有画出来表示神经元节点的圆圈）；s是一个向量，它表示隐藏层的值（这里隐藏层面画了一个节点，你也可以想象这一层其实是多个节点，节点数与向量s的维度相同）；U是输入层到隐藏层的权重矩阵；o也是一个向量，它表...

2019-12-10 13:30:11 933

原创数学公式识别论文一：Image-to-Markup Generation with Coarse-to-Fine Attention

标题：Image-to-Markup Generation with Coarse-to-Fine Attention（图像到标记的生成具有由粗到精的注意力机制）2017年6月13作者：Yuntian Deng 1 Anssi KanervistoAbstract我们提出了一种神经编码器-解码器模型，用于基于可扩展的从粗到精注意机制将图像转换为表示标记。我们的方法是在图像到LaTeX生成...

2019-10-24 20:15:35 3303

原创等值线图的Python绘制方法

等值线图或等高线图在科学界经常用到，它是由一些封闭的曲线组成的，来表示三维结构表面。虽然看起来复杂，其实用matplotlib实现起来并不难。代码如下：import numpy as npimport matplotlib.pyplot as pltdx=0.01;dy=0.01x=np.arange(-2.0,2.0,dx)y=np.arange(-2.0,2.0,dy)X,Y=np...

2018-10-27 13:12:07 31674 8

原创 PR计算逻辑

【代码】PR计算逻辑。

2024-03-10 16:44:15 311

原创分割Mask2Polygon

【代码】分割Mask2Polygon。

2023-12-14 16:43:27 429

原创 VSCode调试方法

【代码】VSCode调试方法。

2023-12-14 16:43:06 373

原创 Heatmap关键点检测算法

高斯热图与坐标回归方法探讨

2023-01-24 21:57:45 5952 1

原创图像中的数据增强及变换

图像中的数据增强及变换。

2022-12-28 15:31:06 204 1

原创 Git基本操作(三)

Git放弃本地修改1、未使用git add 缓存代码使用git checkout – filename放弃所有文件修改 git checkout .此命令用来放弃掉所有还没有加入到缓存区的修改。2、已使用git add 缓存代码，未使用git commit使用 git reset HEAD filename放弃所有文件修改 git reset HEAD此命令用来清除 git 对于文件修改的缓存。相当于撤销 git add 命令所在的工作。在使用本命令后，本地的修改并不会消失，而是回到了第

2022-04-27 18:55:52 263

原创 Paddle Inference(模型推理)实例分析

一、Paddle推理生态二、API说明create_predictor 方法# 根据 Config 构建预测执行器 Predictor# 参数: config - 用于构建 Predictor 的配置信息# 返回: Predictor - 预测执行器paddle.inference.create_predictor(config: Config)加载预测模型 - 非Combined模型import paddle.inference as paddle_infer# 创建 confi

2021-06-05 22:40:46 7548 3

原创 Paddle模型的保存与加载以及转化ONNX

1、Paddle模型字典形式存储paddle保存模型参数是parambase格式，paddle.save对要保存的字典对象的值会进行解码，对于parambase格式会进行转换。如果我们保存的格式是{‘model’: model.state_dict()}，字典的值是字典（相当于2级字典），该2级字典的值是模型参数（parambase格式），但是paddle.save只对字典的值进行解码，对于该2级字典的值不会进行解译，因此需要手动修改。def model_rebuild(model_state_dict

2021-06-02 21:11:57 5000 1

空空如也

空空如也