自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

雄关漫道真如铁 而今迈步从头越

才疏学浅,用心写每一篇文章、

  • 博客(89)
  • 资源 (1)
  • 收藏
  • 关注

原创 极其巧妙的并查集

《极其巧妙的并查集》  发明并查集的人获得了图灵奖,也用并查集告诉了世人大道至简的真理。并查集的思路和代码极其简洁明了,但是却能让复杂的问题束手就擒。直观来说,并查集解决的问题是组团和配对的问题,判断两个个体是否在一个集合中(find),合并两个个体到一个集合(unite),以及并查集中有多少集合(count),解决的问题也相对比较固定,朋友圈,以图判树,岛屿个数…Key Words:并查集、组团、配对 Beijing, 2020作者:RaySue Agile Pioneer  .

2020-12-11 20:53:15 4919

原创 vulkan 利用GPU加速ENet

《vulkan 利用GPU加速ENet》  Vulkan是一个跨平台的2D和3D绘图应用程序接口是做高性能图像渲染的,可以使用GPU对图像渲染进行性能优化,ncnn提供了使用vulkan的接口,可以vulkan来使用GPU对模型推理进行加速。具体做法是使用caffe训练ENet模型,然后转为ncnn,caffe 代码地址:https://github.com/TimoSaemann/ENetKey Words:ncnn、vulkan、加速ENet Beijing, 2020作者:RayS.

2020-11-25 18:25:58 5638 4

原创 简记字典树Trie

《简记字典树Trie》  Trie也称字典树、单词查找树或键树,是一种树形结构。典型的应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。其优点是最大限度的减少无谓的字符串比较,查询效率比哈希表高。Key Words:字典树、构建字典树、字典树的应用 Beijing, 2020作者:RaySue Agile Pioneer  文章目录树的回顾字典树(Trie)Trie的基本性质Trie的核心思想Trie基本的功能插入字符串 (inser.

2020-11-24 21:36:35 4479

原创 Objects as Points 论文总结

《Objects as Points 论文总结》  我逐字翻译了CenterNet 之 Objects as points的论文,这里主要整理CenterNet中提到的知识点,以及写下自己的感悟和看法,主要从主干网络、监督方式以及我目前对anchor free的理解。方便后续对CenterNet的复习。Key Words:Bottom-up、监督方式、Anchor free、推理增强 CVPR, 2019 Agile Pioneer  文章目录Bottom-up监督方式目标检测姿态.

2020-11-20 21:46:34 4376

原创 孤读Paper——《FCOS: Fully Convolutional One-Stage Object Detection》

《FCOS: Fully Convolutional One-Stage Object Detection》  简单、鲁棒的Anchor free目标检测算法,核心思想 是利用FCNs-based的方式来做目标检测,对featureMap上的结果进行逐像素的预测回归,通过multi-level FPN的不同层选取预测不同尺度的目标解决重叠部分预测模糊的问题,对于低质量的目标框提出了center-ness分支来预测像素到相应目标框中心的得分并与分类的得分相乘得到最终的得分用于NMS,预测head的三个分.

2020-11-19 21:53:36 2638

原创 孤读Paper——《CenterNet:Objects as Points》

点即是目标  建模对象为单个的点——即目标框的中心点。我们的检测器使用关键点估计来找到中心点并且回归出全部其他的目标属性,比如大小,3D位置,方向甚至姿势。我们基于中心点的方法称为CenterNet,是一个端到端可微的检测方法,比起基于目标框的检测器更简单,更快而且更准确。尤其是姿势估计部分的关键点分组,比起openpose的复杂的后处理,该论文的方法更巧妙,通过对各个关键点直接回归,然后通过回归的结果对应去找自下而上得到的关键点结果,进行单个实例的关键点分组…Key Words:KeyPoin.

2020-11-18 14:57:15 3607

原创 Seq2Seq中的Attention

《Seq2Seq中的Attention》  Sequence to Sequence的结构在整个深度学习的进程中占有重要的角色,我在2017年做OCR的时候用这个,当时语音组做语音识别的同事也是用这个,而nlp组的做机器翻译的同事更是利用这个取得了不错的效果,尤其是Attention的引入让Sequence to Sequence的表现更加惊艳,所以这一经典的结构是值得被反复揣摩的,在此记录一下我对Seq2Seq的理解尤其是其中Attention机制,本文会把关于其中Attention运算的所有细节说.

2020-11-10 12:09:07 2776

原创 理解知识蒸馏

《理解知识蒸馏》  本文是对知识蒸馏方法在分类场景的应用来讨论的。知识蒸馏是一种从复杂模型向简单模型迁移知识的方法,我觉得和Label smooth有相似的地方,就是soft-labels,soft-labels有正则的功能,而且具有容错性。但是显然知识蒸馏得到的soft-labels会包含更多的所谓dark knowledge,能够让模型get到更多的信息。Key Words:Label smooth、dark knowledge、knowledge distillation Beijin.

2020-07-16 14:17:51 4145 2

原创 NNIE-lite 为算法工程师而生

《NNIE-lite》  趟过NNIE的小伙伴可能都知道,NNIE是有很多坑的,而且是纯C的环境,除非你有几年C的开发经验,否则阅读起来不是那么容易的,而作为算法工程师,我相信更多人和我一样擅长Python和C++,所以在把NNIE用起来还是有些费力的。而作为算法工程师,你的工作更应该 focus on 模型上,现在有了NNIE-lite这个项目,极大的帮助大家脱离苦海,算法工程师可以把目光聚焦在模型效果和效率上,而不用再为其他的琐事担心了,使用NNIE像用ncnn一样简单。Key Words:N.

2020-07-03 11:51:06 6248

原创 孤读Paper——《Deep Snake for Real-Time Instance Segmentation》

《Deep Snake for Real-Time Instance Segmentation》  论文借鉴了snake算法,将snake算法做成了轮廓结构化特征学习的方法。DeepSnake是基于轮廓的两阶段实例分割的方法,是接在目标检测后面的方法。通过目标检测的定位来初始化建议轮廓,然后对建议轮廓进行变形,是其对目标更加贴合。论文使用了循环卷积取得了比通用的图卷积能更好的挖掘轮廓的周期图结构。Key Words:Snake、Two-stage、Instance segmentation、 Ci.

2020-07-01 17:31:58 2772

原创 孤读Paper——《ATSS:Adaptive Training Sample Selection》

《ATSS:Adaptive Training Sample Selection》  此论文一出感觉是在告诉像我们这样的小朋友根本没有深入理解目标检测。论文醍醐灌顶的指出了影响Anchor-based和Anchor-free效果的关键在于正负训练样本的定义。论文提出的自适应的训练样本选择方法能够缩小Anchor-based和Anchor-free效果的差异。而在每个位置铺设多个类型的anch...

2020-04-15 15:32:38 2868

原创 孤读paper——《GhostNet:More Features from Cheap Operations》

《GhostNet:More Features from Cheap Operations》  发现一个点并解决就是一篇CVPR,该文章主要发现了优秀的网络的特点是feature map提取过程中的冗余性,这种冗余性体现在很多成对的feature map间很像,就好像彼此的“ghost”,而这种特征冗余性对于理解图像来说还是必要的,所以文章把feature map分为两种,一种是本质特征,一...

2020-04-05 18:37:13 4870

原创 安装 torch_geometric

找到对应的 pytorch 版本,点进去,下载相应的 whl 文件进行下载。这两个依赖和 pytorch 版本强绑定,所以需要访问。安装 torch_geometric 需要相应的依赖。

2023-09-06 18:18:11 315

原创 ERROR: Failed building wheel for PyECLib

LLM环境搭建

2023-08-30 10:32:55 481

原创 python画直方图,刻画数据分布

Python画直方图,画数据分布图

2023-03-02 11:19:37 1443 1

原创 [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed

Python 从 2.7.9版本开始,就默认开启了服务器证书验证功能,如果证书校验不通过,则拒绝后续操作;如果是自签名证书,由于一般系统的CA证书中不存在在自签名的CA证书内容,从而导致证书验证不通过。[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:727),报错问题就是证书验证失败,这种情况出现在网站使用的是自签名证书或系统根证书存在问题的时候。创建取消服务器证书验证的context参数(当前请求代码影响)

2022-11-23 21:25:44 6719

原创 偏序:正逆序比

同一个集合( query相同 ) 的两个样本,在特征(模型计算所得)上的大小关系与在 label 上的大小关系相反,称为逆序,那么,同一个集合内的逆序对数目为逆序对数。同一个集合( query相同 ) 的两个样本,在特征(模型计算所得)上的大小关系与在 label 上的大小关系相同,称为正序,那么,同一个集合内的正序对数目为正序对数。正序对数 / 逆序对数,在排序问题中,正逆序比是衡量一个特征区分度的重要指标,一个特征的正逆序值越大,它的效果越理想。第四行向上数,1个正序对,2个逆序对。

2022-11-07 11:42:24 946 3

原创 pycuda._driver.LogicError: cuMemcpyHtoDAsync failed: invalid argument

pycuda._driver.LogicError: cuMemcpyHtoDAsync failed: invalid argument

2022-07-18 09:52:46 940

原创 ResNet50 转 TRT

torch2trt

2022-07-09 12:16:22 626

原创 document image inpaint

document image inpaint

2022-07-06 09:43:57 78

原创 Your vimrc

vimrc 配置

2022-06-27 15:43:20 83

原创 Retrieval task calculate Recall@k

《检索Recall@k的计算脚本》  检索任务的评估指标是召回率,我们不光要看Recall@1也要看下Recall@3及Recall@10等,看下排序有多少空间,记录一下训练过程中对positive pair 计算 Recall的脚本;基于numpy我们默认 query 和 doc 是一一匹配的 positive pairquery shape -> (n, c)doc shape -> (n, c)query.dot(doc.T) shape -> (n, n)内积计.

2022-05-07 21:55:13 758

原创 Mac push code to github

配置SSH进行免密码安全连接githubgit clone [email protected]:RaySue/HttpServer.git再 add、commit、push参考https://blog.csdn.net/phunxm/article/details/45083335https://blog.csdn.net/weixin_43624626/article/details/123257465

2022-05-06 12:00:16 245

原创 简记DBNet

《简记DBNet》  文本检测常用的模型,如果要检测多个类别,多加 DBHead 是一种方式,而且dbnet 的一个弊端就是有重叠的文本框目标无法区分。Key Words:dbnet Beijing, 2022DBNet 网络结构backbone: Resnet18neck:FPNhead:DBHeadfm 经过各种卷积上采样4倍得到 prob_mask 利用 bce loss训练fm 经过另外各种卷积上采样4倍得到 threshold_mask 利用 L1 训练sig.

2022-05-02 19:51:08 460

原创 ICDAR2013&2015数据解析

《ICDAR2013&2015数据解析》  文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)ICDAR数据集是OCR流程常用的benchmark,包含文字目标检测的标注及OCR识别的标注结果,2013和2015的区别是2013给出的目标检测gt是水平框,而2015给出的是四边形(8个值)对歪斜的文本更为有效。本文给出解析数据的脚本,包括将目标框画到原图的功能和切出子图的功能。K.

2022-04-30 20:11:01 2392 2

原创 Python BFS 提取二值图联通域

《Python BFS 提取二值图联通域》   2016年实习那会儿在京东搞身份证 OCR,那时候的OCR是基于 CNN 的单字识别,所以就需要一些方法来对字符进行切割,那时候就利用 DFS 或 BFS 进行连通域的寻找,想不到今年了项目中有个合成数据的任务也用到了,利用 Python 的 BFS 进行连通域的寻找,简单做个记录吧 Key Words:图像连通域、BFS Beijing, 2022作者:mxsurui Agile Pioneer  # coding: utf-8.

2022-01-07 21:00:13 900

原创 RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one.

RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one. This error indicates that your module has parameters that were not used in producing loss. You can enable unused parameter detection

2021-12-31 17:20:29 4525 3

原创 目标检测标注格式转换:labelme2yolo & yolo2labelme

# coding:utf-8import osimport cv2import jsonimport matplotlib.pyplot as plt"""1. One row per object2. Each row is class x_center y_center width height format.3. Box coordinates must be in normalized xywh format (from 0 - 1). If your boxes are in

2021-11-15 11:54:46 4771 4

原创 Mac M1 环境下CV标注工具建设

《Mac M1 环境下CV标注工具建设》   M1 下载环境的时候会遇到很多问题,本以为下载这两个标注工具会很费事,没想到出乎意料的顺利,简单记录一下 Mac M1 下安装 CV 的标注工具,及其用法。Key Words:labelme、PixelAnnotation、Apple M1 Beijing, 2021作者:mxsurui Agile Pioneer  系统环境如下labelme注意,直接使用 pip install labelme 在 Apple M1 .

2021-11-02 20:56:40 1001 5

原创 python读取超大csv

《python读取超大csv》  现在工作中遇到的数据动辄千万或上亿的数据,其中图像数据是以 oss 链接的形式放入到 csv 中,csv文件所占磁盘空间一般就会20G起,所以直接读入内存是不现实的,这里记录一种使用 pandas 读取超大 csv 文件的方法。Key Words:pandas、迭代器、超大csv Beijing, 2021作者:mxsurui Agile Pioneer  import pandas as pd预览 csv 内容# 导入部分数据进行测试.

2021-10-28 20:10:46 5702

原创 Python3下载图像小工具

《Python3下载图像小工具》  每次想下载图片的时候都需要到网上找相关的小段程序,奈何每次水军太多,甄别需要浪费时间,不如自己备份一个用起来方便。Key Words:python3、图像下载 Beijing, 2021作者:mxsurui Agile Pioneer  import urllib.request as urequestdef download_image(img_url, img_path): try: request = ure.

2021-10-27 19:43:14 71

原创 批量实现 cv2.cvtColor(images, cv2.COLOR_GRAY2RGB)

背景:我想在一批灰度图像上画彩色的框,那么首先需要对灰度图转为 RGB,但是 RGB 信息已经损失了,所以只能对通道复制 3 份,变成彩色的三通道,这里使用 OpenCV 的 cv2.cvtColor(images, cv2.COLOR_GRAY2RGB) 方法只能针对单张图片,所以本文给出能直接处理 batch 图像的 灰度转彩色# init dummy matmat = np.zeros((32,28,28))mat = np.expand_dims(mat, -1)np.tile(mat,.

2021-04-21 15:15:34 3686

原创 全民 Transformer (二): Transformer在深度学习和NLP中如何发挥作用

《How Transformers work in deep learning and NLP: an intuitive introduction》  2020年的确是 Transformer 年,从 NLP 进军到 CV。本文介绍一下 Transformer在 NLP 领域的应用。2017年的一篇非常有名的文章 “Attention is all you need”改变了我们对 Attention 的看法,有了充足的数据,矩阵乘法,线性层以及layer normalization 我们能够在机器翻.

2021-03-24 22:23:15 441

原创 全民 Transformer (一): Attention 在深度学习中是如何发挥作用的

《Attention 在深度学习中是如何发挥作用的:理解序列模型中的 Attention》   Transformer 的出现让 Deep Learning 出现了大一统的局面。Transformer 首先在 NLP 的机器翻译上大放异彩,Attention is all you need 论文是很值得研究的,随后 Bert、DETR 的出现,Transformer的身影无处不在,目前 vis-transformer 又开始名声大噪。而 Transformer 的基础就是 Attention,本文翻译.

2021-03-17 21:22:11 450

原创 解决目标检测中的小目标问题

小目标的定义数据维度OversamplingDataAugmentation特征提取维度特征融合RFBNet这篇是ECCV2018关于目标检测的文章,提出了RFB Net网络用于目标检测,可以在兼顾速度的同时达到良好的效果。该网络主要在SSD网络中引入Receptive Field Block (RFB) ,引入RFB的出发点通过模拟人类视觉的感受野加强网络的特征提取能力,在结构上RFB借鉴了Inception的思想,主要是在Inception的基础上加入了dilated卷积层(dil

2021-02-25 15:11:57 6575

原创 conda用法笔记

《conda用法笔记》  Conda is an open source package management system and environment management system that runs on Windows, macOS and Linux. 方便环境管理的软件,对python环境支持很好,也可以安装编译好的C++的库…Key Words:conda环境管理、pip环境管理 Agile Pioneer  文章目录安装conda查看conda的某个包下载指定包查.

2021-01-12 18:47:27 270

原创 简记docker用法

《简记docker用法》  2019年,第一次使用 docker 做算法的服务端部署工作,整体感觉很流畅,很方便,可以很快的进行多节点部署,不用担心环境问题。时间真快,转眼2021年了。工作再次涉及到 docker,这里简单记录一下 docker 的用法。整理笔记是个对自己和他人都有益的事情,我会一直坚持。时光是一指流沙,苍老是一段年华。时间抓不住,也留不下。记忆只是脑海中的片段,再怎么拼凑也不及一篇当时精心整理的博文,从此刻开始留下你的足迹吧,希望看到此文的小伙伴也能开始写博客,赠人玫瑰手有余香。.

2021-01-11 22:33:32 171

原创 PCA图像转正C++

《PCA图像转正C++》  去年写的博客,写到另一个号里面了,今天恰好一个同事问到了,想起来把这篇博客迁移过来,顺便完善一下。PCA的功能还是挺多的,最常用的就是降维,原理也比较简单,找到方差最大的方向。这里直接把工程中的两个脚本抽离出来,方便查阅,供大家参考。Key Words:主成分分析、C++实现 Beijing, 2021.01 作者:RaySue Agile Pioneer  文章目录PCA原理MaskRotation.hMaskRotation.cpp参考PCA原.

2021-01-07 20:40:53 157

原创 简记GAN网络的loss

《简记GAN loss的理解》  GAN 是一种思想,刚接触的时候极为震撼,后来通过GAN思想也做过模型的优化,写过一篇专利。最近在用 GAN 生成数据,顺手写一写对GAN loss的理解。Key Words:GAN、SegAN Beijing, 2021.01作者:RaySue Agile Pioneer  文章目录GAN loss通过代码理解 GANSegAN参考GAN lossGAN 网络一般形式的 loss 如下:min⁡Gmax⁡DEx∼Pdata[log(D.

2021-01-02 19:35:54 3552

原创 二分法之旋转有序数组

《二分法之旋转有序数组》   二分查找实际上就是根据有序得条件进行边界收缩从而到 O(logn) 复杂度的搜索算法。二分法说简单也并不简单,Knuth 大佬(KMP 算法发明者)说过:Although the basic idea of binary search is comparatively straightforward,the details can be surprisingly tricky…,思路很简单,但是细节是魔鬼。所以对于旋转数组搜索问题更能够体现你对二分法的魔鬼细节了解多少。.

2021-01-01 19:50:09 1762

html view xxx

html view xxx

2022-11-17

ocr xxxxxxx tokenizer xxxxxxxx vocab

ocr

2022-11-15

latex2unicode

latex2unicode

2022-11-15

MobileNetV3.zip

MobileNetV3.zip

2021-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除