- 博客(133)
- 资源 (1)
- 收藏
- 关注
原创 精确的目标检测中定位置信度的获取
Borui Jiang∗1,3, Ruixuan Luo∗1,3, Jiayuan Mao∗2,4,Tete Xiao1,3, and Yuning Jiang41School of Electronics Engineering and Computer Science, Peking University2ITCS, Institute for Interdisciplinary Inf...
2019-11-29 12:34:31 12138
原创 距离IoU损失:包围盒回归更快更好的学习(Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression)
Distance-IoU Loss: Faster and Better Learning for Bounding Box RegressionZhaohui Zheng1, Ping Wang1, Wei Liu2, Jinze Li3, Rongguang Y e1, Dongwei Ren*21School of Mathematics, Tianjin University, Ch...
2019-11-28 22:39:29 6279 12
原创 anchor free yolov1
1.YOLO的核心思想 YOLO的核心思想就是利用整张图作为网络的输入,直接在输出层回归bounding box的位置和bounding box所属的类别。 没记错的话faster RCNN中也直接用整张图作为输入,但是faster-RCNN整体还是采用了RCNN那种 proposal+classifier的思想,只不过是将提取proposal的步骤放在CNN中实现了。 ...
2019-10-10 21:54:42 386
翻译 Bag of Tricks for Image Classification with Convolutional Neural Networks(卷积神经网络在图像分类中的技巧)
来源:Tong He Zhi Zhang Hang Zhang Zhongyue Zhang Junyuan Xie Mu LAmazon Web Servicesfhtong,zhiz,hzaws,zhongyue,junyuanx,mlig@amazon.com论文链接:https://arxiv.org/pdf/1812.01187.pdf摘要最近在图像分类研究方面取得的许多...
2019-03-21 12:09:30 806
翻译 tensorflow一层神经网络训练手写体数字识别
# coding:utf-8# 导入tensorflow深度学习库和手写体数据集import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data# 定义好网络的训练迭代次数、学习率、droupmax_steps = 50000learning_rate = 0.001dropout =...
2018-04-28 22:31:58 254
原创 End-to-End Object Detection with Transformers(DETR)
3. **自定义查询(Learnable Queries)**:DETR使用一系列可学习的查询向量来表示目标的位置和类别,这些查询在解码器中与编码器的输出进行注意力交互,以产生最终的检测结果。5. **位置和边界框预测**:解码器的输出还包括用于预测目标边界框的信息。7. **可变形注意力(Deformable Attention)**:在一些变体中,如Deformable DETR,引入了可变形注意力模块,它结合了稀疏空间采样和Transformer的关系建模能力,进一步提高了模型对目标定位的准确性。
2024-02-03 11:58:22 748
原创 YOLOX:2021年超越YOLO系列
在本报告中,我们对YOLO系列进行了一些有经验的改进,形成了一种新的高性能探测器-YOLOX。我们将YOLO探测器切换到无锚点的方式,并采用了其他先进的检测技术,即解耦头部和领先的标签分配策略Simota,以在大范围的模型上实现最先进的结果:对于仅有0.91M参数和1.08G Flop的YOLONano,我们在COCO上获得了25.3%的AP,比NanoDet高出1.8%AP;对于行业中使用最广泛的检测器之一YOLOv3,我们在COCO上将其提升到47.3%AP,超过当前最佳实践3.0%AP;
2023-08-09 22:23:47 461
原创 RetinaFace: Single-stage Dense Face Localisation in the Wild
尽管在不受控制的人脸检测方面已经取得了巨大的进步,但在野外准确高效的人脸定位仍然是一个公开的挑战。本文提出了一种鲁棒的单阶段人脸检测器,名为RetinaFace,它利用联合超监督和自我监督多任务学习的优势,对不同尺度的人脸进行像素级的人脸定位。............
2022-07-31 23:00:03 1188
原创 国内生产总值(GDP)数据可视化
数据来源:数据详情_ 数据_中国政府网import pandas as pddata = pd.read_excel('GDP.xls')序号 统计时间 国内生产总值(亿元) 国内生产总值季度累计同比增长(%) 第一产业增加值(亿元) 第一产业增加值季度累计同比增长(%) 第二产业增加值(亿元) 第二产业增加值季度累计同比增长(%) 第三产业增加值(亿元) 第三产业增加值季度累计同比增长(%)0 1 2017第1-2季度 383818.0 7.0 20850....
2022-04-01 00:59:55 4042 2
原创 SSD: Single Shot MultiBox Detector
Wei Liu1 , Dragomir Anguelov2 , Dumitru Erhan3 , Christian Szegedy3 , Scott Reed4 , Cheng-Yang Fu1 , Alexander C. Berg1 1UNC Chapel Hill 2Zoox Inc. 3Google Inc. 4University of Michigan, Ann-Arbor 1wli...
2021-12-01 23:48:29 582
原创 Scale Match for Tiny Person Detection
Xuehui Y u Y uqi Gong Nan Jiang Qixiang Ye Zhenjun Han∗University of Chinese Academy of Sciences, Beijing, China{yuxuehui17,gongyuqi18,jiangnan18}@mails.ucas.ac.cn {qxye,hanzhj}@ucas.ac.cn随着深卷...
2021-12-01 23:45:24 292
原创 暑期准备编写python编程类的文章、基础深度学习理论7月20~8月20
1、需要先完成几本python的阅读2、编写教案做PPT3、编写代码并上传到GitHub4、相关论文的阅读
2021-06-24 19:31:25 140
原创 tensorflow2.X实战系列softmax函数
softmax 原理斯坦福大学CS224n课程中softmax的解释:代码知识点1、NumPy数组是一个多维数组对象,称为ndarray。数组的下标从0开始,同一个NumPy数组中所有元素的类型必须是相同的。2、数组数组(Array)是有序的元素序列。若将有限个类型相同的变量的集合命名,那么这个名称为数组名。组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量。用于区分数组的各个元素的数字编号称为下标。数组是在程序设计中,为了处理方便, 把具有相同类型..
2021-04-20 00:43:07 545
原创 深度学习卷积神经网络论文研读-AlexNet
AlexNet模型来源于论文-ImageNet Classification with Deep Convolutional Neural Networks,作者Alex Krizhevsky,Ilya Sutskever,Geoffrey E.Hinton. 摘要 我们训练了一个大型的深度卷积神经网络,将ImageNet LSVRC-2010比赛中的120万幅...
2021-04-05 22:53:51 2063 1
原创 检测器:用递归特征金字塔和可切换的阿托洛斯卷积检测物体
Abstract许多现代的目标探测器都采用了“三思”机制,表现出了优异的性能。本文将此机制应用于目标检测的主干设计中。在宏层次上,我们提出了递归特征金字塔,它将来自特征金字塔网络的额外反馈连接合并到自下而上的主干层中。在微观层面上,我们提出了可切换的阿托拉斯卷积,该卷积以不同的阿托拉斯速率卷积特征,并使用开关函数收集结果。将它们结合在一起形成检测器,大大提高了目标检测的性能。在COCO测试开发平台上,检测器实现了目标检测54.7%的box-AP状态,实例分割47.1%的mask-AP状态,全景分割49.
2020-06-05 11:43:28 1526 1
原创 Squeeze-and-Excitation Networks(挤压和激励网络)
Squeeze-and-Excitation Networksie Hu[0000−0002−5150−1003]Li Shen[0000−0002−2283−4976]Samuel Albanie[0000−0001−9736−5134]Gang Sun[0000−0001−6913−6799]Enhua Wu[0000−0002−2174−1428]Abstract 卷积神经网络(CNNs)的核心构造块是卷积算子,它使网络能够通过融合各层局部感受野中的空间和信道信息来构造信息特征。.
2020-05-31 19:04:48 9424 2
原创 轻量级人脸检测算法实现专题之LFFD:A Light and Fast Face Detector for Edge Devices
LFFD:A Light and Fast Face Detector for Edge DevicesGithub star:919参数量:6.1 M一筐款通吃大小目标、支持各种设备的人脸检测器paper:https://arxiv.org/abs/1904.10633Github:https://github.com/YonghaoHe/A-Light-and-Fast-F...
2020-04-29 23:54:02 1917
原创 Focal Loss for Dense Object Detection(密集目标检测中的焦距损失)
Focal Loss for Dense Object Detection原文链接:https://arxiv.org/pdf/1708.02002.pdf作者信息: Tsung-Yi Lin Priya Goyal Ross Girshick Kaiming He Piotr Dollár ...
2020-03-02 18:29:43 2323
原创 深度学习网络结构设计:ASFF- 自适应空间特征融合
ASFF它学习了空间过滤冲突信息以抑制不一致性的方法,从而提高了特征的尺度不变性,并引入了几乎免费的推理开销。详细原理和工程代码可参考另外一篇博文:https://blog.csdn.net/TJMtaotao/article/details/103216377代码如下:import torchimport torch.nn as nnimport torch.nn.funct...
2020-02-24 11:18:44 11430 1
原创 深度学习卷积神经网络重要结构之通道注意力和空间注意力模块
提出CBAM的作者主要对分类网络和目标检测网络进行了实验,证明了CBAM模块确实是有效的。以ResNet为例,论文中提供了改造的示意图,如下图所示:在ResNet中的每个block中添加了CBAM模块,训练数据来自benchmark ImageNet-1K。检测使用的是Faster R-CNN, Backbone选择的ResNet34,ResNet50, W...
2020-02-24 00:47:06 16589 10
原创 RetinaFace: Single-stage Dense Face Localisation in the Wild
Abstract尽管在不受控制的人脸检测方面已经取得了巨大的进步,但准确有效的野外人脸定位仍然是一个公开的挑战。提出了一种鲁棒的单级人脸检测算法RetinaFace,该算法利用多任务联合额外监督学习和自监督学习的优点,对不同尺度的人脸进行像素级定位。具体来说,我们在以下五个方面做出了贡献:(1)我们在更宽的人脸数据集上手动标注了五个面部标志点,并在这个额外的监督信号的帮助下观察到硬脸检测的显著...
2020-02-23 12:15:42 876
原创 python keras SSD实战
参考博文:https://blog.csdn.net/weixin_44791964/article/details/104107271参考代码:https://github.com/bubbliiiing/ssd-keras原理理解step1 网络结构部分
2020-02-22 17:29:22 659
转载 两阶段目标检测原理详细版
原文链接:http://www.telesens.co/2018/03/11/object-detection-and-classification-using-r-cnns/Object Detection and Classification using R-CNNs源码链接:https://github.com/ruotianluo/pytorch-faster-rcnnSect...
2020-01-10 17:40:49 3133
原创 LFFD:一种用于边缘检测的轻量化快速人脸检测器
LFFD: A Light and Fast Face Detector for Edge Devices原文地址:https://arxiv.org/pdf/1904.10633.pdfY onghao He∗1,2, Dezhong Xu∗1, Lifang Wu1, Meng Jian1, Shiming Xiang2, and Chunhong Pan21Faculty of I...
2020-01-09 17:33:26 1832
原创 Detecting and counting tiny faces
Alexandre AttiaENS Paris-Saclayalexandre.attia@ens-paris-saclay.frSharone DayanENS Paris-Saclaysharone.dayan@ens-paris-saclay.fr原文链接:https://arxiv.org/pdf/1801.06504v2.pdfAbstract在CVPR 2017...
2020-01-09 16:52:52 514
原创 基于区域注意的通用目标检测
Towards Universal Object Detection by Domain AttentionXudong Wang1, Zhaowei Cai1, Dashan Gao2and Nuno V asconcelos11University of California, San Diego,212 Sigma...
2020-01-03 23:19:22 722
原创 YOLO Nano:一种高度紧凑的只看一次的卷积神经网络用于目标检测
Alexander Wong1,2, Mahmoud Famuori1,2, Mohammad Javad Shafiee1,2Francis Li2, Brendan Chwyl2, and Jonathan Chung21Waterloo Artificial Intelligence Institute, University of Waterloo, Waterloo, ON, Can...
2020-01-01 12:29:07 2717
原创 AugFPN:改进多尺度特征学习用于目标检测
Chaoxu Guo1, Bin Fan1, Qian Zhang2, Shiming Xiang1, and Chunhong Pan11NLPR,CASIA2Horizon Robotics1{chaoxu.guo, bfan, smxiang, chpan}@nlpr.ia.ac.cn2qian01.zhang@horizon.ai本文工作是基于Faster R-CNN 的改进,...
2019-12-31 18:22:02 9353 1
原创 SSD改进CFENet
https://arxiv.org/abs/1806.09790v1图3。CFENet的体系结构及其新模块CFE。(a) 输入尺寸为300×300的CFENet的拓扑结构。(b) CFE模块的层设置,每个框代表一个conv+bn+relu组。如图3.a所示,CFENet将四个综合特征增强(CFE)模块和两个特征融合块(FFB)组装到原始SSD中。这些附加模块很简单,可以很容易地组装成...
2019-12-31 17:04:41 741
原创 YOLACT实时实例分割
Abstract我们提出了一个简单的、完全卷积的实时实例分割模型,在MS-COCO上达到29.8map,在单个Titan Xp上以33.5fps的速度进行评估,这比以往任何竞争方法都要快得多。而且,我们只在一个GPU上训练就得到了这个结果。我们通过将实例分割分成两个子任务来实现这一点:(1)生成一组原型掩码;(2)预测每个实例的掩码系数。然后,我们通过将原型与掩码系数结合起来,生成实例mask...
2019-12-30 17:22:06 3693
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人