abrams90-CSDN博客

原创 AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

Abstract当前Transformer结构已经变成了事实上标准自然语言处理任务，它在计算机视觉的应用还存在限制。在视觉中，注意力机制也用到了与卷积网络的结合，或者用来在保持整体结构不变的情况下替代特定组件。我们注意到这样的依赖性在CNN网络中并不是必须的，单纯对一系列图像块使用transformer也可以去的图像分类任务上很不错的成绩。当在大规模数据上进行预训练，迁移到多个中型或者小型是被benchmark（ImageNet，CIFAR-100，VTAB等）时，Vision Transformer（

2021-11-29 11:40:52 1229

原创 CSPNET: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN

Abstract 神经网络使得在像目标检测这样的计算机视觉任务中取得了SOTA的效果。然而，这巨大的成功十分依赖计算资源的消费，这阻碍了使用廉价芯片的用户使用先进的技术。本文我们提出了Cross Stage Partial Network（CSPNet），从网络结构的角度缓解之前的工作依赖大量前向计算的问题。我们将问题归结为网络优化过程中梯度重复的问题。我们提出的方法从网络从始至终的不同阶段通过考虑到梯度变化的特征图整合，在我们的实验中，模型在ImageNet数据集降低了20%的计算量，并...

2021-06-28 20:15:34 1027

原创 CutMix：Regularization Strategy to Train Strong Classifiers with Localizable Features

CutMix：Regularization Strategy toTrain Strong Classifierswith Localizable FeaturesAbstract区域dropout策略被提出来用于增强神经网络分类器的表现。他们可以引导模型更关注目标共性的部分（腿部而不是头部），使得网络有更好的通用性，有更好的目标定位能力。此外，当前区域dropout将训练样本上通过叠加黑色或者其他噪声块来移除有效信息像素。这种移除并不理想因为它会导致有效信息丢失导致训练效率降低。因此我们提出C..

2021-01-12 11:15:07 2095

原创 YOLOv4: Optimal Speed and Accuracy of Object Detection

Abstract有大量的特征认为会改进神经网络（CNN）的准确率。有一种需求是在大规模数据集上进行这些特征的组合验证，并且从理论角度评论结果。有些特征是在特定模型、有些为了解决特定问题，或者只是为了小规模数据集；同时有些特征，例如BN与残差链接模块，对于大多数模型、任务与数据集都有效。我们假设这些有效的特征包括带权重的残差连接（WRC）、跨阶段部分连接（CSP），跨最小Batch正则化（CmBN），自对抗训练（SAT）与Mish-activation。我们使用新的特征：WRC、CSP、CmBN、SAT.

2020-12-25 14:38:23 406 1

IBP算法（迭代反投影）

空空如也