狼刀流-CSDN博客

原创论文阅读【backbone】：Google 2019|MixConv: Mixed Depthwise Convolutional Kernels

文章目录前言一、Introduction总结前言论文地址：MixNet分层卷积算法在现代有效卷积算法中越来越受到重视，但其核大小却常常被忽视。在本文中，系统地研究了不同粒度的核的影响，并观察到结合多核的优点可以得到更高的准确率/效率。在此基础上，提出了一种新的混合深度卷积(mixconv) ，它自然地将多个核大小混合在一个卷积中。一、Introduction在本文中，重新回到这个基本问题: 较大的内核是否总能达到较高的精度? 自从在 alexnet中首次观察到，众所周知，每个卷积内核负责捕获一个

2022-01-07 14:15:19 1459

原创精确率(precision)、准确率(accuracy)和召回率（recall）

TP:正样本预测为正样本，对了,真正例FP: 负样本预测为正样本，错了，假正例FN: 正样本预测为负样本，错了，假负例TN：负样本预测为负样本，对了，真反例Accuracy，表示你有多少比例的样本预测对了，公式如下：...

2021-09-02 18:05:26 337

原创论文阅读【backbone】：CVPR2018|Deep Layer Aggregation

文章目录前言一、Introduction二、Deep Layer Aggregation总结论文地址：Deep Layer Aggregation前言视觉识别需要丰富的表示，跨度从低到高的水平，从小到大小的尺度，并且从良好到粗糙的分辨率。即使在卷积网络中的特征深度，孤立的层也不够：复合和聚合这些epresentations 改善了网络在推断what和where。网络结构正在努力探索网络骨干网的许多维度，设计更深层次或更广泛的架构，但如何在网络中最佳的聚合层和块值得进一步关注。虽然跳跃连接已被合并为组

2021-08-25 20:44:52 315

原创 IOU计算

def box_iou(boxes1, boxes2): area1 = (boxes1[:, 2] - boxes1[:, 0]) * (boxes1[:, 3] - boxes1[:, 1]) area2 = (boxes2[:, 2] - boxes2[:, 0]) * (boxes2[:, 3] - boxes2[:, 1]) lt = torch.max(boxes1[:, None, :2], boxes2[:, :2]) # left-top [N,M,2] r

2021-08-18 00:58:06 230

原创 Python 数字随机采样

a = [[1],[2],[3],[4],[5],[6],[7],[8],[9],[10]]import randomrandom.seed(23)a = random.sample(a, 4)a[[7], [6], [1], [2]]

2021-08-09 17:06:22 196

原创论文阅读【域泛化】：ECCV2018|Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net

文章目录前言一、IntroductionContribution二、MethodResult总结链接：ECCV2018|Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net.前言与现有的设计CNN体系结构以提高单个域的单个任务的性能和不可推广性的工作不同，IBN网络，一种新颖的卷积体系结构，它显著增强了CNN在一个域上的建模能力以及在另一个域上的推广能力，而无需微调。IBN-Net小心翼翼地将Instanc

2021-07-31 16:33:51 795

转载转载系列：IOU Loss

原文链接：https://www.yuque.com/huoxiangshouxiangwanghuo/xg3nah/tyl1n2 IoU（Intersection over Union）在目标检测任务中，IoU是一个非常重要的概念，它反映了prediction box和ground truth box的贴合程度。在用训练好的模型进行测试时，网络会预测出一系列的prediction box，这时候我们会用NMS来移除一些多余的候box，即移除一些IoU值大于某个阈值的box，然后在剩下的box中，分别

2021-07-30 17:29:20 304

原创 python 字典排序

tmp = {"f":6,"b":2,"c":3,"g":8,"d":4,"a":1,"e":5}a = sorted(tmp.items(),key=lambda item:item[0])#key 控制按key 还是value排序print(tmp.items())print(a)dict_items([('f', 6), ('b', 2), ('c', 3), ('g', 8), ('d', 4), ('a', 1), ('e', 5)])[('a', 1), ('b', 2), ('c'

2021-07-30 16:33:10 110

原创论文阅读【轻量化网络】| ICCV2021:Bias Loss for Mobile Neural Networks

文章目录前言一、Introduction二、Objective Functions2.1.Bias Loss三、SkipNet Mobile Architectures四、Experiments总结论文链接：https://arxiv.org/abs/2107.11170.前言大型CNN和轻量型CNN在特征多样性上的差异很少被研究。具有低特征多样性的数据点可能无法提供足够数量的唯一描述符来进行有效预测；我们称之为随机预测。随机预测会对优化过程产生负面影响，并损害最终性能。本文建议通过重塑标准交叉熵来

2021-07-29 16:29:23 1848 2

原创 python 随机获取字典元素

import randoma = {1:"a",2:"b",3:"c",4:"d",5:"e",6:"f"}b = random.sample(lista.keys(), 5) # 随机一个字典中的key，第二个参数为限制个数print(a)print(b)无放回sample，第二个参数大于dict的len会报错。{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f'}[4, 6, 1, 5, 2]...

2021-07-26 16:46:31 6162 2

原创 Python 变量持久化

#单变量存储import picklea = [[1,2,3,4,5,6,7],[2,3,4,5,6,7,8]]f = open('test.pkl', 'wb')pickle.dump(a, f)f.close()#多变量保存a = [[1,2,3,4,5,6,7],[2,3,4,5,6,7,8]]b = ['aaaa','bbbb',"ccccc"]c = "megvii"d = "测试"f = open('test.pkl', 'wb')pickle.dump([a,b,

2021-07-21 20:01:30 585 1

原创论文阅读【检测】CVPR2020 | Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Trai

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Abstract一、Introduction二、使用步骤1.引入库2.读入数据总结欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与

2021-07-12 21:04:28 536

原创聊一聊CV中的局部连接与参数共享

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、局部连接是什么？二、参数共享是什么？三、为啥要进行这两个操作？四、为啥这两个操作可以work？五、一些额外的思考？前言无意间思考了一下这个问题。为啥局部连接和参数共享在CNN中可以work？一、局部连接是什么？不多废话，一张图清晰明了的解释了啥是局部连接二、参数共享是什么？上图中显然参数是不共享的。这张图也清晰的解释了啥是参数共享。三、为啥要进行这两个操作？两者的一个关键作用就是减少参数数量。四、为

2021-07-09 00:06:09 560

原创 numpy 获取最大值索引

直接上代码吧import numpy as npaa = [1,2,3,4,5]arr_aa = np.array(aa)maxindex = np.argmax(arr_aa)print(maxindex)大意了，面试问到这个问题居然没回到上来

2021-06-15 16:45:38 2693 1

原创论文阅读【人脸检测】| IJCB2017 ：FaceBoxes: A CPU Real-time Face Detector with High Accuracy

文章目录前言一、Introduction二、FaceBoxes1.快速消化卷积层(RDCL)2.多尺度卷积层(MSCL)3.Anchor densification strategy总结前言论文地址：https://arxiv.org/pdf/1708.05234.pdf.有效的人脸检测模型往往在计算上是令人望而却步的。为了在CPU上实现实时速度，同时保持高性能应对这一挑战，FaceBox，在速度和准确性方面都具有优越的性能。它由快速消化卷积层(RDCL)和多尺度卷积层(MSCL)组成。RDCL的设

2021-06-06 21:45:02 313 2

原创复制一个文件下的所有图片到另一个文件夹

import osori = "/home1/zy/dataset/cheshi"target = "/home1/zy/dataset/cheshi2/"def get_fileNames(rootdir,target): #如果有目标文件夹就不管，没有就自己创建 if not os.path.exists(target): os.makedirs(target) for root, dirs, files in os.walk(rootdir,topdown

2021-05-27 16:56:56 430

原创 python压缩图片

直接上代码了#coding = utf-8import cv2import osimport mathdef get_doc_size(path): try: size = os.path.getsize(path) return get_mb_size(size) except Exception as err: print(err)def get_mb_size(bytes): bytes = float(bytes

2021-05-25 17:49:21 225

原创对concat和add的一点想法

前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考总结提示：这里对文章进行总结：例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。...

2021-05-25 17:05:50 1967

转载转载系列 |ICCV2019:ACNet:Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution

论文：ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution Blocks 论文链接：https://arxiv.org/abs/1908.03930 代码链接：https://github.com/DingXiaoH/ACNetACNet，全称是Asymmetric Convolution Net，翻译过来就是非对称卷积网络。这篇论文也是从更好的特征表达角度切入实现效果提升，不过更重要的是

2021-05-18 16:31:13 326

转载转载系列【检测】| CVPR2018：Single-Shot Refinement Neural Network for Object Detection

论文：Single-Shot Refinement Neural Network for Object Detection 论文链接：https://arxiv.org/abs/1711.06897 代码链接：https://github.com/sfzhang15/RefineDet RefineDet是CVPR2018的论文，个人觉得是一篇很不错的文章，大致上是SSD算法和RPN网络、FPN算法的结合，可以在保持SSD高效的前提下提高检测效果（实验效果提升挺明显）。第一眼看到这篇文章就让我想起了R

2021-05-18 14:30:06 113

转载转载系列【检测】| CVPR2020:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Trai

目标检测论文阅读：Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection 论文链接：https://arxiv.org/abs/1912.02424 在https://www.zhih...

2021-05-18 11:16:25 173

转载转载系列【检测】：2019 | Learning Spatial Fusion for Single-Shot Object Detection

本篇文章最大的创新点是提出了一种新的特征融合的方式ASFF，通过学习权重参数的方式将不同层的特征融合到一起，作者证明了这样的方法要优于通过concatenation或者element-wise的方式。代码：https://github.com/ruinmessi/ASFF 一个更强的YOLOv3 baseline 其实整篇文章能取得如此优秀的效果并不仅仅在于加入了ASFF这种自适应特征融合方式，作者在Y...

2021-05-13 10:55:50 165

转载转载系列【检测】：CVPR2020 | DR Loss: Improving Object Detection by Distributional Ranking

文章目录简介0. Abstract1. Introduction2. Related Work3. DR Loss3.1 Ranking3.2 Distributional Ranking3.3 Recover Classification from Ranking 4.Experiments4.1 Parameters...

2021-05-13 09:44:24 223

转载 pytorch训练Class-Balanced Loss

1.提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录1.pytorch版Class-Balanced Loss训练模型一、数据准备二、模型训练三、模型预测总结pytorch版Class-Balanced Loss训练模型论文地址：https://arxiv.org/pdf/1901.05555.pdf一、数据准备将自己的数据集按照一下格式进行准备执行以下代码进行数据集划分执行以下代码进行数据集划分def split_dataset(dataset, split

2021-05-12 11:21:23 1867 2

原创阿里笔试：python随机shuffle数组

项目场景：给定一个数组，将其进行随机shuffle算法实现import randomdef shuffel(x): for i in reversed(range(1, len(x))): p = int(random.random() * i) x[i], x[p] = x[p], x[i] print("i:",i," p:",p) print(x) return xshuffel([1, 2, 2, 3,

2021-05-11 10:08:00 296

原创论文阅读【检测】AAAI2019 | M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Introduction二、Proposed Method特征融合模块FFM细化U型模块TUM尺度特征聚合模块SFAM总结前言现在性能较好的一阶段物体探测器（如DSSD，RetinaNet，RefineDet）和两阶段物体探测器（如Mask RCNN，DetNet）都广泛使用了特征金字塔，从而缓解对象实例的比例大小变化带来的差异问题。尽管这些具有特征金字塔的物体探测器获得了不错的结果，但它们也有一定的局限性：它们只是简

2021-05-10 19:36:32 214

原创论文阅读【检测】：ICCV2019 | Enriched Feature Guided Refinement Network for Object Detection

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Introduction二、Method特征丰富方案级联优（细）化方案总结前言提出了一种单级检测框架，共同解决了多尺度目标检测和类不平衡问题。引入了一种简单而有效的特征丰富方案来产生多尺度的上下文特征，而不是设计更深层次的网络。为了增强单级检测器对多尺度检测的区分能力，进一步提出了一种级联求精方案，该方案首先在单级检测器的预测层中引入多尺度上下文特征。其次，级联精化方案通过精化锚点和丰富特征来改善分类和回归，解决了类不

2021-05-10 14:27:30 197

原创图像域泛化总结

项目场景：近3个月的折磨终于差不多结题了。进行一个小总结。问题描述：域泛化问题感觉是一个工业上很常见的问题。比如说在医疗图像上，你的数据可能来自多家医院，多个扫描仪。或者说你的训练集是高清图像进行训练，实际的测试集却是较为模糊的图片。很多情况会导致训练域与实际的测试域不match的问题。原因分析：个人对于这个问题的定义是网络的鲁棒性和提高泛化能力。训练集的域与测试集的域的不匹配，不是完全的不匹配。而是两者的分布有一定的偏差，导师网络的泛化能力的降低。一个显而易见的方案就是通过数据增强的方法来进

2021-05-06 00:03:15 1818 3

转载 IoU loss 小总结

对于检测框B和groundtruth G，二者的IoU如下：那么IoU Loss即为1-IoU。显然IoU Loss具有非负性、尺度不变性、同一性、对称性、三角不等性等特点，所以可以用于bounding box的回归任务中。但同时，IoU Loss也存在一个很致命的缺点：当B与G的IoU为0时，Loss也为0，网络无法进行训练。因此IoU loss在回归任务中的表现并不好。 GIoU Loss 论文：https://arxiv.org/abs/1902.09630 GIoU

2021-05-04 15:01:19 2053 2

转载各种激活函数

激活函数可以分为两大类：饱和激活函数： sigmoid、 tanh非饱和激活函数: ReLU 、Leaky Relu 、ELU【指数线性单元】、PReLU【参数化的ReLU 】、RReLU【随机ReLU】相对于饱和激活函数，使用“非饱和激活函数”的优势在于两点： 1.首先，“非饱和激活函数”能解决深度神经网络【层数非常多！！】的“梯度消失”问题，浅层网络【三五层那种】才用sigmoid 作为激活函数。 ...

2021-05-03 00:48:01 17482

转载 pytorch网络结构可视化

一使用pytorchviz可视化安装依赖和pytorchviz pip install graphviz pip install tochviz （或pip install git+https://github.com/szagoruyko/pytorchviz） Graphviz 是 AT&T 开发的一款开源的图形可视化软件，可以根据dot脚本语言中绘制的无向图（显示了对象间最简单的关系）画出直观的树形...

2021-05-02 13:31:57 1410

原创从文件夹随机抽取文件到另外一个文件夹

##深度学习过程中，需要制作训练集和验证集、测试集。import os, random, shutildef moveFile(fileDir): pathDir = os.listdir(fileDir) #取图片的原始路径 filenumber=len(pathDir) rate=0.1 #自定义抽取图片的比例，比方说100张抽10张，那就是0.1 picknumber=int(filenumber*rate) #按照rat

2021-04-29 09:29:33 1286

原创 mmdetection中安装mmcv的一个小坑

一切安装正常，就是MMCV编译报错。官网的教程是没有问题的。要注意cuda版本的问题。我遇到的问题是nvcc -V中的cuda版本是9.0，nvidia-smi的cuda版本是10.2。MMCV编译的时候根据nvcc -V中的cuda版本来的。一般情况是没有这个问题，如果是在公用的服务器上有可能遇到。解决方法进入：/usr/local中查看cuda版本。发现有cuda-10.2和cuda-9.0。编译的时候使用的是cuda-9.0和你安装的MMCV版本不一致。vim ~.bashrcexp

2021-04-25 10:21:02 1600 2

转载转载系列【检测】：CVPR2016 | You Only Look Once: Unified, Real-Time Object Detection

参考： http://blog.csdn.net/u011534057/article/details/51244354 https://zhuanlan.zhihu.com/p/24916786 论文下载： http://arxiv.org/abs/1506.02640 darknet版的代码下载： https://github.com/pjreddie/darknet tensorflow版本的...

2021-04-23 00:36:30 254

转载转载系列【分割】：ECCV2020 | SOLO: Segmenting Objects by Locations

文章目录一、背景二、本文方法三、本文方法的具体做法3.1 问题定义3.1.1 Semantic category3.1.2 Instance Mask 3.2 Network Architecture3.3 SOLO learning3.3.1 Label Assignment3.3.2 Loss Function...

2021-04-22 16:39:33 280

原创论文阅读：CVPR2021 | Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

文章目录前言一、Introduction二、使用步骤1.引入库2.读入数据总结前言本文提出了一种新的视觉Transformer，称为Swin Transformer，它可以很好地作为计算机视觉的通用主干。将Transformer从语言转换为视觉的挑战来自这两个领域之间的差异，例如视觉实体的大小差异很大，图像中的像素与文本中的文字相比分辨率较高。为了解决这些差异，我们提出了一种分层转换器，其表示是通过移位窗口来计算的。移位窗口方案通过将自注意计算限制到非重叠的局部窗口，同时还允许跨窗口连接，带来了更高的

2021-04-21 17:21:16 2069 1

转载转载系列：注意力机制技术总结

前言：注意力机制在视觉上是非常重要的部分，这方面的综述、总结有很多。为了本文总结的全面性，我基本都看了一遍。然而这些综述要么面面俱到，对所有内容都非常详细地阐述，包括一些非常不常用的，过时的论文或结构；要么没分清重点，有些内容跟论文有关，但跟注意力无关，这些文章也把这些内容总结到里面。什么是注意力？就是只写有用的，只留下值得关注的部分。对于已经过时的结构或论文，不为了刻意做到“史上最全的....

2021-04-20 18:06:06 400

转载转载系列：池化技术总结

导言：池化是一个几乎所有做深度学习的人都了解的一个技术，大家对池化如何进行前向传播也都了解，池化的作用也了解一二。然而，池化如何回传梯度呢，池化回传梯度的原则是什么呢，最大池化与平均池化的区别是什么呢，什么时候选择最大池化、什么时候选择平均池化呢。主要用的池化操作有平均池化、最大池化、全局平均池化，全局自适应池化。此外还有很多，如Ro...

2021-04-20 18:01:35 377

转载转载：特征金字塔技术总结

前言：特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分，对于提高模型性能具有非常好的表现。不同大小的目标都经过了相同的降采样比例后会出现较大的语义代沟，最常见的表现就是小目标检测精度比较低。特征金字塔具有在不同尺度下有不同分辨率的特点，不同大小的目标都可以在相应的尺度下拥有合适的特征表示，通过融合多尺度信息，在不同尺度下对不同大小的目标进行预测，从而很好地提升了模型...

2021-04-20 17:58:04 606

原创 NMS小总结

文章目录前言一、标准 NMS二、Soft NMS三、DIoU NMS前言Non-Maximum Suppression（NMS）非极大值抑制，也有个别地方称之为非最大值抑制。个人认为前者更为贴切，因为其具体实现原理是找到所有局部最大值，并抑制非局部最大值，而不是找全局最大值。从字面意思理解，抑制那些非极大值的元素，保留极大值元素。其主要用于目标检测，目标跟踪，3D 重建，数据挖掘等。目前 NMS 常用的有标准 NMS, Soft NMS,DIOU_NMS 等。后续出现了新的 Softer NMS，

2021-04-20 16:15:49 390

空空如也

空空如也