3 圣托里尼的日落啊~

尚未进行身份认证

计算机视觉小菜鸡

等级
TA的排名 3w+

faster rcnn中anchor的生成过程理解

首先,根据给定的base_size,生成一个所谓的base_anchor,其值为[0,0,base_size-1,base_szie-1]。例如当base_size=16的时候就生成一个坐标为[0,0,15,15]的矩形。第二步根据上面的上面得到base_anchor进行坐标变换,计算出中心点xc,yc和矩形的高和宽w,h.即将我们说的xmin,ymin,xmax,ymax形式的坐标转化为w,h...

2020-03-22 16:15:00

检测评价函数 intersection-over-union(IoU)

1、概念在目标检测的评价体系中,有一个参数叫做 IoU ,简单来讲就是模型产生的目标窗口和原来标记窗口的交叠率。具体我们可以简单的理解为: 即检测结果(Detection Result)与 Ground Truth 的交集比上它们的并集,即为检测的准确率 IoU :IOU=DetectionResult⋂GroundTruthDetectionResult⋃GroundTruthIOU = \...

2020-03-22 09:14:38

pytorch scatter_

scatter() 和 scatter_() 的作用是一样的,只不过 scatter() 不会直接修改原来的 Tensor,而 scatter_() 会PyTorch 中,一般函数加下划线代表直接在原来的 Tensor 上修改scatter(dim, index, src) 的参数有 3 个dim:沿着哪个维度进行索引index:用来 scatter 的元素索引src:用来 scatt...

2020-03-18 16:59:22

pytorch 二分类交叉熵损失函数

import torchimport torch.nn.functional as Fpred = torch.tensor([[-0.4089,-1.2471,0.5907],[-0.4897,-0.8267,-0.7349],[0.5241,-0.1246,-0.4757]]).cuda()print(pred)'''tensor([[-0.4089, -1.2471, 0.59...

2020-03-18 15:54:29

VQA + 知识库

转载自:链接Learning Visual Knowledge Memory Networks for Visual Question AnsweringAbstract视觉问题回答(VQA)需要联合图像和自然语言问题,其中许多问题不能直接或清楚地从视觉内容中得到,而是需要从结构化人类知识推理并从视觉内容中得到证实。该论文提出了视觉知识记忆网络(VKMN)来解决这个问题,它将结构化的人类知...

2020-01-03 11:17:58

VQA + GNN

Graph-Structured Representations for Visual Question Answering(GraphVQA)Abstract通过structured representations of both scene contents and questions提升VQA性能。VQA的主要挑战在于对visual和text两个领域都需要理解。传统的模型中常常忽略场...

2019-12-30 11:58:13

Answer Them All! Toward Universal Visual Question Answering Models 通用VQA模型

Answer Them All! Toward Universal Visual Question Answering Models出自美国罗切斯特理工学院的Christopher Kanan组。文章目录AbstractIntroductionAbstractVQA的研究现状分两个阵营:专注于需要现实图像理解的VQA数据集;专注于检验推理能力的合成数据集。按理说,一个好的V...

2019-12-03 15:29:52

Mac搭建pytorch深度学习环境

1. 安装Anaconda前往官网:https://www.anaconda.com/下载Anaconda。选择合适的python版本安装,我这里选择python3.7的Anaconda。下载完成后双击安装包,按照流程安装。...

2019-11-28 19:55:18

attention机制在VQA中的应用

文章目录Question-guided image attentionSANs的模块架构1. Image Model2. Question Model3. the stacked attention model从数学的形式上看,attention机制只是简单地对输入项根据重要程度分配不同的加权参数,但这一机制模拟了人脑的认知模式,即根据实际需求而将有限的注意力聚焦于事物的关键部分,从而大大加强...

2019-11-28 09:39:30

学习的博客

csdn:1

2019-11-25 15:00:45

强化学习

state:环境的状态,并不是机器的状态,就是你的machine所看到的东西。就是Observation。Partial Observation State:state只能观察到一部分。因为state其实是环境的状态,所以机器有可能没有办法看到整个环境所有的状态。Machine会做一些事情,它做的事情就叫Action。它会跟环境产生一些互动,对环境造成一些影响。因为对环境造成的一些影响,它...

2019-11-13 15:24:12

AI术语

超参数:在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个...

2019-11-08 14:54:06

第六章 图像处理 6.1 线性滤波:方框滤波、均值滤波、高斯滤波

6.1 平滑处理平滑处理(smoothing)又称为模糊处理(bluring)。平滑处理的用途有很多,最常见的是用来减少图像上的噪点或失真。6.2 图像滤波与滤波器

2019-10-30 15:21:52

将Xcode中的hpp后缀修改为h

从终端进入编辑目录$cd /Applications/Xcode.app/Contents/Developer/Library/Xcode/Templates/File Templates/Source/C++ File.xctemplate/WithHeader/将___FILEBASENAME___.hpp 修改为 ___FILEBASENAME___.h编辑___FIL...

2019-10-21 14:51:28

第五章 core组件进阶-- 访问图像中的元素

文章目录5.1 访问图像中的元素5.1.1 图像在内存之中的存储方式5.1.2 颜色空间缩减5.1.3 LUT函数:Look up table操作5.1.4 计时函数5.1.5 访问图像中像素的三类方法一:指针访问:C操作符[]5.1 访问图像中的元素5.1.1 图像在内存之中的存储方式图像矩阵的大小取决于所用的颜色模型,即通道数。灰度图像 VS RGB颜色模型5.1.2 颜色空间缩...

2019-09-17 16:37:15

第六章 彩色图像处理

文章目录6.2 彩色模型6.2.1 RGB模型6.2.2 CMY模型6.2.3 HSI彩色模型从RGB到HSI的彩色转换6.3 伪彩色模型6.3.1 灰度分层6.3.2 灰度到彩色的变换6.4 全彩色图像处理基础6.2 彩色模型彩色模型(也称彩色空间或者彩色系统)的用途是在某些标准下用通常可接受的方式简化彩色规范。本质上,彩色模型是坐标系统和子空间的规范。位于系统中的每种颜色都由单个点来表示...

2019-09-16 19:21:38

图像复原--估计退化函数

在图像复原中,有3种主要的估计退化函数的方法。观察法试验法测试法使用以某种方式估计的退化函数复原一幅图像的过程有时称为盲目去卷积,因为真正的退化函数很少能完全知晓。一:图像观察估计法假设提供了一幅退化图像,而没有退化函数HHH的知识,那么估计该函数的一个方法就是收集图像自身的信息。例如,如果图像是模糊的,那么观察包含简单结构的一小部分图像,像某一物体和背景的一部分。为了减少观察...

2019-09-16 10:39:31

第五章 图像复原

与图像增强相似,图像复原的目的也是改善给定的图像。但图像增强主要是一个主观的过程,而图像复原是一个客观的过程。5.1 图像退化/复原过程的模型...

2019-09-13 09:28:28

4.6 实现

4.6.1 二维傅立叶变换的可分性对于每一个xxx值,当v=0,1,2,...,N−1v = 0,1,2,...,N-1v=0,1,2,...,N−1时,该等式是完整的一维傅立叶变换。换言之,F(x,v)F(x,v)F(x,v)是沿着f(x,y)f(x,y)f(x,y)的一行所进行的傅立叶变换。当xxx由000变成M−1M-1M−1时,沿着f(x,y)f(x,y)f(x,y)的所有行计算傅立叶...

2019-09-09 09:48:46

频率域锐化--拉普拉斯

频率域的拉普拉斯算子根据公式:即,频率域的拉普拉斯算子可以由如下滤波器实现:H(u,v)=−4π2(u2+v2)H(u,v) = -4\pi^2(u^2+v^2)H(u,v)=−4π2(u2+v2)前面的公式在处理数字图像时,还需要进行比例的变换,例如对于大小为M×NM \times NM×N的数字图像f(x,y)f(x,y)f(x,y),实际的频率域拉普拉斯算子为:为什么不...

2019-09-08 09:36:50

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。