自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 Pseudo-Q: Generating Pseudo Language Queries for Visual Grounding, 2022 CVPR

**本文内容仅代表个人理解,如有错误,欢迎指正**1. Problem & Background Information1.1 Problem- 目前,人们基本上都采用基于深度学习的方法来解决Visual grounding任务。不论是全监督学习还是弱监督学习,都十分依赖人为标注的数据集,而人工标注不仅昂贵,还十分费时。因此,本篇论文的目标是减少模型对于人工标注数据的依赖。1.2 Background Information- 简单阐述Visual grounding任务背景下的

2022-05-10 22:42:45 949

原创 Entity Relation Fusion for Real-Time One-Stage Referring Expression Comprehension 2021

**本文内容仅代表个人理解,如有错误,欢迎指正*******(原论文在方法部分写得有点套娃的意思,实在是有点乱,内心os:心平气和心平气和)1. Problems- 这篇论文主要提出两个问题:1) 用一个向量来对Query进行表示,没有对Query当中丰富的物体关系进行推理,即没有有效地利用Query中的信息。2) 采用特征金字塔提取图像不同层级的特征,得到不同尺度的特征图。分别在不同尺度的特征图上对目标物体进行框选,忽略了处于不同尺度特征图上的物体之间的相关性。2. Point..

2022-04-18 15:48:21 2255

原创 Suspected Object Matters: Rethinking Model’s Prediction for One-stage Visual Grounding 2022

图一**本文内容仅代表个人理解,如有错误,欢迎指正**1. Problem本文提出的立足点:主要物体间的相关关系对于框选目标物体而言是十分重要的,而当前一阶段的视觉定位方法对于物体之间的关系模拟比较薄弱,使得模型不能够较好地学到物体之间的相关关系,从而导致模型表现的差强人意。Q: 那为什么说一阶段的视觉定位方法对于物体之间的关系模拟比较薄弱呢?A: 如果要对物体之间的关系进行模拟、学习,首先需要有物体。而一阶段的视觉定位方法(相比于两阶段的视觉定位方法)没有利用pre-trained det

2022-04-13 13:28:36 3248

原创 One-Stage Visual Grounding via Semantic-Aware Feature Filter

**本文内容仅代表个人理解,如有错误,欢迎指正**隐约感觉到最近看的几篇论文都指出之前One-stage visual grounding methods大多利用pre-trained BERT将query编码为一个holistic vector,比较方便简单。但这样做的话,弱化了query中存在的语义信息,即对query的信息挖掘不足。所以,最近的文章都立足于如何能够更好地挖掘并利用query中存在的语义信息,从而辅助模型更准确地进行目标物体的框选。1. Problem本篇论文主要解决的问题:

2022-04-02 15:10:53 2620

原创 Word2Pix: Word to Pixel Cross Attention Transformer in Visual Grounding,2021

**本文内容仅代表个人理解,如有错误,欢迎指正**1. Problem本篇论文主要解决的问题:将query编码成一个holistic sentence embedding,忽略了每个词对于Visual grounding框选的重要性,从而降低了模型的performance。之前的方法(一阶段或两阶段)大多都将Language query编码成一个holistic sentence embedding,这种情况下,所生成的embedding可能会对query中的word没有那么敏感/没有强调每个词

2022-03-21 22:10:33 1043

原创 Deconfounded Visual Grounding

**本文内容仅代表个人理解,如有错误,欢迎指正**1. QuestionsQ1: 什么是confounding bias between language and location in the visual grounding pipeline?- 论文作者认为,模型在grounding的过程中,更依赖于query来框出target的location,而非去做visual reasoning。举个例子来说明Confounding bias,比如说在训练数据集中,包含“sheep”这个词的que

2022-03-16 17:26:52 4655 2

原创 CrossCLR: Cross-modal Contrastive Learning for Multi-modal Video Representations, 2021 ICCV

**本文内容仅代表个人理解,如有错误,欢迎指正**1. Points这篇论文主要解决两个问题1. 跨模态对比学习(Cross-modal Contrastive learning)更注重于不同模态下的数据,而非同一模态下的数据。- 也就是说,将不同模态下的数据投影到Joint space时,希望paired samples(eg, Image1和Text1)之间的距离可以尽可能地小,unpaired samples(eg, Image1和Text2)之间的距离可以尽可能地大。而忽略了一个问题

2022-03-06 10:56:32 2650 1

原创 UNIMO:Towards Unified-Modal Understanding and Generation via Cross-Modal Contrastive Learning

**本文内容仅代表个人理解,如有错误,欢迎指正**1. Points1) UNIMO是一个预训练模型,其输入可以有不同的形式(eg, Image collections, Text corpus, Image-Text Pairs),并且可以微调后用于单模态(Single-modal)任务与多模态(Multi-modal)任务。即不仅在预训练时利用了image-text pair的数据,还充分利用了大量单模态的数据(non-paired single-modal, like images and t

2022-03-01 17:00:58 3334 2

原创 Conda 新建虚拟环境失败

输入:conda create --name yourenvname python=3.7显示:解决:输入:conda clean -i

2021-07-01 15:05:49 258

原创 cin.sync_with_stdio(false)

在cpp中,因cin和cout要将数据存入缓冲区中再输出,效率缓慢。采用cin.sync_with_stdio(false)能够取消iostream的输入输出缓存,人为取消同步,使其效率逼近scanf与printf。

2020-11-17 15:12:04 459

原创 [C++] STL的vector模板类

Note :STL = Standard Template Library 标准模板库Vector首先,要使用vector模板类,要先在cpp文件中加入#include<vector>在计算中,矢量vector对应数组。#vector支持随机访问,意味着可以直接通过索引得到值eg.vector<int> A; A[8];要创建vector模板对象,可以使用<type>表示法来指出要使用的类型。<int><double&.

2020-10-11 13:45:58 145

原创 阿里巴巴AI - Pandas

Pandas的两个主要数据结构1.Series - 主要用于处理一维数据,一般由一个数组的数据构成。2.DataFrame - 主要用于处理二维数据。from pandas import Series, DataFrame-Seriesegimport pandas as pds1 = pd.Series([1,2,3,4])s1 // 0 1 1 2 2 3 3 4 dtype: int64s1.index//RangeIndex(star.

2020-07-14 22:32:27 242

原创 Paddlepaddle Tutorial - 手写数字识别笔记 (using MNIST)

##基于MNIST数据库上的手写识别问题-大部分内容来自网站https://www.paddlepaddle.org.cn/documentation/docs/zh/user_guides/simple_case/recognize_digits/README.cn.htmlMNIST数据集作为一个简单的计算机视觉数据库,包含一系列手写数字图片和对应的标签。图片是28*28的像素矩阵,标签对应0~9,每张图片都经过了大小归一化和居中处理。MNIST数据集从NIST的Special Dat

2020-07-14 16:19:45 241

原创 如何将List转换成Str

#使用" ".join(list)函数,将list转换成字符串其中会采用“”内的元素来连接list中的元素,“”中的元素可自行选择。

2020-07-14 13:40:47 3853

原创 模拟退火算法 - 浅层

模拟退火算法(Simulated Annealing,SA) - 属于启发式搜索什么是启发式搜索 ?启发式搜索(Heuristically Search)又称为有信息搜索(Informed Search),它是利用问题拥有的启发信息来引导搜索,达到减少搜索范围、降低问题复杂度的目的。又或者说,在搜索最优解的过程中利用到了原来搜索过程中得到的信息,且这个信息会改进我们的搜索过程。模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温度上升变为无序状,.

2020-05-20 17:01:12 399

原创 OS零碎知识整理(14)

1.快表 / 转换检测缓冲区Translation Lookaside Buffer(TLB)即将虚拟地址直接映射到物理地址的小型硬件设备,通常在MMU中,包含一些页表项。每一个页表项包含(1)有效位 - 即表示该页是否正在使用。(2)虚拟页号(3)修改位 - 是否被修改过。(4)保护位 - 即读/写/执行权限。(5)页框号其工作流程:(1)将一个虚拟地址放入MMU中进行转换时,硬件首先通过将该虚拟页号与TLB中所有表项同时(即并行)进行匹配,判断虚拟页面是否在其中。..

2020-05-19 23:48:49 291

原创 OS零碎知识整理(13)

存储管理器(Memorymanager)有效地管理内存,即记录内存的使用情况,在进程需要时为其分配内存,在进程使用完后释放内存。在ROM(ReadOnlyMemory,只读存储器)中的系统部分称为BIOS=BasicInputOutputSystem,基本输入输出系统把物理地址暴露给进程的缺点,如果用户程序可以寻址内存的每个字节,它们就可以很容易地(故意地或偶然地)破坏操作系统。地址空间?即新的存储器抽象,地址空间为程序创造了一个抽象的内存。地址空间是一个进程可用于寻址内存的...

2020-05-19 02:02:40 134

原创 循环神经网络RNN - 浅层

循环神经网络RNN - Recurrent Neural NetworkPs 循环神经网络Recurrent Neural Network 和递归神经网络Recursive Neural Network虽然缩写都是RNN ,但实际上是不一样的。RNN(Recurrent Neural Network)是什么?循环神经网络(Recurrent Neural Network, RNN)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按

2020-05-18 17:32:22 367

原创 OS零碎知识整理(12)

1.线程中有什么?(1)程序计数器,用来记录接着要执行哪一条指令。 //在处理器中,在取指令后都会将程序计数器(PC)指向下一条执行指令的地址,取得的指令则存放在指令寄存器(IR)中执行。(2)寄存器,用来保存线程当前的工作变量。(3)堆栈,用来记录执行历史,其中每一帧保存了一个已调用的但是未返回的过程。2.使用用户级线程有什么好处?在用户级线程中,有关线程管理的所有工作都由应用程序完成,意味着内核意识不到线程的存在。(1)线程管理不需要到内核中进行处理,避免了由用户...

2020-05-15 20:20:01 126

原创 OS零碎知识整理(11)

1.DMA方式与中断方式的主要区别是什么?(1)中断方式是在数据缓冲寄存器满之后发中断要求CPU进行中断处理; DMA方式则是在所要求转送的数据块全部传送结束时要求CPU进行中断处理。(大大减少了CPU进行中断处理的次数)(2)中断方式的数据传送是在中断处理时由CPU控制完成的; DMA方式是在DMA控制器的控制下不经过CPU控制完成的。2.通道控制方式与DMA方式的主要区别是什么?(1)在DMA方式中,数据的传送方向、存放数据的内存始址以及传送的数据块长度等...

2020-05-12 13:16:52 158

原创 卷积神经网络CNN - 浅层

卷积神经网络CNN - Convolutional neural network在网络中采用卷积(一种特殊的线性运算)计算,卷积神经网络至少在一层中使用卷积代替一般矩阵乘法。[In mathematics , the asterisk is the standard symbol for convolution.]卷积计算用 “ * ”表示。1.卷积神经网络的结构(1)卷积层- Convolutional layer卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法(

2020-05-11 22:23:34 2868

原创 神经网络学习的基本概念

1.符号主义与连接主义(1)符号主义:重视逻辑而轻视感知。Eg.专家系统(2)连接主义 :重视感知而轻视逻辑。Eg.神经网络共同之处在于都是研究怎样用计算机来模拟人脑工作过程。(图源自《人工智能》 马少平)2.神经网络的基本模型(1)前馈型网络信号由输入层到输出层单向传播,每层的神经元仅与前层的神经元相连接,只接受前层传输来的信息。图来源《人工智能》 马少平(2)输入输出有反馈的前馈性网络其输出层上存在一个反馈回路到输入层的回路,网络本身还是前馈型的。...

2020-05-10 16:48:23 652

原创 决策树学习的基本概念

决策树(Decision Tree)1.什么是决策树学习?决策树学习是以实例为基础的归纳学习,采用自顶向下的递归方法,决策树的每一层结点依照某一属性值向下分为子结点,待分类的实例在每一结点处与该结点相关的属性值进行比较,根据不同的比较结果向相应的子结点扩展,这一过程在到达决策树的叶结点时结束。=> 从根结点到叶结点的每一条路径都对应着一条合理的规则,规则间各部分的关系是合取关系,整个决策树对应着一组析取的规则。基本思路:以信息熵为度量构造一棵熵值下降最快的树,到叶子结点处的熵值.

2020-05-10 15:13:55 1331

原创 实例学习的基本概念

1.什么是实例学习 ?实例学习是一种归纳学习方法,从大量的学习样本中归纳总结出相应的规则、概念。<归纳推理不保真,因此要反复进行示例与归纳,避免归纳的错误结论影响最终结果>实例学习的过程即在实例空间和规则空间中搜索、匹配的过程。首先示教者给实例空间提供一些初始示教例子,由于示教例子的形式往往不同于规则的形式,程序必须对示教例子进行解释,然后再利用被解释的示教例子去搜索规则空间。并且要寻找一些合适的新的示教例子以解决规则空间中某些规则的歧义性。<解释例子+选择例子>.

2020-05-10 12:32:12 2526

原创 贝叶斯网络的基本概念

贝叶斯网络一个在弧的连接关系上加入连接强度的因果关系网络。1.贝叶斯网络的组成是一系列变量和联合概率分布的图形表示,一般包含两个部分。(1)贝叶斯网络结构图 - 有向无环图(DAG , Directed Acyclic Graph),其中图中的每个结点代表相应的变量。当有向弧由结点A指向结点B时,称A是B的父结点,B是A的子结点。(2)结点和结点之间的条件概率表(CPT),即一系列的概率值,表示了局部条件概率分布。//图来自《人工智能》 马少平* 条件独立属性:每一个变量独.

2020-05-10 00:40:45 2724

原创 语义网络的基本概念

语义网络由结点和结点间的有向弧组成的有向图。语义网络近年来成为人工智能中应用较多的一种知识表示方法,尤其是在自然语言处理方面。1.语义网络的结构语义网络是一种用实体及其语义关系来表达知识的知识表达方式。语义网络一般由一些最基本的语义单元/语义基元组成,语义基元是由有向图表示的三元组 (结点A,弧,结点B)结点代表实体,表示各种事物、概念、情况、属性、状态、事件、动作等。弧是有方向和标注的,方向体现了结点所代表的实体的主次关系,即结点A为主,结点B为辅;线上的标注表示它.

2020-05-08 22:52:10 19931

原创 产生式系统的基本概念

产生式系统(Production System)把一组产生式放在一起,让它们相互配合,协同工作,一个产生式生成的结论可以供另一个产生式作为前提使用,以这种方式求得问题的解决的系统就叫作产生式系统。产生式又称作规则或产生式规则。用于表示事物间的因果关系。IF <前提> THEN <结论>产生式系统 = 数据库 + 规则库 + 推理机数据库 - 存放信息...

2020-05-08 15:48:08 12769

原创 OS零碎知识整理(10)

常用的内存管理方法一 分区式管理基本原理:给每一个内存中的进程划分一块适当大小的存储区,以连续存储各进程的程序和数据,使各进程得以并发执行。各作业或各进程对应于不同的分区以及在分区内各作业或进程连续存放,所以进程的大小仍受分区大小或内存可用空间的限制。1.固定分区法基本思想: 把内存固定地划分为若干个大小不等的区域,分区一旦划分结束,在整个执行过程中每个分区的...

2020-05-07 23:12:53 232

原创 OS零碎知识整理(9)

1.虚拟存储器 ( 对应虚拟地址 )虚拟存储器:进程中的目标代码、数据等的虚拟地址组成的虚拟空间。虚拟存储器不考虑物理存储器党的大小和信息存放的实际位置,只规定每个进程中相互关联信息的相对位置。每个进程都有自己的虚拟存储器,且虚拟存储器的容量由计算机的地址结构和寻址方式确定。2.地址重定位/地址映射 = 虚拟地址 -> 物理地址*内存地址 = 物理地址(1).静态地...

2020-05-06 00:33:43 477

原创 OS零碎知识整理(8)

简述常用的进程调度算法和作业调度算法(1)先来先服务(FCFS)算法 -First Come First Serve这个算法较为公平,也比较好理解。基本思路:依照各作业或进程到来的顺序组成队列进行调度。不利于短作业或短进程,因为如果短作业前有很多长作业,那么短作业必须等长作业都执行完成后才能执行,周转时间太长。此调度算法很少单独使用,一般与其他算法搭配使用。(2...

2020-05-05 17:38:09 105

原创 OS零碎知识整理(7)

1.进程通信的含义以及进程通信方式?进程通信(Communication):主要指进程间传送数据。可以划分为 (1)控制信息的传送(低级通信) (2)大批量数据传送(高级通信)进程通信方式:在单机系统中,进程间通信可分为4种形式(1)主从式(2)会话式(3)消息或邮箱机制 (较为常用)(4)共享存储区方式2.消息缓冲通信的实现消息缓冲机制:发送进程...

2020-05-04 21:50:42 518

原创 OS零碎知识整理(6)

进程管理部分1.临界资源与临界区的含义?临界资源:一次仅允许一个进程使用的资源。临界区:不允许多个并发进程交叉执行的一段程序 / 访问公用数据的那段程序 / 那段代码。2.信号量机制的含义(P、V操作定义)?信号量(semaphore) - 管理相应临界区的公有资源。信号量又分为公用信号量(互斥)与私用信号量(同步)在操作系统中,信号量sem是一整数,sem &g...

2020-05-04 16:17:57 142

原创 OS零碎知识整理(5)

进程管理部分1.程序可再现性与封闭性的含义?[程序:指令的有序集合。]程序的执行分为顺序执行与并发(Concurrent)执行。程序顺序执行时有三种特性:顺序性、封闭性、可再现性。 可再现性:指只要程序执行时的环境和初始条件相同,当程序重复执行时,不论是它从头到尾不停顿地执行,还是“停停走走”地执行,都将获得相同的结果。 封闭性:程序执行得到的最终结果由给...

2020-05-04 00:07:07 961

原创 OS零碎知识整理(4)

1.OS用户接口类型(1)命令接口 - 用户利用这些操作命令来组织和控制作业的执行 @联机命令接口( 交互式命令接口 ) ,适用于分时或实时系统。 [用户输入一条命令,操作系统处理一条命令] @脱机命令接口( 批处理命令接口 ) ,适用于批处理系统。 [用户输入一批命令,操作系统处理一批命令](2)程序接口 - 编程人员可以使...

2020-05-02 19:56:15 188

原创 OS零碎知识整理(3)

1.OS(Operating Systems)@管理计算机硬件与软件资源的计算机程序。一些描述(1)系统资源的管理者。(软件+硬件)(2)向上层提供方便易用的服务。 [GUI(Graphical User Interface) 用户图形界面 联机命令接口 = 交互式命令接口 脱机命令接口 = 批处理命令接口 程序接口<程序员> ]...

2020-05-01 16:06:52 120

原创 OS零碎知识整理(2)

1.SPOOLing技术(假脱机技术) ——将独占设备改造成共享设备目的:为了缓和CPU的高速性与I/O设备低速性之间的矛盾。SPOOLing系统的组成如下图所示(凸图来自王道操作系统一书)注意,磁盘中区分了输入井与输出井,分别模拟脱机输入/输出时的磁盘。SPOOLing技术的实例:共享打印机。2.处理机的三级调度:作业调度、交换调度、进程调度。(1)高级调度/作业调度...

2020-04-29 17:14:01 273

原创 OS零碎知识整理(1)

1.流式文件,属于逻辑结构的文件。2.通道(I/O处理机)能够完成主存与外设之间的信息传输。3.操作系统的主要设计目标是 (1)方便用户 (2)提高系统效率。4.死锁的四个必要条件 (1)互斥条件 (2)请求和保持条件 (3)不可剥夺条件 (4)循坏等待条件 (缺一不可)5.为了使用户能够透明地访问文件,文件系统提供了按名存取的功能。6.磁盘的驱动调度包括(1)移臂调度:...

2020-04-28 20:36:15 154

原创 进程的相关概念

进程(Process)配置专门的数据结构进程控制块(Process Control Block,PCB)来管理进程。 [PCB是进程存在的唯一标志] *进程映像(进程实体/进程运行的上下文环境)= 程序段 + 相关数据段 + PCB *进程映像是静态的,进程是动态的。进程的主要特征(1)动态性 :进...

2020-04-28 19:52:40 170

原创 【Android Studio】研究一个只有三首歌的简易音乐播放器

研究一个只有三首歌的简易音乐播放器Tips:Things you need to know first.什么是URI?URI =Uniform Resource Identifier (统一资源标识符)是用于标识某一互联网资源名称的字符串主要包括三个部分①主机名②标识符③相对URIeg:http://b.c/d/e.f (假设b.c是一个可用的域名,e.f是一个标准的文件)...

2019-05-19 00:11:47 1392 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除