自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 资源 (1)
  • 收藏
  • 关注

原创 论文写作-复旦张奇NLP

https://www.bilibili.com/video/BV1RG411D7jf/?p=2&spm_id_from=pageDriver&vd_source=d997020f2a3d4215b3ebbe4671170cab统计机器学习 周志华神经网络与深度学习 邱锡鹏统计自然语言处理 宗成庆统计学习方法 李航深度学习 花书自然语言处理综论精读少量热门与冷门方向各有利弊热门易撞车,被抢创新点冷门节奏可以放慢王兴的美团就是基于填格子产生的对任务的理解-需要长期积累的经验(一般需要导

2024-03-08 23:46:01 165

原创 计算机网络笔记-韩立刚-第七章-网络安全

数据安全应用程序安全操作系统安全。

2023-12-22 02:19:58 1280

原创 计算机网络笔记-韩立刚-第六章-应用层

综上所述,HTTPS是HTTP的安全版本,通过使用加密和身份验证机制,保护了数据在传输过程中的安全性。HTTP是面向文本的(Text-Oriented), 因此报文中的每个字段都是一一些ASCII码串,并且每个字段的长度都是不确定的。HTTP不需要使用证书。协议,它规定了在浏览器和服务器之间的请求和响应的格式与规则,是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。在浏览器和服务器之间的请求与响应的交互,必须遵循规定的格式和规则,这些格式和规则就是HTTP。

2023-12-21 12:44:41 1043

原创 计算机网络笔记-韩立刚-第五章-传输层

当SYN=1, ACK=0时,表明这是一个连接请求报文,对方若同意建立连接,则在响应报文中使用SYN=1, ACK=1。即SYN= 1表示这是一个连接请求或连接接收报文。当SYN=1, ACK=0时,表明这是一个连接请求报文,对方若同意建立连接,则在响应报文中使用SYN=1, ACK=1。RST=1时,表明TCP连接中出现严重差错(如主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。time13 web2xp :web MSS=1460,窗口=64240 SYN=1, ACK=1。

2023-12-20 10:57:17 958

原创 计算机网络笔记-韩立刚-第四章-网络层

综上所述,NAT和PAT都是用于将私有网络与公共网络进行连接的网络地址转换技术。NAT主要进行IP地址转换,而PAT在IP地址转换的基础上使用端口映射,实现了多个设备共享一个公共IP地址的功能。NAT(Network Address Translation,网络地址转换)和PAT(Port Address Translation,端口地址转换)是两种相关的网络地址转换技术,常用于将私有网络与公共网络进行连接。数据报在网络中可通过的路由器数的最大值,标识分组在网络中的寿命,以确保分组不会永远在网络中循环。

2023-12-17 22:11:44 1042

原创 计算机网络笔记-韩立刚-第三章-数据链路层

在以太网中,广播帧是一种特殊类型的数据帧,它的目标MAC地址被设置为广播地址(全为1)。PPP(Point-to-Point Protocol):PPP是一种常见的链路控制协议,用于建立点对点连接,例如拨号上网和DSL(Digital Subscriber Line)等。总结来说,冲突域描述了共享介质网络中可能发生碰撞的范围,而广播域描述了网络中进行广播传输的范围。通过PPPoE,用户可以在以太网上建立安全的、个人的连接,同时使用PPP协议提供的功能,如身份验证、错误检测和压缩等。

2023-12-15 17:22:13 80

原创 计算机网络笔记-韩立刚-第二章-物理层

流而不是指具体的传输媒体。

2023-12-12 17:21:57 395

原创 计算机网络笔记-韩立刚-第一章-概述

连通、共享网络: 许多计算机连接在一起互联网:internet 许多网络连接在一起因特网: Internet 全球最大的一个互联网发展阶段: 1.20th 60-80:初期由美国国防部开发的TCP/IP,安全问题考虑得少,如今IPV6考虑的更全面。2.20th 90-90三级结构的英特网。3.多层次ISP(Internet Service Provider,电信,联通,长城。。。英特网的标准化工作(英特网协会ISOC)

2023-12-12 13:42:39 208

原创 Transformer-2. 注意力分数

上一节记录了注意力机制的基础,这一节主要做几个实现,上节使用了高斯核来对查询和键之间的关系建模。高斯核指数部分可以视为注意力评分函数(attention scoring function), 简称评分函数(scoring function), 然后把这个函数的输出结果输入到softmax函数中进行运算。通过上述步骤,将得到与键对应的值的概率分布(即注意力权重)。最后,注意力汇聚的输出就是基于这些注意力权重的值的加权和。

2023-09-11 17:26:04 460 3

原创 Transformer-1. 注意力机制基础

基础部分比较简单,全是搬运,主要介绍几个例子。

2023-08-15 23:00:27 294

原创 MindSpore-TOOD实现:模型权重迁移推理对齐实录

mindspore实现单阶段目标检测模型TOOD

2023-06-23 00:27:55 758

原创 MindSpore-FCOS模型权重迁移推理对齐实录

pytorch FCOS迁移到mindspore经验实录

2023-06-22 00:35:10 596

原创 c++指针

指针变量定义语法: 数据类型 * 变量名;普通变量存放的是数据,指针变量存放的是地址指针变量可以通过" * "操作符,操作指针变量指向的内存空间,这个过程称为解引用总结1: 我们可以通过 & 符号 获取变量的地址总结2:利用指针可以记录地址总结3:对指针变量解引用,可以操作指针指向的内存。

2023-04-19 17:31:13 393 1

原创 C++核心编程

​ 在C++中主要利用new在堆区开辟内存, 利用new创建的数据,会返回该数据对应的类型的指针。​ 代码区是共享的,共享的目的是对于频繁被执行的程序,只需要在内存中有一份代码即可。​ 由程序员分配释放,若程序员不释放,程序结束时由操作系统回收。​ 由编译器自动分配释放, 存放函数的参数值,局部变量等。,使其只读的原因是防止程序意外地修改了它的指令。, 字符串常量和其他常量也存放在此.​ 存放 CPU 执行的机器指令。​ 全局变量和静态变量存放在此.

2023-04-19 11:31:20 139

原创 人脸检测:经典的VJ人脸检测器(类Harr特征,积分图加速法,级联的Adaboost强分类器)

著名的VJ人脸检测算法就是一种基于Adaboost分类器的方法。该检测器由Paul Viola和Michael Jones在2001年的提出。在当年的硬件条件下VJ算法可以达到每秒15帧图像的处理速度,是人脸检测技术发展的一个里程碑。虽然性能跟现在基于深度学习的方法没法比,但肯定也是值得去拜读的。

2022-10-25 17:21:40 2633

原创 图像生成:GAN网络(数学原理)

GAN网络经常会见到或用到,但感觉对其理解不够深入,写此博客记录一下,方便今后查阅。

2022-10-19 15:36:27 1408

原创 使用mmdet报错:RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

解决方法:将batchsize=24修改为16,没想到吧,但的确解决了,具体原因不是很懂。

2022-10-13 17:47:24 938

原创 目标检测:Generalized Focal Loss V2(CVPR2020)

在v2中,作者基于v1中回归任务的离散概率分布估计,对回归任务进行质量评估,以帮助NMS时保留到回归质量最好的边界框。其直观的原理是这样的:估计的离散概率分布越平滑,那不确定性越高,网络对得到的框的质量是表示怀疑的,概率分布越尖锐,表示确定性很高,网络很笃定回归得到的边界框。

2022-08-25 16:28:55 927

原创 目标检测:cocoeval中的evaluateImg,accumulate函数解析

coco数据集的评价指标的计算还是比较复杂的,代码写的也比较凝炼,最近要计算目标检测的混淆矩阵,我看mmdet的计算方式比较奇怪,本着P和R等计算方法要与coco官方对齐的目的,特地写此笔记对coco官方的计算方式进行深入理解。coco计算不同map有很多变量:iou阈值,目标的面积范围,最大检测框数量等。coco首先使用cocoEval.evaluate() 函数进行匹配计算,然后使用cocoEval.accumulate()函数进行结果的累加。

2022-08-24 16:48:28 2366 2

原创 目标检测:VarifocalNet: An IoU-aware Dense Object Detector(CVPR2021)

文章的动机与GFL类似,都是基于目标检测中 分类与定位 的相关性低,低分类得分数但高定位精度的预测框可能会被nms掉这一问题。本文试图统一分类得分与回归质量,并设计了更强的bbox表达方式和优化方法。......

2022-08-17 22:35:26 1125

原创 目标检测:Generalized Focal Loss(NIPS2020)

论文要解决单阶段目标检测中的两个问题: 1. 训练和推理时定位质量评估与分类分数是非一致的。2. 边界框的表征是不够灵活的

2022-08-16 15:48:03 3227

原创 视线追踪(Estimation of Gaze-Following)文献阅读:Believe It or Not, We Know What You Are Looking At

文章名称风格飘逸。这个是解决视线追踪任务的文章,第一次接触。因此做一下笔记。视线追踪任务很好理解,就是找出图中某个人物的视线焦点。

2022-08-14 11:43:22 622

原创 目标检测中的BBox 回归损失函数-L2,smooth L1,IoU,GIoU,DIoU,CIoU,Focal-EIoU,Alpha-IoU,SIoU

目标检测的两个任务,分类和位置回归,本帖将经典的位置回归损失函数总结如下,按发表时间顺序。L1最低点是不可导的,所以势必不会收敛到最低点,可能会在最优解附近震荡。而L2损失容易在离群点产生梯度爆炸的问题。smooth L1则集两者的优点于一身。提出IoU loss的论文:不论是L2还是smooth L1 loss都没有考虑到四个点的关联性和尺度不变性,这个是比较致命的缺点,当两对预测框与GT框的IoU相同时,尺度更大那一对loss会更高,或者如下图,用左下角和......

2022-07-04 17:21:50 2435

原创 目标检测中的损失函数与正负样本分配:RetinaNet与Focal loss

在目标检测领域,单阶段算法精度第一次超过双阶段,就是RetinaNet。

2022-07-02 16:22:23 1214

原创 目标检测中的损失函数与正负样本分配:YOLO v1, v2, v3,v3-spp-ultralytics

目标检测算法最难理解的,设计最复杂的就是正负样本分配和损失函数这块了,这两者将很大程度决定网络的训练效果,因此开帖对yolo系列做一总结,重点也在这两者,吸收他人优秀博客内容,进行整理。.........

2022-07-02 10:09:46 3187 1

原创 NLP-RNN,LSTM基础摘要

本文适合有一定基础的同学翻阅,内容比较精炼,主要是用于复习,不建议新手看,新手推荐:https://www.youtube.com/user/wsszju/videos最简单的RNN结构还是很简单的,左边是真实的RNN模型,右边是根据时序展开后的,便于理解,A是tanh函数:simple RNN 与LSTM的对比:LSTM最重要的设计是传输带,将过去的信息直接传入下一时刻,以避免梯度消失。同时含有很多Gate:Forget Gate,Input Gate,Output Gate。下图中,四

2022-05-12 20:34:39 343

原创 NLP-文本表示(Text Representation):TF-IDF和Embedding

TF-IDF该指标的意义:tf-idf通过词频统计的方法得到某个词对一篇文档的重要性大小(没有考虑语义信息)。计算公式: TF-IDF = tf*idftf 值(term frequency):idf值(inverse document frequency)

2022-05-12 11:06:19 781

原创 目标检测R-CNN系列简要总结(RCNN, FastRCNN, FasterRCNN)

R-CNN:Region with CNN feature内容总结于 b站霹雳吧啦Wz博主,讲的很好,这里做简要总结。

2022-04-30 01:45:49 958

原创 Tensorflow2中tf.image.resize函数的bug,以及解决办法

解决办法:使用tf.compat.v1.image.resize_bilinear替换这个bug之前在这里有人提到过,自己之前也遇到过,但是是用补救的方法解决的,这次是在准备训练EAST文本检测网络时又遇到了,记录一下解决过程。关于EAST, github有tf1-keras的已训练好的h5权重,为了能在win系统的tf2上快乐高效地训练,我按照keras2.3.1的resnet50层命名风格重建了EAST网络,这样在tf2(keras=2.4.0)上就能完美加载tf1的权重了。在tf1中,EAST的

2022-03-23 17:08:10 2538

原创 python-使用numpy实现keras中的concatenate,sigmoid等函数

最近要将tf的模型移植到tpu平台,tpu设备肯定是不支持keras的,需要做函数的迁移。我计划所有keras的函数用numpy来实现,numpy的矩阵运算还是很快的。keras和numpy有很多功能相同的函数,但也要注意一些细节的区别。concatenate函数keras的该函数默认axis为-1(倒数第一个轴),而np的默认为0tf.keras.layers.Concatenate( axis=-1, **kwargs)np.concatenate()sigmoid函数这个函数在

2021-11-10 17:42:33 1818

原创 训练yolo3-TF2时报错ValueError: slice index -1 of dimension 0 out of bounds

ValueError: slice index -1 of dimension 0 out of bounds. for 'loss/yolo_loss_loss/strided_slice' (op: 'StridedSlice') with input shapes: [0], [1], [1], [1] and with computed input tensors: input[1] = <-1>, input[2] = <0>, input[3] = <1>.,将tf2.1.0升级至2.3.0解决

2021-10-24 20:53:17 2088 8

原创 2021-基于深度学习的人脸检测综述文献-摘要

The Elements of End-to-end Deep Face Recognition: A Survey of Recent Advances 该综述的要点记录

2021-10-09 17:05:46 1098

原创 MATLAB-subplot使用‘position’子图丢失问题,解决方法

在上篇文章中介绍了使用’position‘调整subplot函数子图间距的方法,但应用中又出现了问题,当我设置五张图并排放时,出现了子图丢失的问题。。。subplot(1,5,1,'position',[0,0,0.2,1]);imshow(A);xlabel('原图');for i=1:4 subplot(1,5,1+i,'position',[0.2*i,0,0.2,1]); imshow(file{i});end效果:搜索了一下解决办法,matlab论坛的网友们说是指

2021-05-07 01:53:35 3703 1

原创 MATLAB-在subplot函数中调整子图的位置和间距

如果要使两幅图无缝并排放显示,可以使用**imshowpair**函数中的蒙太奇形式,简单易用。例如将A图与C图并排放置显示:imshowpair(A,C,'montage');![在这里插入图片描述](https://img-blog.csdnimg.cn/20210506025905496.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L

2021-05-06 03:12:26 14299 2

原创 matlab-批处理图像

在matlab上批处理上百张.png图像,目的是将所有图片进行增强(如histeq直方图均衡),然后写入指定文件夹,图像名称不变。思路:用dir函数读所有图片的信息并生产一个结构组,dir详见matlab的help利用name读取每个png文件的图像构成元胞pngcell注意:对cell的操作花括号和圆括号的不同:通过小括号()里面加下标,访问cell数组中的数据,返回的是对应的cell。通过大括号{}里面加下标,访问cell数组中的数据,返回的是对应cell的内容。如对本程序中的pngc

2021-01-30 22:31:47 1498

原创 python基础-设计滚动字幕(方向,速度可选,回车符实现清除屏幕效果)

设计一个可以选择滚动方向,滚动速度的实现字幕滚动功能的程序。本程序是基于一些类似的程序的扩展和修改。滚动的实现(核心):将字幕作为列表做切片操作,切头补尾即可实现左滚,切尾补头实现右滚使用回车操作 \r 符实现清除屏幕的效果关于回车和换行符的理解推荐两篇文章:https://www.cnblogs.com/zzliu/p/10156658.htmlhttps://www.cnblogs.com/yc3110/p/10809564.html程序代码:def roll_titles():

2021-01-24 17:08:38 1862 3

原创 python-对列表的操作extend (扩展) 与 append (追加) 的使用差别

两个函数在《python入门编程与案例详解》(清华大学出版社)中的解释:append():在列表的尾部添加一个新元素extend():可以将另一个可迭代对象的所有元素添加到列表的尾部新元素好理解,变量,数值,字符等。度娘”可迭代对象“概念:迭代对象:可以直接作用于for循环的对象统称为可迭代对象在 a = 0 l1 = [1, 2, 3] l2 = [4, 5, 6] list0 = [l1, l2] print('# 原始两个列表:') for

2021-01-20 10:14:31 467 1

原创 python基础-craps赌牌游戏

感觉这个游戏以后可以做可视化的图形用户界面,所以改进一下,先记下来。CRAPS又称花旗骰,是美国拉斯维加斯非常受欢迎的一种的桌上赌博游戏。该游戏使用两粒骰子,玩家通过摇两粒骰子获得点数进行游戏。简单的规则是:玩家第一次摇骰子如果摇出了7点或11点,玩家胜;玩家第一次如果摇出2点、3点或12点,庄家胜;其他点数玩家继续摇骰子,如果玩家摇出了7点,庄家胜;如果玩家摇出了第一次摇的点数,玩家胜;其他点数,玩家继续要骰子,直到分出胜负。from time import sleepfrom random imp

2021-01-17 19:17:31 1654

原创 python基础-猜数字游戏(改进版)

基于python的猜数字游戏有很多,我基于最简单的稍做改进,还是为了熟悉基础的编程知识。#猜数字游戏,可重复玩import randomdef conjecture(): #猜数字游戏的函数 answer = random.randint(1, 100) #产生的随机数范围包括下限和上限 counter = 0 print('请猜一猜这个整数(1—100)是多少?') while True: counter += 1 nu

2021-01-16 18:52:55 5744

原创 图像插值-双三次插值(bicubic)

双三次插值本文将未做插值的原始图像称作源图像,源图像插值缩放K倍后的图像称作目标图像。以下标识符的意义:算法如下图,双三次插值就是通过对周边16个点(A,B,C,…N,O,P)进行加权计算得到目标像素点的值,(dstX/K,dstY/K)归一化后为(dstX/K,dstY/K),可推得:srcX=floor(dstX/K);srcY=floor(dstY/K);u=dstX/K-srcX;v=dstY/K-srcY;这样,就能得到16个点的位置。加权系数的计算方法有很多种,我采用基

2020-08-20 16:21:13 12081 3

微机原理与接口技术 第一章 思维导图

由xmind制作的微机原理第一章的思维导图,有助于理解知识点,也可以进行补充和扩展,审核为什么总是不过?

2019-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除