自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 Transformer(seq2seq、self-attention)学习笔记

decoder中的multi-head attention是带有masked,因为decoder的输出结果是一个一个输出的,训练decoder模型希望它能够根据已有的输出信息得到输出结果,decoder只能看到左侧的内容,不能看到右侧的内容。将encoder输出的k向量与decoder输出的q向量计算点乘,在将得到的结果与v向量做点乘,得到的向量结果再进行Fully connection操作。(2)指定一个分厂大的值作为输出序列的长度,知道输出END,只保留END之前的内容作为decoder的输出。

2023-12-29 23:42:36 1123

原创 Self-attention学习笔记(Self Attention、multi-head self attention)

self attention

2023-12-29 00:29:11 1064

原创 UNet、U²Net医学图像分割网络

对于医学图像的分割任务,这里使用UNet网络实现CT影响的病灶区域分割任务。记一篇学习笔记。

2023-12-21 00:13:09 502

原创 DBNet文本检测网络 (FPN、batch normalization、Transpose conv)

DBnet网络结构与相关技术

2023-12-19 20:41:19 1040

原创 语义分割网络-FCN全卷积网络

语义分割全卷积神经网络结构

2023-12-05 21:59:03 822

原创 BP神经网络计算过程

网络中神经元的理解神经网络是由大量的神经元相互连接构成。每一层的神经元之间通过权值连接。前一层的神经元经过加权计算和激活函数得到下一层神经元的值。反向传播的思想反向传播的思想:从输入神经元开始,利用上述神经元的计算方式计算出网络的输出,计算完了过输出和标签之间的偏差(损失),计算损失函数相对于每一个神经元的梯度,在梯度反向传播的过程中更新权值,不断迭代,直至收敛。前向传播和反向传播的过程前向传播:加权求和并通过激活函数计算。以sigmod激活函数为例sigmod(wx+b)反向传播过程:利

2020-12-06 20:28:47 3214

原创 目标检测 我好像明白了一个好久之前面试时候没回答上来的一个问题 - _-|||

我好像明白了一个好久之前面试时候没答上来的一个问题 - _-|||

2020-12-05 23:14:06 610

原创 YOLO系列算法----学习笔记

本文学习笔记整理自https://www.bilibili.com/video/BV1yi4y1g7ro?p=4参考博客:https://blog.csdn.net/qq_37541097/article/details/81214953YOLO V1、YOLO V2、YOLO V3论文链接提取码:a70x1、YOLO v1YOLO V1的思想将原始图片划分成s×s的网格(grid_cell),如果object的中心落在这个网格内,则这个网格就负责预测这个object。每一个网格预测b个bou

2020-10-24 12:01:12 857

原创 focal loss 笔记

focal loss论文笔记首先focal loss解决的是one-stage目标检测算法中正负样本不平衡的问题。(极端前景和背景数量不平衡的问题)参考博客:Focal Loss理解

2020-09-14 17:46:38 148

原创 YOLO 目标检测网络学习笔记

YOLO v11、核心思想YOLO算法的核心思想是,将整张图片作为输入,利用网络的输出结果直接回归预测出bounding box的调整参数和物体所属类别。2、结构流程YOLOv1的整体结构流程是,对于一张输入的图片进行特征提取,输出的特征层可以看做把原始图片划分成s×s的网格,如果我替的中心点络在某一网格内则这个物体就由该网格负责预测。每一个网格有B个bounding box.除了需要预测Bounding box位置信息,还需要预测一个值confidence,这个值在faster CNN网络中是没

2020-08-31 11:35:53 2148 1

原创 Faster RCNN算法学习笔记----整体结构、RPN原理、Roi pooling层

Faster RCNN算法笔记1、FasterRCNN网络整体结构对于一张输入图片,将短边resize成600大小,输入到Faster RCNN特征提取网络中,提取出特征层feature map,将feature map输入到RPN网络中,生成一系列的候选框。RPN的核心思想是滑动窗口和anchor机制。将一系列的候选框输入到Roi pooling层中,利用候选框在feature map上进行截取,这些框转化成相同大小的section,最后通过全连接层进行分类预测和回归预测。而且,在训练的过程中,Fa

2020-08-28 18:04:08 570

转载 卷积操作基础----笔记(一)

卷积操作参考博客:https://blog.csdn.net/Biyoner/article/details/889162471、卷积神经网络的核心思想https://www.zhihu.com/question/47158818/answer/670431317卷积神经网络的两大核心思想核心思想:局部连接、权值共享这两大思想的作用就是减少参数量,节省运算时间和空间。如何理解局部连接和权值共享。局部连接这种说法是相对于传统神经网络,用矩阵乘法来建立输入与输出关系的。每一个输出与每一个输入

2020-08-24 23:56:32 830

原创 SSD目标检测算法--预测过程(解码)和训练过程(编码)

SSD目标检测网络1、SSD目标检测网络的整体结构SSD网络输入图片的大小为300×300×3,特征提取网络使用的是VGG16模型,提取到6个不同大小的特征层。特征层可以看做是把图片划分成不同的网格,每一个网格上对应有多个先验框。利用SSD网络的预测结果对先验框进行调整得到最后的预测框。 38×38每个网格对应4个先验框、19×19每个网格对应6个先验框、10×10每个网格对应6个先验框、5×5每个网格对应6个先验框、3×3×256每个网格对应4个先验框、1×1每个网格对应4个先验框。2、SS

2020-08-23 00:06:48 3372 1

原创 DenseNet论文学习笔记

DenseNet论文学习笔记论文链接:Densely Connected Convolutional Networks图片来自论文受残差网络(ResNet)的启发,在较深的网络中使用shortcut来提高模型的准确率,使训练更有效。原始的CNN网络,包含L个层,则有L个连接,在DenseNet网络中如果包含L个层,则有L×(L+1)/2个连接。DenseNet网络有以下优点减缓梯度消失增强特征传播特征重复使用大大减少参数量在引言中引用提到,已有的方法例如:ResNet、Highwa

2020-08-17 00:34:00 279

原创 Faster RCNN网络的预测过程(解码)和训练过程(编码)

Faster RCNN网络的解码过程和编码过程1、解码过程(预测过程)解码过程分为两部分:对先验框进行调整的解码过程对建议框进行调整的解码过程1.对先验框进行调整RPN网络的输出结果进行解码,对先验框进行调整得到建议框。首先提取原始图片的宽高、复制原始图片。把图片的较短边固定为600 大小,对图片进行resize操作,并且进行归一化预处理操作,将原始图片转化成numpy 的格式。在函数detection_out函数中将rpn网络的输出结果进行解码:首先通过置信度对先验框进行筛选;在函数中

2020-08-15 18:23:38 2316

原创 .jpg图片生成.mp4视频文件 python代码

一朵花从花蕊到开放大概4个小时左右。每隔10 min拍摄一张照片,一共25张照片。生成视频代码如下:import cv2import osdef get_file_names(search_path): for (dirpath, _, filenames) in os.walk(search_path): for filename in filenames: yield filename # os.path.join(dirpath, file

2020-07-30 00:23:12 3005 2

原创 SSD目标检测网络学习笔记--Tensorflow框架(附代码链接)

SSD目标检测网络SSD网络概述SSD网络将输入的图片resize成300×300的大小。用深度神经网络进行特征提取。得到不同大小的特征层(38×38×512,19×19×1024,10×10×512, 5×5×6, 3×3×256, 1×1×256)。每个特征层可以看做对图片划分成不同的网格,每个网格对应若干先验框。训练的过程是对先验框进行调整的过程。这6中不同大小网格,每一个网格对应的先验框的个数为:(4, 6, 6, 6, 4, 4)。计算得到一共需要计算先验框的个数为:38×38×4+

2020-07-29 20:23:33 636 1

原创 Faster RCNN目标检测算法的训练过程(附代码)(2)

Faster RCNN目标检测算法的训练过程本文代码来自https://github.com/bubbliiiing/faster-rcnn-kerasFaster RCNN网络的训练过程可分为两部分:1. 建议框网络的训练2. classifier模型的训练1、RPN网络的训练(1)预处理在train.py中,首先定义网络训练的参数。if __name__ == "__main__": config = Config() NUM_CLASSES = 3 # 训练50

2020-07-21 16:07:45 1213

原创 Faster-RCNN网络实现目标检测----pytorch

pytorch框架实现faster-RCNN网络https://blog.csdn.net/weixin_44791964/article/details/105739918代码来自:https://github.com/bubbliiiing/faster-rcnn-pytorch1 faster-RCNN网络概述Faster-RCNN是一种two-stage的目标检测方法,(与one-stage方法相比two-stage的目标检测方法检测精度高,但是速度较慢)Faster-RCNN网络对

2020-07-19 00:34:27 1756

原创 梯度消失和梯度弥散现象形成的原因和解决方法

1 梯度消失和梯度爆炸产生的原因https://blog.csdn.net/yhily2008/article/details/80790476在神经其网络的参数训练过程中,BP(Back Propagation)算法非常重要。BP神经网络工作流程分两步:(1)正向传播输入信号,输出分类信息(对于有监督学习而言,基本上都可归属于分类算法);(2)反向传播误差信息,调整网络的权值(通过微调网络参数,让下一轮的输出更加准确)。基于loss函数反向微分调参(链式求导的方法),寻求最优解。隐藏层中的激活函

2020-07-09 00:25:52 3752

原创 背景建模(混合高斯模型)----opencv python(附代码)

混合高斯模型进行背景建模项目理论和源码来自唐宇迪opencv项目实战

2020-07-04 01:04:05 5501

原创 Faster RCNN(目标检测算法)(1)

Faster RCNN目标检测算法(Two-stage目标检测算法)https://blog.csdn.net/daodanxiansheng/article/details/83340773Two - stage 和One - stage目标检测算法的综述。Two-stage目标检测算法

2020-07-03 01:58:09 683 1

原创 目标捡测网络学习笔记----SSD网络

SSD网络1、特征提取网络2、提取到的特征进一步处理3、先验框

2020-06-29 19:48:21 761

原创 答题卡识别任务--opencv python(附代码)

答题卡识别项目理论和源码来自唐宇迪opencv项目实战记一篇python-opencv 完成答题卡识别 项目的学习笔记输入一张特定格式的答题卡图片(答题卡中题目数量和选项个数是固定的),能够输出此答题卡中答案的准确率。运行效果如下:输入一张答题卡图片输出结果对于这类任务,先整理一下图像处理的思路。我们输入的是一张答题卡的拍摄图片,而我们要处理的是这张答题卡的内容,需要用到透视变换将答题卡的内容单独拿出来;提取答题卡中填涂区域的轮廓,并进行二值化处理,利用掩模与二值化后的答题卡进行对比

2020-06-26 01:40:51 6424 4

原创 MTCNN----人脸识别(附代码)

人脸识别(mtcnn和MobileNet),判别是否佩戴口罩https://www.bilibili.com/video/BV1i741177hd?p=2https://www.bilibili.com/video/BV1fJ411C7AJ用MTCNN网络识别人脸用MobileNet网络训练模型1、MTCNN网络结构

2020-06-20 01:32:38 1906

原创 深度神经网络学习笔记----Keras框架用自己的图像数据构建网络模型,用Tensorboard显示 loss,acc,val_loss, val_acc

深度神经网络学习笔记----ResNet

2020-05-28 01:11:30 1264

原创 深度神经网络学习笔记----AlexNet

深度神经网络学习笔记–AlexNethttps://blog.csdn.net/weixin_44791964/article/details/102748770用AlexNet网络构建一个图像分类模型padding 的计算方法,看了无数遍,就是记不住same:out = in/s 向上取整valid: out = (in-f+1)/s 向上取整...

2020-05-21 17:27:42 3901

原创 深度学习 BN 、LeakyReLU算法原理

YOLO V3网络结构

2020-05-18 23:52:27 6992 1

原创 Keras框架 基于YOLO V3和卡尔曼滤波的视频行人轨迹跟踪(附代码链接)

Keras框架 基于YOLO V3和卡尔曼滤波的视频行人轨迹跟踪算法(代码)刚刚算是完成一个完整的项目,记一篇絮絮叨叨的学习笔记,一开始兴致勃勃,后来焦头烂额地学YOLO V3的时候,YOLO V4已经悄悄出来啦。小白深感学的速度赶不上更新的速度啊题目描述:多目标检测与跟踪任务,要求跟踪图片中的行人(走路的行人和骑车的行人),遮挡,背景变换等干扰,自动初始化、自动终止,目标的区分还有跟丢再识别等问题。按照规定的格式输出目标跟踪的结果。采用的算法分为目标检测部分和目标跟踪部分,两部分是独立的。使

2020-05-17 13:49:38 3513 3

翻译 小波包变换用于抑制噪声和信号压缩Noise suppression and signal compression using the wavelet packet transform论文学习笔记

Noise suppression and signal compression using the wavelet packet transform论文:https://www.sciencedirect.com/science/article/abs/pii/S0169743996000779论文可能会用到小波包变换,记下一篇论文学习笔记该走的路一步都不会少...

2020-04-30 23:30:28 992

原创 YOLO V3目标检测算法----学习笔记

YOLO V3目标检测算法–学习笔记代码:https://github.com/bubbliiiing/yolo3-pytorchhttps://blog.csdn.net/weixin_44791964/article/details/105310627https://www.bilibili.com/video/BV1Hp4y1y788?p=7YOLO V3算法分为三个部分:主干特...

2020-04-26 15:06:17 394

原创 生成对抗网络(GAN、DCGAN、ACGAN)-----学习笔记

生成对抗网络学习笔记生成对抗网络有两个关键结构:生成模型、判别模型。生成模型:输入是一个服从正态分布的N维向量,利用这个N维向量生成一张图片。判别模型:对于生成模型输出的图像判别它是不是真的图像。生成模型和判别模型的博弈关系在于:生成模型的目的是生成让判别模型无法判别真伪的图像,而判别模型的目的是判断输入图像的真伪。结合代码来看生成对抗网络中,生成器和判别器的训练过程:判别模型的训...

2020-04-22 00:04:26 3869 1

原创 深度神经网络学习笔记----MobileNet、MobileNet_v2、MobileNet_v3

深度神经网络学习笔记----MobileNethttps://www.bilibili.com/video/BV1mJ411d7dG?p=9https://blog.csdn.net/weixin_44791964/article/details/102819915MobileNet是一种轻量级的深度可分离卷积。区别于原始的卷积操作:原始的卷积操作当输入的shape 为:whc,用n个fi...

2020-04-20 01:10:11 588

原创 Mask-RCNN网络——实例分割

Mask-RCNN网络——实例分割

2020-04-16 15:03:14 5636 1

原创 伪彩色图像处理 python,matlab代码

伪彩色图像处理刚萨雷斯数字图像处理伪彩色图像(也称假彩色图像)图像处理包含根据特定标准对灰度值赋予颜色。伪彩色图像用于区分对单色图像赋予彩色的处理和与真彩色图像相关的处理。因为人眼对彩色图像更为敏感。(人眼可以辨别几千种色调和强度,相比之下却只能辨别20几种灰度。)可以说,伪彩色图像是对灰度图像灰度级的可视化和解释。1 灰度分层最简单的对于一张灰度图像,每一个像素点都对应一个灰度值。...

2020-04-11 13:08:45 11314 2

原创 深度学习框架、matplotlib、Matlab官方文档----压箱底用

keras框架matplotlibMATLAB

2020-04-03 00:20:08 291

原创 停车场车位识别 opencv(二)-----模型训练 Keras框架 VGGNet

停车场车位识别,基于keras框架训练网络模型本项目理论和源码来自唐宇迪opencv项目实战上一节已经对视频截取的停车场图像进行一系列的数组图像处理操作,生成了车位中不同状态的图片数据集,接着我们用此数据集,寻拉你个深度学习的模型,目的是当输入一张停车场的图片能够识别出当前有多少空车位以及车位的位置。先上代码train.pyimport osfrom keras import appl...

2020-04-01 20:14:05 2010 7

原创 停车场车位识别 opencv(一)----数据处理

停车场车位识别,opencv图像预处理,训练网络模型项目理论和源码来自唐宇迪opencv项目实战本项目的目的是设计一个停车场车位识别的系统,能够判断出当前停车场中哪些车位是空的。任务共包含部分:1.制作数据集,从停车场的监控视频中提取图片,使用数字图像处理技术制作数据集。2.利用上一步制作的数据集,训练神经网络模型,能够识别停车场中有哪些剩余车位。1 数字数字图像处理 opencv...

2020-03-31 23:00:32 5424 1

原创 用keras框架训练图像分类模型----学习笔记

学习opencv 停车场车位识别,用到神经网络模型训练,使用keras框架。记下一篇学习笔记。keras中文文档keras 官方文档中总结了keras框架的几个指导原则:用户友好模块化(在我们构建自己的神经网络时候, 特别是神经网络层、损失函数、优化器、初始化方法、激活函数、正则化方法,它们都是可以结合起来构建新模型的模块。)易于扩展基于python 实现keras 的核心数据结...

2020-03-28 18:57:48 423

原创 全景图拼接 特征匹配 附代码

全景图拼接项目本项目和源代码来自唐宇迪项目实战课程先放代码ImageStiching.pyfrom Stitcher import Stitcherimport cv2def resize(img): height, width = img.shape[:2] size = (int(width*0.4), int(height*0.4)) img_resi...

2020-03-26 00:38:23 2231 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除