碧影江白-CSDN博客

原创 ViT代码体会

Transformer 编码器由交替的多头自注意力层(MSA, 附录 A) 和多层感知机块(MLP, 等式 2, 3) 构成。在每个块前应用层归一化 (Layer Norm)，在每个块后应用残差连接 (Residual Connection)。一个Transformer Encoder Block就包含一个MSA和一个FFN，二者都有跳跃连接和层归一化操作构成MSA Block和MLP Block。图像本身大小是imgsize*imgsize，现在想要切成p...

2022-02-23 22:04:40 1355 1

原创普通用户安装局部cuda，cudnn（非默认路径）

之前在服务器的全局环境中的cuda被人瞎动破坏了（很气），现在做下在局部环境里的重装。首先下载好两个文件，下载位置是用户文件的首页地址。cuda和cudnn不多说，版本匹配做好。用xshell登录进入服务器，直接在默认环境下，激活环境：activate tf(环境的名字)。安装cuda：sh cuda_9.2.148_396.37_linux.run这里和全局用户添加不一样的在于没有sudo，因为普通用户没有sudo权限。安装时候的选项：这里的位置需要设置为自己.

2021-10-23 17:29:25 550

原创数据集制作、数据读取等在机器学习时可以用到的

在训练神经网络时，经常需要使用到某些数据制作、读取的代码，这里做个总结。方便以后使用。1、数据保存我制作的数据集，input为已经处理好的txt文件，label为xml文件，在保存时将它们保存为同名文件：以上为保存的数据名称和地址。2、制作数据集：先在相应的位置创建两个txt文件：train.txt、test.txt。然后运行以下代码。以下代码为将数据按照4：1的比例切割为训练集和测试集。import osimport randomxmlfilepath = "C..

2021-09-29 20:23:59 652

原创 python手动实现roi_pooling

roi_pooling首先在fast rcnn中被提出。其可以解决在rcnn中直接把图片resize操作所造成的信息丢失的问题。roi_pooling的规则为把任意大小的的特征矩阵转化为指定大小。具体转化规则为：把原矩阵按照一定的比例划分为各个部分，取该部分的最大值，复制到缓冲区，作为目标矩阵的值。很常见且很直观的一组图：很多资料都在使用faster-rcnn时把roi_pooling替换成了功能相似的roi_align，但当想要使用roi_pooling时发现找不到可以供我使用的接口。

2021-03-14 20:42:38 988 1

原创 python实现Otsu双阈值算法

Otsu双阈值算法的思想与单阈值的思想类似，单阈值的思想为：g = w0(u0-u)^2+w1(u1-u)^2使得g最大。Otsu双阈值的思想则为：g = w0(u0-u)^2+w1(u1-u)^2+w2(u2-u)^2使得g最大。u0为背景区域的平均值，u1为中间区域的平均值，u2为前景区域的平均值。w0为背景区域的概率，w1为中间区域的概率，w2为前景区域的概率。所以用python做简单的实现：def Otsu2Threshold(src): Thresho

2020-10-24 17:15:12 4244 11

原创 tensorflow读取一个模型后多次使用

训练好一个模型后，将其投入使用，会有在项目初始化后多次加载测试数据的需求，可以采用保存graph的思想实现（在一个项目中需要加载多个模型同样可用）另：这条博客接我的上一条https://blog.csdn.net/qq_34470213/article/details/104076898，是在上一个代码的基础上改写的。1、写一个初始化函数，用来初始化模型（项目中仅需初始化时调用一次）class Test(): def restore(self): self.mode

2020-07-06 20:22:45 2216 2

原创 python + tensorflow 神经网络多分类

新电脑的所有项目资料都没了，现在想搞一个简单的CNN多分类问题都还得重新写好麻烦，简单记录一下实现步骤，用于今后备用。1、以服装分类为例，在百度图片上搜了各类衣服的图片，裁成方块，分成5类，每一类都放到一个文件夹，为了方便取名0-42、裁剪成固定尺寸并且镜面旋转后阈值化操作（这里采用的是自适应阈值，也可不使用阈值化，灰度图亦可）重新保存。（原图路径D:/image，保存路径D...

2020-07-04 18:44:17 1885

原创数据库BC范式（BCNF）判断和分解

书中的概念：关系模式R〈U,F〉∈1NF。若X→Y且Y不包含X时X必含有码,则R〈U,F〉∈BCNF。也就是说,关系模式R〈U,F〉中,若每一个决定因素都包含码,则R〈U,F〉∈BCNF。由关系模式的定义可以得到如下结论，若R属于BCNF，则R有：1.所有非主属性对每一个码都是完全函数依赖。2.所有的主属性对每一个不包含它的码,也是完全函数依赖。3.没有任何属性完全函数依赖于非码的任何一组属性。我的理解：非码属性不要完全决定码属性，主属性也不要部分/传递依赖码属性，换.

2020-05-13 12:33:49 47914 9

原创基于RNN实现古诗词生成模型

我们知道，RNN（循环神经网络）模型是基于当前的状态和当前的输入来对下一时刻做出预判。而LSTM（长短时记忆网络）模型则可以记忆距离当前位置较远的上下文信息。在此，我们根据上述预判模型来进行古诗词的生成模型训练。首先，我们需要准备好古诗词的数据集：全唐诗共34646首，我把数据文件上传到了我的csdn中，又需要的可以下载http://download.csdn.net/download/qq...

2018-12-11 17:19:52 4813 4

原创 ROS关于movebase的局部路径规划代码解析

终于做完了机器人movebase路径规划算法的修改工作，现在把工作时写的笔记分享出来，希望可以起到搞清楚算法步骤的作用（建议配合代码一起食用）---------------------------------------------------------------------------trajectory_planner_ros.cppTrajectoryPlannerROS::co...

2018-10-26 15:51:47 6529 6

原创 tensorflow+python3训练网络模型，opencv3.4+C++调用

opencv3.3之后推出了DNN的神经网络接口，这样的OpenCV的中就可以调用tensorflow训练得到的网络了。我这里使用的版本是tensorflow1.4.0 + python3.5，搭建一个简单的模型，用来训练得到pb文件。opencv3.4.0 + VS2015，用来加载使用pb文件。训练PD文件。创建项目，新建save_pb.py。在该网络中，设置输入结点...

2018-08-12 12:48:37 3750 1

原创迁移网络的应用-图像风格迁移

图片风格迁移指的是将一个图片的风格转换到另一个图片中，如图所示：原图片经过一系列的特征变换，具有了新的纹理特征，这就叫做风格迁移。VGG网络在实现风格迁移之前，需要先简单了解一下VGG网络（由于VGG网络不断使用卷积提取特征的网络结构和准确的图像识别效率，在这里我们使用VGG网络来进行图像的风格迁移）。图1如上图所示，从A-E的每一列都表示了VGG网络的...

2018-06-24 19:54:12 4556 6

原创迁移网络的实现原理

补发一段对于迁移网络的学习笔记。手动训练一些层数较深的神经网络会花费大量的时间。我们可以利用一些常见的神经网络模型，使用已经训练好的参数，对图像的特征进行提取，这样来实现避免手动训练参数而花费太多时间的作用。函数主题非常简单，以Inception-v3来作为特征提取网络，我们将待训练图片通过Inception-v3，得到特征向量，使用一个全连接层将特征向量与label标签链接起来，这时我们需要训练...

2018-06-23 15:23:55 3048

原创梯度优化 SGD， BGD，MBD，Adagrad，Adadelta，Momentum，NAG，牛顿法

在腾讯的笔试题中，作者遇到了这样一道题：下面哪种方法对超参数不敏感：1、SGD2、BGD3、Adadelta4、Momentum神经网络经典五大超参数:学习率(Learning Rate)、权值初始化(Weight Initialization)、网络层数(Layers)单层神经元数(Units)、正则惩罚项（Regularizer|Normalization)显然在这里超参数指的是事先指定的le...

2018-04-09 21:14:49 4416 2

原创一百行代码实现一个GAN网络

GAN：对抗性生成网络，通俗来讲，即有两个网络一个是g（generator ）网络，用于生成，一个是d（discriminator）网络，用于判断。GAN网络的目的就是使其自己生成一副图片，比如说经过对一系列猫的图片的处理，g网络可以自己“绘制”出一张猫的图片，且尽量真实。d网络则是用来进行判断的，将一张真实的图片和一张由g网络生成的照片同时交给d网络，不断训练d网络，使其可以准确判断，将d网络生...

2018-04-04 15:50:20 3385 1

原创牛顿法和梯度下降法

牛顿法和梯度下降法的差别牛顿法：二次逼近梯度下降法：一阶逼近牛顿法：对局部凸的函数找到极小值，对局部凹的函数找到极大值，对不凹不凸的函数可能找到鞍点。梯度下降法：一般不会找到最大值，但同样可能会找到鞍点。在初始值合理的条件下，牛顿法的收敛速度＞梯度下降法的收敛速度牛顿法的计算难度更大（因为需要估计二阶导数）泰勒展开式：https://baike.baidu.com/item/泰勒公式/768148...

2018-03-20 21:31:30 757

转载 AI必知的十大深度学习算法

首先先让我们来定义一下什么是“深度学习”。对很多人来说，给“深度学习”下一个定义确实很有挑战，因为在过去的十年中，它的形式已经慢慢地发生了很大的变化。先来在视觉上感受一下“深度学习”的地位。下图是AI、机器学习和深度学习三个概念的一个关系图。AI的领域要相对较广泛，机器学习是AI的一个子领域，而深度学习是机器学习领域中的一个子集。深度学习网络与“典型”的前馈多层网络之间是有一些区别的，如下：深度学...

2018-03-17 15:24:53 82819 5

转载线程和队列

线程和队列在使用TensorFlow进行异步计算时，队列是一种强大的机制。正如TensorFlow中的其他组件一样，队列就是TensorFlow图中的节点。这是一种有状态的节点，就像变量一样：其他节点可以修改它的内容。具体来说，其他节点可以把新元素插入到队列后端(rear)，也可以把队列前端(front)的元素删除。为了感受一下队列，让我们来看一个简单的例子。我们先创建一个“先入先出”的队列（F...

2018-03-15 21:30:39 519

原创 MCTS学习笔记

MCTS树学习MCTS，即蒙特卡罗树搜索，是一类搜索算法树的统称，可以较为有效地解决一些搜索空间巨大的问题。如一个8*8的棋盘，第一步棋有64种着法，那么第二步则有63种，依次类推，假如我们把第一步棋作为根节点，那么其子节点就有63个，再往下的子节点就有62个…… 如果不加干预，树结构将会繁杂，MCTS采用策略来对获胜性较小的着法不予考虑，如第二步的63种着法中有10种是不可能胜利的，那么这十个...

2018-03-09 22:25:15 9285 2

转载 Tensorflow一些常用基本概念与函数

摘要：本文主要对tf的一些常用概念与方法进行描述。1、tensorflow的基本运作为了快速的熟悉TensorFlow编程，下面从一段简单的代码开始：import tensorflow as tf #定义‘符号’变量，也称为占位符 a = tf.placeholder("float") b = tf.placeholder("float") y = tf.mu

2017-11-19 15:07:02 211

原创（BP进阶2）学习和实现BP神经网络

在（BP进阶1）中说到了BP神经网络，现在就把神经网络的具体实现做一下简单的解析。BP的实现原理可以参考这里：http://blog.csdn.net/u013007900/article/details/50118945在上次的讲解中，我们说到了可以假设，那么yj表示神经元j的输出，函数f称为激活函数 ( Activation Functi

2017-11-18 20:46:41 586

原创（BP进阶1）从M-P模型到BP神经网络

M-P模型M-P模型，其实就是按照生物神经元的结构和工作原理来构造出来的比较简单的模型。下图为M-P模型的示意图：具体的推论详见http://blog.csdn.net/u013007900/article/details/50066315抛去繁重的公式，我们可以把这个模型理解为：要想下一个神经元接收到信息，那么接收到的信号一定要大于某一个阙值θ才能由输出信号y

2017-11-18 20:41:23 3723

手势识别图像数据，三种手势每种100张图片

人手做出的“剪刀石头布”三种手势，每种手势都有100张图片，图片的大小为58*58，是经过后期处理的图片，内含有所有图片路径的txt文件。

2018-08-13

opencv3.4.1cmake编译出的ffmpeg.dll，ffmpeg_64.dll，ippicv文件

ffmpeg.dll,ffmpeg_64.dll的文件名称为：b8120c07962d591e2e9071a1bf566fd0-opencv_ffmpeg.dll，dc9c50e7b05482acc25d6ce0ac61bf1d-opencv_ffmpeg_64.dll，请仔细检查与CmakeDownloadLog.txt文件名称是否一致，不一致请不要下载

2018-08-07