- 博客(88)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 python中文字符串转list
本文主要记录了将中文字符串转换为list的过程,其中我们使用了keras preprocessing中的text_to_word_sequence方法。这个方法是完全适配中文的。需要注意的是,中文语料一般字符之间是没有空格分割的,这与英文是不同的。如下所示,如果我们直接进行转换,由于没有空格分词,会将字符串默认为一个字符。from tensorflow.keras.preprocessing.text import text_to_word_sequencetext = '我是人'token = te
2022-01-02 11:31:05 1754
原创 You must install pydot and graphviz for plotmodel to work报错如何处理
本文主要记录windows-anaconda环境下关于使用tensorflow.keras.utils.plot_model()方法时提示安装pydot 和 graphviz的解决方法。pydot的安装非常简单,进入anaconda python环境中,用pip进行安装就可以了。graphviz包的安装就要稍显复杂一些。首先我们点击下方链接下载完整的graphviz包 :graphviz下载链接下载完毕后,我们需要将路径添加到我们的系统路径中。选择我的电脑,高级系统设置,环境变量,新建。将
2021-12-01 16:40:45 1435
原创 深度学习分布式训练小结
分布式训练本质上是为了加快模型的训练速度,面对较为复杂的深度学习模型以及大量的数据。单机单GPU很难在有限的时间内达成模型的收敛。这时候就需要用到分布式训练。分布式训练又分为模型并行和数据并行两大类。数据并行在于...
2021-10-25 22:23:04 1058
原创 pip国内加载速度慢解决方法
在国内使用pip安装包时有时会发现安装速度非常慢,甚至连接不上源。为了加快pip的下载速度,我们可以主动使用 -i命令来切换到国内源。下面放出实测好用的国内源 :清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东
2021-10-23 19:36:53 1029
原创 keras实现嘴唇图像autoencoder
本文分享了我在silent speech 项目过程中实现的基于嘴唇图像数据集的autoencoder自编码器。输入输出都是64∗6464*6464∗64的嘴唇灰度图。自编码器由编码解码两个部分构成,同时实现了利用checkpoint在每个epoch运算时,自动保存测试集loss更小的模型。数据集共包含84679张图片,其中前68728张图片作为训练集,后15951张图片作为测试集。import tensorflow as tffrom tensorflow.keras import layersf
2021-10-21 23:10:10 435
原创 机器学习理论梳理2 : KNN K近邻分类模型
本文主要梳理KPPV,K近邻模型的基本原理。从机器学习的大分类来看,K近邻模型属于监督学习中的一种判别式模型,常用于分类问题。初始的数据集中,包含了已经分类标签好的数据。一句话来说,K近邻模型就是通过计算实例与现有数据集中所有数据的数学距离,从中挑选出K个最近的例子。在这K个例子中,占据大多数的分类就是新的实例的分类。...
2021-10-21 20:34:06 536
原创 一文看懂卷积神经网络CNN的核心
在之前,我总结了关于计算机神经网络与梯度下降的核心,详见下文链接 :一文看懂计算机神经网络与梯度下降本文主要会对图像相关的机器学习中最为重要的网络,卷积神经网络作个人的理解分析。在讲述原理之前,我们先来解释为什么我们在图像及视频等等领域的机器学习中要使用CNN。我们都知道,使用多层感知器或者有隐藏层的神经网络可以帮助我们解决分类,聚合,回归问题。但当我们的输入输出转变为高维度的数据,例如图片时,不可避免地要面临神经元以及参数量过大的问题。假设我们使用一张720*480的图片作为输入,一张图片对应的参数
2021-10-20 16:45:11 1167
原创 python numpy 分离与合并复数矩阵实部虚部的方法
在进行数字信号处理的过程中,我们往往有对短时傅里叶变换频谱(spectrogram)进行分析的需求。常见的分析手段对应欧拉公式分为两种,要么使用模与相位的形式,要么使用实部虚部。本文分享一个简单的将复数光谱图分解为实部与虚部以及将两个部分重新合并为一个复数矩阵的过程,以下为python代码。
2021-05-10 21:39:07 4910
原创 keras中mean square error均方误差理解
机器学习中,针对不同的问题选用不同的损失函数非常重要,而均方误差就是最基本,也是在解决回归问题时最常用的损失函数。本文就keras模块均方误差的计算梳理了一些细节。
2021-04-14 03:21:44 3533
原创 keras模型中的默认初始化权重
权重的初始化,决定了模型训练的起点。一个良好的初始化可以加快训练过程,同时避免模型收敛至局部最小值。为了在训练过程中避免使得权重的变化总沿着同一个方向,我们尽量避免将所有权重都初始化为同一个值,如全0矩阵或全1矩阵。往往我们使用均匀分布或者正则分布初始化权重矩阵。在使用tensorflow框架时,keras为我们提供了许多封装好的层,其中常见的有Dense全连接层,Conv2D卷积层等等。查阅文档我们发现默认的权重初始化都使用了glorot uniform :Wij⇝U(−6n+m,6n+m) W_{i
2021-03-28 23:50:42 3137
原创 cannot find output in imported module librosa报错解决
将音频写入wav文件liborsa soundfile 模块
2021-03-03 04:34:29 1416 1
原创 autoencoder自编码器原理以及在mnist数据集上的实现
Autoencoder是常见的一种非监督学习的神经网络。它实际由一组相对应的神经网络组成(可以是普通的全连接层,或者是卷积层,亦或者是LSTMRNN等等,取决于项目目的),其目的是将输入数据降维成一个低维度的潜在编码,再通过解码器将数据还原出来。因此autoencoder总是包含了两个部分,编码部分以及解码部分。编码部分负责将输入降维编码,解码部分负责让输出层通过潜在编码还原出输入层。我们的训练目标就是使得输出层与输入层之间的差距最小化。我们会发现,有一定的风险使得训练出的AE模型是一个恒等函数,这是一.
2021-02-18 07:43:33 4722 2
原创 GAN生成对抗网络基本概念及基于mnist数据集的代码实现
GAN(Generative Adversarial Networks) 生成对抗网络的基本原理及其在mnist数据集上的实现。使用Tensorflow API实现
2021-02-02 03:52:02 2153
原创 机器学习模型中step与epoch,batch_size之间的关系
本文主要谈谈自己对step,epoch,batch_size这几个常见参数的理解。
2020-11-14 01:39:35 17551 2
原创 Anaconda安装tensorflow报错问题解决方法
最近脱离了googlecolab想使用本地的anaconda进行机器学习课题的演练,在安装tensorflow时报错 : UnsatisfiableError: The following specifications were found。下面给出解决方法。
2020-10-30 22:38:10 2334
原创 一文看懂计算机神经网络与梯度下降
本文着重介绍了计算机神经网络的基本构成,及梯度下降算法在神经网络中的运用,包括了反向传播算法及如何使用tensorflow计算梯度。
2020-10-14 17:16:24 899
TA创建的收藏夹 TA关注的收藏夹
TA关注的人