asdv78901-CSDN博客

转载 ResNet论文笔记

其实ResNet这篇论文看了很多次了，也是近几年最火的算法模型之一，一直没整理出来（其实不是要到用可能也不会整理吧，懒字头上一把刀啊，主要是是为了将resnet作为encoder嵌入到unet架构中，自己复现模型然后在数据集上进行测试所以才决定进行整理），今天把它按照理解尽可能详细的解释清楚跟大家一起分享一下，哪里没有说明白或者说错的，欢迎指出留言。深度残差神经网络（Residual...

2019-09-26 23:37:00 299

转载卷积的参数计算

假设一个卷积层的输入的特征图（feature maps）数量（input channels）为“n”，输出为特征图数量为“m”，卷积核（kernel size）为“k”。假设我们处理的是一个2D的卷积操作，卷积层对应的输入的参数量为k * k * n，与此同时，由于输出为m通道的特征图数量，为了映射到输出卷积层需要学习（k * k * n）* m个参数，但是这里不能忽略掉偏差项（由z =...

2019-09-14 21:23:00 317

转载归一化（Normalization）和标准化（Standardization）

归一化和标准化是机器学习和深度学习中经常使用两种feature scaling的方式，这里主要讲述以下这两种feature scaling的方式如何计算，以及一般在什么情况下使用。归一化的计算方式：上述计算公式可以将特征的值规范在[0, 1]之间，使用归一化来进行feature scaling一般是要求所有参数都处于正值范围。标准化的计算公式：通过...

2019-09-11 23:37:00 348

转载解开Batch Normalization的神秘面纱

停更博客好长一段时间了，其实并不是没写了，而是转而做笔记了，但是发现做笔记其实印象无法更深刻，因此决定继续以写博客来记录或者复习巩固所学的知识，与此同时跟大家分享下自己对深度学习或者机器学习相关的知识点，当然浅薄之见如有说错表达错误的，欢迎大家指出来。废话不多说，进入今天的主题：Batch Normalization。Batch Normalization（BN）是由Sergey I...

2019-09-11 23:23:00 154

转载 word2vec是如何工作的？

如何有效的将文本向量化是自然语言处理（Natural Language Processing: NLP）领域非常重要的一个研究方向。传统的文本向量化可以用独热编码（one-hot encoding）、词袋模型（bag-of-words）和TF-IDF等方式，但是以上得到的文本向量可能维度都很好，在一些情况下可能并不适合进行NLP建模，如基于大量文本用独热编码的方式得到的向量维度是非常大的...

2019-02-21 17:00:00 141

转载 TF-IDF与主题模型 - NLP学习（3-2）

分词（Tokenization） - NLP学习（1）N-grams模型、停顿词（stopwords）和标准化处理 - NLP学习（2）文本向量化及词袋模型 - NLP学习（3-1）在上一篇博文中，简单地阐述了如何将文本向量化及词袋模型的。文本向量化是为了将文本转换成机器学习算法可以直接处理的数字，直白点说就是这些转换后数字代表了文本的特征（此过程称之为特征提取或者特征编码）...

2019-02-14 16:48:00 402

转载基于规则的中文分词 - NLP中文篇

之前在其他博客文章有提到如何对英文进行分词，也说后续会增加解释我们中文是如何分词的，我们都知道英文或者其他国家或者地区一些语言文字是词与词之间有空格（分隔符），这样子分词处理起来其实是要相对容易很多，但是像中文处理起来就没有那么容易，因为中文字与字之间，词与词之间都是紧密连接在一起的，所以第一件事需要处理的就是如何确认词。中文文章的最小组成单位是字，但是独立的字并不能很好地传达想要表达整...

2019-02-12 23:39:00 391

转载文本向量化及词袋模型 - NLP学习（3-1）

分词（Tokenization） - NLP学习（1）N-grams模型、停顿词（stopwords）和标准化处理 - NLP学习（2）之前我们都了解了如何对文本进行处理：（1）如用NLTK文本处理库将文本的句子成分分成了N-Gram模型，与此同时引入了正则表达式去除一些多余的句子成分；（2）将停顿词去除；（3）一些通用的标准化处理，如大小写、提取词干等。在这一节我们将看看...

2019-02-11 15:57:00 424

转载 N-grams模型、停顿词（stopwords）和标准化处理 - NLP学习（2）

在上一节《Tokenization - NLP（1）》的学习中，我们主要学习了如何将一串字符串分割成单独的字符，并且形成一个词汇集（vocabulary），之后我们将形成的词汇集合转换成计算机可以处理的数字信息，以方便我们做进一步文本分析。这篇博客的主题还是我们如何将文本转成成更有用的成分，让我们能从文本当中提取到更多的信息以便作为特征输入到模型中训练，首先会介绍一下N-grams算法，...

2019-01-02 14:15:00 502

转载分词（Tokenization） - NLP学习（1）

自从开始使用Python做深度学习的相关项目时，大部分时候或者说基本都是在研究图像处理与分析方面，但是找工作反而碰到了很多关于自然语言处理（natural language processing： NLP）的问题，所以决定花点时间学习并且写下来，希望那些跟我一样同时在学习NLP的朋友能有一些帮助，学习过程中以英文为文本标准，后期会尝试用中文，并且将相关的信息补进来博客文章中。刚开始学习哪...

2018-12-26 13:19:00 702

转载概述机器学习中的偏差与方差

在这篇博文中主要介绍下机器学习中的偏差和方差。在实际运用机器学习（或深度学习）模型的过程当中，总是会难免碰到一个问题，就是常说的偏差（Bias）与方差（Variance），及其之间的权衡（Bias-Variance Tradeoff），理解了机器学习中的方差和偏差有助于进一步理解机器学习算法的运作并且怎么样利用其他方式来更好的提高机器学习算法的表现，在介绍偏差和方差的过程中会一并讨论泛化...

2018-09-01 14:58:00 201

转载平衡二叉树（AVL Tree）

在学习算法的过程中，二叉平衡树是一定会碰到的，这篇博文尽可能简明易懂的介绍下二叉树的相关概念，然后着重讲下什么事平衡二叉树。（由于作图的时候忽略了箭头的问题，正常的树一般没有箭头，虽然不影响描述的过程，但是还是需要注意，所以还请读者忽略一下部分图的箭头）一、二叉（查找）树二叉查找树（Binary Search Tree）是二叉树的一种，其树节点（internal nodes ...

2018-08-31 19:18:00 219

转载算法分析 - 学习笔记

这篇博文主要会讲述基础的算法分析，对于算法分析主要是针对算法运行时间进行分析。几个需要注意的读法：Omega（Ω），Theta（Θ）和大O符号。一、算法分析 - 最坏情况分析法算法分析其实主要针对两方面，但是平时更多地所讲的一个算法的好坏通常是通过算法运行时间来衡量，如若一个算法运行时间短，则说明这个这个算法的针对某个问题的执行效率不错，反之则说明算法较为低效。前面所说的算法...

2018-08-30 21:49:00 377

转载稳定匹配 - Stable Matching

这篇文章将会对稳定匹配算法进行介绍及Python代码的实现，第一部分会针对稳定匹配的Gale-Shapley算法进行解析，第二部分就是用Python对该算法进行实现。一、稳定匹配算法原理１.１　介绍稳定匹配（Stable Matching）问题就是假设现在有N个男生和N个女生跳舞选择伴侣，然后最开始的时候男、女生按照下面情况对彼此进行排序选择舞伴（见图１）：每个男生都...

2018-08-12 14:52:00 1329

转载 3D U-Net卷积神经网络

3D U-Net这篇论文的诞生主要是为了处理一些块状图（volumetric images），基本的原理跟U-Net其实并无大差，因为3D U-Net就是用3D卷积操作替换了2D的，不过在这篇博文中我会按照论文的结构大概介绍一下整体的原理及结构运用。当然在原本的论文中，论文作者为了证实框架的可执行性及实验的最终结果，是设立了两组不同的实验的，一个是半自动设置（即：人为地利用算法对3D图像...

2018-08-04 17:30:00 5493

转载 Python读取不同文件夹下的图片并且分类放到新创建的训练文件夹和标签文件夹...

在深度学习的训练时，经常会碰到训练的样本数据集和标签数据集是在一个文件夹中，这个时候我们就不得不进行一些数据的预处理和文件的分类，例如将训练（training data）数据集和标签数据集（label data）分别放到不同的文件夹或者将训练数据集按照分类放到类别文件中，这样子的操作是为了我们能方便的读取和处理相关的图片数据。这篇博文主要是讲我在做项目过程碰到的其中一中情况，就是训练样本...

2018-07-31 14:02:00 1617

转载 U-Net卷积神经网络简要解析（附基于TensorFlow自己实现的代码参考）

由于项目需要，用U-NET跑一个程序来对医学影像进行分割（segmentation），因此跑去看了下这篇论文（paper），下面会介绍一下U-Net的框架及要点，如果哪里有写的不对的，或者好的建议，欢迎提出并纠正。论文地址：https://arxiv.org/abs/1505.04597　　1.概要U-Net通俗来讲也是全卷积神经网络的一种变形，主要其结构经论文作者画出来形...

2018-07-31 13:33:00 3789

转载 Python中关于split和splitext的差别和运用

在使用Python的过程中，在处理字符串的时候会遇到split()和os.path.split()两个函数，他们的主要区别可以概括为一个从前往后搜索字符串，后者则是从后往前搜索 '.'（reverse search）。os.path.splitext()更多的运用在了搜索文件路径（path）和文件的扩展名（ext)，这两个组合在一起构成了完整的路径，如果使用正常的split()函数来...

2018-07-17 14:38:00 209

转载 Sublime Text 3搭建Python开发环境

Sublime Text 3（简称：ST3）是一个非常轻便的IDE，这篇博文主要介绍如何在ST3上搭建Python的开发环境（Windows 10）。1. 下载并安装完ST3之后，第一件要做的事情就是安装packgage control，安装了这个才可以为ST3搭配相关的开发插件，以便提高开发效率。Package Control的安装方法请参考：https://packagecont...

2018-07-14 21:32:00 149

转载入门机器（深度）学习的书籍及学习资料推荐

（第一次写博客，如有什么地方写得不对的，或者意见相左的，还请见谅！）工作了一段时间，又重新回来读书（本科计算机专业，第一个研究生是商科，现读回了计算机专业）了，最开始想着走APP研发路线的，但是最终回来读书之后却恰好碰上了so-called人工智能，所以就决定将专业设定为数据分析（Data Analytics），主要学习的课程方向是数据可视化分析，机器学习和深度学习等课程。刚回来读书...

2018-07-14 20:33:00 76

asdv78901的博客