自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

MirrorN的博客

技术连接你我

  • 博客(193)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 ImportError: libcudnn.so.7: cannot open shared object file错误以及非root用户安装cudnn

关于ImportError: libcudnn.so.7: cannot open shared object file错误以及非root用户安装cudnn使用 Tensorflow 的时候出现了错误Tensorflow:ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory从报错信息上来看,就是libcudnn.so.7文件没有找到。首先检查是否是cuda的链接出现了错误,Import

2020-07-07 14:24:29 5204

原创 TIP-LAS 藏语分词工具使用

最近处理藏语语料的时候找到了李亚超老师的TIP-LAS,详细介绍可见论文: TIP-LAS:一个开源的藏文分词词性标注系统这个工具可以对藏语进行分词、词性标注处理。只是使用时遇到了一些问题,在此记录。1.安装论文中给出的github项目地址已经失效,现在的下载地址可见:TIP-LAS: An open source toolkit for Tibetan word segmentation and part of speech tagging。安装方法已经在文档中详细写出,我是在Linux环境下使用

2020-06-02 18:27:22 3733 16

原创 LaTex初次使用资料汇总

LaTex 使用最近由于课程需要,要使用LaTex,初次使用,找错误找到崩溃。。。不过LaTex的输出确实是好看啊,在这里要吐槽一些博客,点开一看,只有一个网址,然后打开,又是一个网址???应该向所有博主推一条 “严禁套娃”的消息才对嘛。。。言归正传,说一下最直观的感受,如果出现了不明白原因的错误,例如明明感觉语法格式没有问题,但是却报错了,首先要尝试的方法就是…删除生成的文件重新生成一遍,虽...

2020-04-25 21:43:47 604

原创 关于torch.bmm()函数计算过程

很多框架中提供的矩阵乘法都是出于简化计算的考虑,很多情况下在进行计算时候都会牵扯到 batch size 这一个维度,这就使得很多矩阵的计算是三维的,Pytorch中的bmm()函数就可以很方便的实现三维数组的乘法,而不用拆成二维数组使用for循环解决。在查资料的时候发现有些博客写的有些小地方不太对,而且有很多提问都是关于 bmm()函数具体是如何计算的,因此记录。文章目录1.torch.bmm...

2020-03-28 09:54:46 18877 2

原创 RNN 、LSTM、 GRU、Bi-LSTM 等常见循环网络结构以及其Pytorch实现

这篇文章主要是对之前一段时间里接触到的 循环神经网络 的相关知识进行一些总结,包括个人觉得初学难理解或者需要注意的问题和如何使用Pytorch的相关函数。由于这些经典结构网上资料很多,所以一些通识不再陈述,偏重代码部分。文章目录1.RNN2.LSTM3. GRU4. Multi-Layers-LSTM4. Bi-LSTM5.参考1.RNN很多问题都归结于序列信息的处理,例如 speech r...

2020-03-19 00:18:47 8631 1

原创 关于 Numpy 以及 Pytorch 的数组shape的一点总结

文章目录1.数组中数据存储的结构2.数组的坐标问题3.对于Pytorch 的shape相关问题4. Pytorch 中几个常见的有关维度的函数4.1 squeeze() 和 unsqueeze()4.2 permute() 函数不知道大家有没有类似的问题,处理数据的时候很多时候会被各种数组的 shape 的变化搞晕,但是这方面的资料又不太好找,这里记录一点我遇到的这方面的知识点。1.数组中数据...

2020-03-09 21:45:24 2089

原创 论文笔记:Recurrent Neural Network Grammars

1.简介“Recurrent Neural Network Grammars” 发表与NAACL 2016,这篇论文中提出了 RNNG 模型,在之后也有很多工作基于此,像URNNG(Unsupervised RNNG)和融合RNNG的NMT等。论文中首先介绍了RNNG的判别模型,然后进行了改动,定义了生成模型,然后又介绍了RNNG作为语言模型的效果。2.定义基础RNNG来源于统计自然语言处...

2020-01-06 21:02:10 1079 1

原创 论文笔记:Tree-LSTM结构的三篇论文总结

对于序列数据而言,从最早的 RNN 结构单元,后来衍生出了 LSTM 以及 GRU 等等变种,这些变种单元的功能更好,并且有效解决了RNN的梯度消失/爆炸问题。对于树结构信息来说也是如此,2015年,三篇论文同时期提出了 Tree-LSTM 的结构,分别是:Compositional Distributional Semantics with Long Short Term Memory(Ph...

2020-01-06 17:08:16 7673

原创 论文笔记:Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank 递归神经网络总结

“Recursive Deep Models for Semantic Compositionality Over Sentiment Treebank”这篇论文发表于 EMNLP 2013,主要作者是 Richard Socher,非常响当当的人物,在NLP方向的论文中,经常可以看到这个名字, Socher的在2010-2015年间的很多工作都与递归神经网络有关,Recursive Neura...

2020-01-05 23:23:54 1080

原创 Matplotlib饼图、环图绘制代码

不只是饼状图,Matplotlb的官网上Example页面下有各种图表的例子(Matplotlib-Examples),因此,如果想要绘制图表,建议先到官网上看一看,挑选合适的图表,如果不懂的话,再找其他资料学习。最近需要绘制饼状图(其实是环状图),其实简单绘制的话是很简单的,但是对参数进行一些调整的话会使图表变得很好看,这里重点记录一下pie()函数的一些重要参数,同时记录一下这份代码作为De...

2019-11-25 19:01:44 1180

原创 MSTParser工具使用

前言最近做实验用到一个句法分析工具 MSTParser,关于句法分析的工具,目前使用比较多的是 Stanford 的工具,资料也容易找,但是这个MSTParser,资料是真的难找啊。我的任务是用这个工具测试对一些藏语数据建立句法树,由于资料比较少,所以也只是参考了官网README文件和一些远古时期的博客,在这里记录一下使用的过程(Windows环境下),方便日后查阅。1.安装1.1 官网 &...

2019-11-15 10:34:52 434 1

原创 论文笔记:Reasoning about Entailment with Neural Attention

写在前面Attention mechanism 作为一种模型效果提升的方法,再很多领域都有应用,这篇论文也算是学习 Attention mechanism的经典论文之一,文中提出了一种 Attention based 的神经网络模型,用于文本蕴含推理,并取得state-of-art 的结果(当时)。文中最主要的模型是建立 word-by-word Attention 模型,与之做对比的还有几...

2019-11-03 14:06:04 781

原创 论文笔记:Neural Machine Translation by Jointly Language Learning to Align and Translate

写在前面Attention 机制在许多领域中都有应用,这些模型都被称为 Attention Based Model,而这篇论文则是将注意力机制应用在神经网络机器翻译中,论文的思路很清楚,首先介绍了传统NMT系统的缺陷,然后针对这一缺陷提出改进,最后实验证明,并进行定量以及定性分析。首先我们要了解经典的Seq2Seq模型是如何进行翻译的:整体模型使用了一个 Encoder 和一个 Decoder...

2019-11-01 21:22:54 299

原创 论文笔记:Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation

论文学习:Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation这篇论文算是 Seq2Seq(Sequenc to Sequence) 的经典论文了。文中提出了一种新的RNN模型结构用于机器翻译等工作,此外,作为LSTM单元的变种和简化版本 GRU 单元也是在文章中...

2019-10-10 21:33:40 1420

原创 Git使用

本篇主要记录Git使用过程中的一些常用操作以及命令。如果想要更详细地学习,可以参考这几个网站:廖雪峰 Git 教程Git 教程 菜鸟教程另外推荐一个好玩地学习Git地网站,可以玩玩。Oh Shit, Git !?!文章目录1. Git使用的整个流程2.本地创建仓库3. 提交相关的命令4. 查看日志、版本回退、撤销相关5.配置个人信息相关6.查看文件信息7.关于文件删除8.从Github...

2019-10-05 20:21:59 199

原创 TensorFlow记录(二)

文章目录1.tf.contrib.learn.VocabulayrProcessor()函数1.tf.contrib.learn.VocabulayrProcessor()函数这个函数输入文本数据,以及指定句子包含单词长度,可以将文本数据转化为索引形式,但是目前来看,好像不能按照词频大小进行排列,只是单纯地按照单词出现的顺序创建词典,按照词典将句子处理成索引形式。注意对象内置的几个属性,可以...

2019-10-03 21:49:04 185

原创 TensorFlow的报错信息

学习TensorFlow的过程中最不缺的就是各种报错。痛定思痛,记录一下学习中遇到的错误~文章目录1. UnicodeDecodeError:'gbk' codec can't decode byte 0xa3 in position 29: illegal multibyte sequence2.TypeError: Failed to convert object of type 1. Un...

2019-10-03 21:47:33 842 1

原创 论文笔记:Convolutional Nerual Network for Sentence Classification

Convolutional Nerual Network for Sentence Classification论文链接:Convolutional Neural Network for Sentence Classification文中建立了一个一层卷积层和一层全连接层组成的网络,实现文本分类任务。Introduction在 Introduction 部分中,开始介绍了一些深度深度神经网...

2019-09-20 11:19:14 187

原创 Python a = a + b 与 a+= b 问题

今天又遇到了这个问题,关于变量在函数内外定义以及修改的问题,在这里简要总结一下:可变与不可变对象首先这个问题归根结底是Python变量机制中的可变与不可变对象,Python中万物皆对象,简单来说,不可变对象有这几种:int float str bool tuple而可变对象有(一般自定义的类也是可变对象):list set dict所谓可变与不可变,也就是创建对象之后,...

2019-09-14 20:04:26 2433

原创 sklearn中TF-IDF值的计算方式

关于TF-IDF值,首先简单地提一下:TF(Term Frequency),也就是词频,这个定义很直观,也就是某个词语地频数除以整个文档的总词数:TF=某个词语出现次数文档总词语数TF=\frac{某个词语出现次数}{文档总词语数}TF=文档总词语数某个词语出现次数​对于IDF(Inverse Document Frequency)也就是“逆文本频率”,这个值主要是用来限制单纯使用TF值...

2019-09-09 17:35:46 6605 3

原创 Tensorflow 错误:TypeError: Fetch argument XXXX has invalid typeXXXX,must be a string or Tensor

今天在训练一个小模型的时候,出现了这样的错误:TypeError: Fetch argument 2.19779 has invalid type <class 'numpy.float32'>, must be a string or Tensor. (Can not convert a float32 into a Tensor or Operation.)在输出中可以看到...

2019-09-08 21:54:20 1869

原创 Python 记录(二)

文章目录1.关于sum等函数中keepdims参数1.关于sum等函数中keepdims参数Numpy中很多函数提供了 axis 参数,这个参数可以指定计算按照的方向,这里注意理解 “按照方向”,也就是在这个方向上进行 “压缩”, 也就是说是计算的方向,而非最后保存数据的方向。另一个参数则与之相关,keepdims 参数决定了是否保持原有的维度,当然,并非是填充成原来一摸一样的维度...

2019-09-07 14:26:10 113

原创 论文笔记:word2vec Parameter Learning Explained

论文地址:word2vec Parameter Learning Explained这是一篇讲解word2vec中计算方式以及参数更新方法的论文,之前在一篇介绍word2vec的文章中见到,所以决定还是读一读,Mikolov的两篇论文是很经典,但是对细节的解释很少,所以容易看晕,所以想要学习word2vec的细节计算的读者不妨看看这篇文章。同时...

2019-07-12 22:17:19 735

原创 二叉树重建

给定二叉树的先序遍历序列和中序遍历序列,进行二叉树的重建以及后序遍历队列。突然看到这个问题。。发现之前的想法都忘记了=_=||,果然算法题一日不写手生啊,还是得好好坚持练习才行啊。代码:#include<cstdio>#include<iostream>#include<cstring>using namespace std;struct nod...

2019-07-07 20:04:49 128

原创 NLTK数据包快速安装

使用Anaconda环境下,可以直接使用activate + 环境名的方式切到要安装nltk的环境下,然后使用conda install nltk进行安装,如果只是普通的python方式,则是可以使用pip install命令。当然,NLTK最麻烦的是它的使用需要一些较大的数据包,如果对自己的网速有信心,可以直接在切到安装环境后,使用python命令进入到python环境中,输入:import...

2019-07-06 09:42:18 17321 11

原创 TensorFlow记录(一)

记录学习TensorFlow过程中遇到的一些零散函数。文章目录1.函数 tf.contrib.keras.preprocessing.sequence.pad_sequences()2.错误 UnicodeDecodeError:'gbk' codec can't decode byte 0xa3 in position 29: illegal multibyte sequence1.函数 t...

2019-06-15 19:56:40 331

原创 TensorFlow实现word2vec(Skip-Gram、CBOW)代码记录

最近学习word2vec,发现一些文章写的有点,略。。(>﹏<),而且有些代码有错误,这里记录一些学习代码过程中的问题,这里构建的方式是Skip-Gram,代码不全部写出,只写一些觉得重要的地方。首先,如果想要了解详细的数学原理,可以移步word2vec中的数学原理,文档中写的非常非常详细,推荐度max。文章目录1.删除高频停用词2.构建数据集3.生成batch数据4.负采样计算5.关于词向量...

2019-06-10 21:01:00 2984 1

原创 sklearn模型训练报错:ValueError: Unknown label type: 'unknown'

测试一个简单的LogisticRegression模型,代码如下:import numpy as npimport pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.decompositi...

2019-05-26 10:51:28 19463 2

原创 sklearn函数记录

记录用到的一些sklearn的函数~文章目录1.关于CountVectorizer2.关于TfidfVectorizer1.关于CountVectorizer作用:统计所有的训练文本中,每个词语的词频,不考虑文本的顺序,所以,这里统计使用的方法是词袋法(Bag of Words),例如:from sklearn.feature_extraction.text import CountVec...

2019-05-25 16:12:09 269

原创 Pandas 记录

记录在学习过程中遇到的Pandas操作,也算是对自己的提醒吧~文章目录1.基础操作第一部分的整理使用的数据集是Kaggle上的一个经典题目:Sentiment Analysis on Movie Reviews1.基础操作一般常见的数据格式也就是excel、csv和tsv文件,区别简单了解可见:.tsv .csv格式文件# 如果数据文件是csv,那么可以直接使用:df = pd.rea...

2019-05-24 21:03:29 182

原创 Python 记录(一)

记录一些Python中遇到的零碎知识点~1.字符串替换、删除字符使用maketrans()创建映射词典,然后使用translate()将映射应用在字符串中:str01 = 'qwe-as-0d'intab = 'qwe'outab = 'asd'deltab = 'd'trantab = str01.maketrans(intab, outab, deltab)print(type...

2019-05-18 20:04:42 304

原创 关于CIFAR-10图像分类总结

之前一段时间学习深度学习在CIFAR-10数据集上图像分类问题,在此做一点点总结,关于这个问题,网络上已经有很多优秀的资源了,因此,主要是汇总一些博客等资料。关于图像分类算法的总结很多网站都转载了这篇文章,文章比较了五种图像分类算法,传统机器学习以及深度学习的方法都有涉及,了解图像分类可以看一看原文:Image Classification in 5 Methods翻译等可见:图像分类 |...

2019-05-08 08:51:19 10539 1

原创 pyhanlp、HanLP安装与使用

HanLP安装使用(Windows)安装Hanlp时候发现网上的一些介绍文章写的有些模糊,这里记录一下Python环境下安装与使用Hanlp。首先,要明确HanLP是一个Java工具包,由很多模型、算法组成,而在学习自然语言的时候一般都会使用Python吧,因此,实质上是使用Python调用Hanlp。具体安装步骤:1.安装Java 和 Visual C++环境首先是安装JDK,这个在O...

2019-04-27 16:01:12 16006 12

原创 一点关于Python与C++引用不同的理解

本篇的主要内容:Python与C++引用的不同(个人理解)在用Python写建二叉树的代码的时候遇到了这个问题,原因就是把Python的“引用”与C++的“引用”搞混了,这两种语言中都有“引用”名词,虽然大部分时候很像,其实还是有区别的。这里记录一下,注意,这里只是我自己的一点个人理解,在找到更好的理解之前,先这样理解吧!例子,这是我的两段根据先序序列创建二叉树的代码:# 正确pos...

2019-01-05 20:33:03 762

原创 Python实现二叉树的基础操作

本篇的主要内容:Python实现二叉树的建立与遍历如何判断完全二叉树最近遇到这个问题,要使用Python实现二叉树的一些操作,在网上这部分的资源不是很多,也没有找好很好的,只好按照自己的思路简单写了一下,本来算法是不局限于语言的,说是这么说,但是还是遇到了一些问题,在此梳理记录一下。二叉树建立首先定义二叉树的先序字符串,并使用#表示某个节点的子树为空的情况:二叉树类的定义为:cl...

2019-01-05 16:27:52 2139 2

原创 常用数据集总结文章记录、IRIS数据集介绍

本篇的主要内容:使用Pandas对IRIS导入的一些基本操作IRIS数据集介绍IRIS数据集也称作鸢尾花数据集,整个数据集共有150条数据,分为三类,每类50条数据,每一条数据都有四个属性:花萼长度,花萼宽度,花瓣长度,花瓣宽度,标签数据共有三种,分别是Setosa,Versicolour,Virginica。一般使用前面的四种属性数据来预测样本属于那种鸢尾花。具体一些的介绍可以移步百...

2019-01-01 11:56:29 5232 3

原创 统计学习方法(一)感知机学习

2018还剩最后几个小时啦!跨年就该做点有意义的事情啊 (。・∀・)ノ。这段时间零零散散地看了一部分《统计学习方法》,作为小白的我真的是看的…头昏脑胀,还是把自己学的一点点东西记录下来好了。本篇地主要内容:简要介绍感知机算法感知机代码地简单实现感知机(Perceptron)介绍感知机是进行二类分类地线性分类模型,输入维实例向量,输出维该实例地分类。本质上就是在输入空间中,找到一个合...

2019-01-01 00:20:01 897 3

原创 Scipy中最小二乘函数leastsq()简单使用

本篇的主要内容:介绍Scipy中optimize模块的leastsq函数最近接触到了Scipy中optimize模块的一些函数,optimize模块中提供了很多数值优化算法,其中,最小二乘法可以说是最经典的数值优化技术了, 通过最小化误差的平方来寻找最符合数据的曲线。在optimize模块中,使用leastsq()函数可以很快速地使用最小二乘法对数据进行拟合。首先来看leastsq()函...

2018-12-31 17:06:35 28835 8

原创 推荐一本电子书《深度学习入门》

最近看到一本非常好的深度学习介绍电子书,在网上查了一下,发现是云栖社区很受欢迎的一系列博客,作者是张玉宏博士,有很多问题,例如BP算法等的介绍我觉得比大部分博客介绍的都要清楚,这一系列的博客链接在这里:深度学习入门系列如果觉得不方便也可以在网上找一下这系列博客的电子书,有大神整理成了电子书,质量也很好,书末作者提到要将这一系列的博客内容整理成书,我看了一下,书名叫做《深度学习之美》,链接:深度学...

2018-12-31 10:53:00 5699

原创 Python中mutable与immutable和二维列表的初始化问题

考虑对二维列表进行初始化,这个问题在上一篇中已经讨论过了,例如,初始化一个shape为(3,3)的二维列表,正确的写法是这样的:a = [[None] * 3 for i in range(3)]print(a)a[0][0] = 1print(a)#经过测试没有问题# 输出:#[[None, None, None], [None, None, None], [None, Non...

2018-12-19 22:07:39 417

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除