7 天才暴风

尚未进行身份认证

我想就这样一直打球

等级
TA的排名 9w+

文章标题

论文笔记:层次化注意力机制Paper: Hierarchical Attention Networks for Document Classification (NAACL 2016)今天介绍这篇文章是来自于cmu的zichao yang的paper,其实这篇paper在我还在msra实习的时候就已经读过了,只是最近跟几个搞speech的师兄师姐聊了一下,发现他们都在设法将注意力机制引入到

2016-10-29 00:59:17

SemEval-2014 论文笔记(1)

title:NRC-Canada-2014: Detecting Aspects and Sentiment in Customer Reviews最近在研究aspect-based sentiment analysis (ABSA), 然后先从SemEval国际竞赛中排名比较靠前的系统中学习一下经验。今天要介绍的是加拿大国家研究局(NRC-Canada)的研究员公布的系统。介绍系统之前,我们先来了

2016-10-17 21:15:38

Coreference Resolution (共指消解)

前言本科时候主要搞的是利用深度学习来做文本分类和情感分析,phd期间的老板貌似对deep learning和一些相关的应用不是太感兴趣,于是。。 我就跳进了coreference resolution这个坑 (此处省略1万字)定义相信很多人都没有听说过这个概念,所以先在这里简单的介绍一下基本的定义:Coreference resolution (共指解析)是自然

2016-10-14 00:04:09

Deep Learning及NLP(自然语言处理)杂谈--第一部分

欢迎转载,转载请注明出处:http://blog.csdn.net/neighborhoodguo/article/details/47909813本杂谈分为三个部分,此文为第一部分。第一部分第二部分第三部分听完斯坦福大学的CS224d公开课真是受益匪浅,课程安排紧凑而且内容翔实由浅入深,使我不仅对各种神经网络模型

2016-01-04 17:55:05

支持向量机通俗导论(理解SVM的三层境界)

支持向量机通俗导论(理解SVM的三层境界)作者:July ;致谢:pluskid、白石、JerryLead。出处:结构之法算法之道blog。前言    动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲

2015-10-10 10:09:11

中文分词 及发展现状(总结的不错)

中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。

2015-09-28 09:05:13

文本相似度计算之tf-idf

最基本的文本相似度计算是在向量空间模型(VSM)下,以文档中的词作为特征进行计算:先来说一下VSM思想很简单:假设我现在的文档集中有3篇文档:

2015-07-20 20:59:17

多类分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)

通常,我们在评价classifier的性能时使用的是accuracy考虑在多类分类的背景下accuracy = (分类正确的样本个数) / (分类的所有样本个数)这样做其实看上去也挺不错的,不过可能会出现一个很严重的问题:例如某一个不透明的袋子里面装了1000台手机,其中有600台iphone6, 300台galaxy s6, 50台华为mate7,50台mx4(当然,这些信息分类器是

2015-07-16 10:17:55

配置java环境变量

额  用unix跟linux久了   还有点不习惯windows下的环境变量不过总归是要用的,所以还是配置一下吧什么是环境变量呢,我用python来举例子吧如果在windows下,你不配置python的环境变量,那么在想在cmd里面运行python,只能进入python application所在的目录,然后运行如果我想要随时随地运行python,该怎么做呢?我肯定得告知计算机这个

2015-07-15 08:32:24

c++中的异常 exception

变成入门的时候可能经常遇到的错误:this application has requested the runtime to terminate it in an unusual way. Please contact the application's support team for more information这是由于程序在运行时发生了未知的错误,例如:打开不存在的文件,爆栈,除数为

2015-06-14 22:25:11

mysql中的一些错误总结

额  mysql还是一个比较方便的数据库, 而且还是开源,所以好好掌握还是挺重要不过有的时候遇到有的问题确实挺头大的,所以最好还是自己总结一下错误比较好常见错误1:error:10061错误原因:mysql 服务没有正常启动解决办法:1.unix/linux下可以通过指令 ps -ef | grep mysql 查看mysql这个进程有没有起来,如果没有起来重新启动一下就可

2015-06-08 10:31:08

mysql中的一些错误总结

额  mysql还是一个比较方便的数据库, 而且还是开源,所以好好掌握还是挺重要不过有的时候遇到有的问题确实挺头大的,所以最好还是自己总结一下错误比较好常见错误1:error:10061错误原因:mysql 服务没有正常启动解决办法:1.unix/linux下可以通过指令 ps -ef | grep mysql 查看mysql这个进程有没有起来,如果没有起来重新启动一下就可以了

2015-06-08 10:14:46

ubuntu14.04下apt-get install的报错以及解决方案

前几天想要在ubuntu server 14.04下安装redis-server  结果指令敲进去之后就报错,具体什么信息我没有保留,大概就是说你磁盘空间已经满了之类的,还让你尝试输入下面的指令apt-get -f install这条指令就是用来修正一些软件依赖中存在的错误,敲进入之后出现了:磁盘空间已满,写入失败,其实这个并不是你的空间不够了,是因为你安装的包太多的缘故,可以手动清除一

2015-06-07 07:30:52

ubuntu下安装python scipy

前段时间又安装了一下gensim这个库,然后惊奇的发现gensim需要numpy和scipy的支持(可能之前的电脑上有装过scipy,就没有留意),所以安装之前首先要准备numpy和scipy这两个包先说一下我的安装环境:ubuntu14.04 server首先pip install numpy ,安装这个一般能够成功(一定要先安装numpy, scipy的安装依赖于scipy)接着,

2015-06-04 16:48:07

ubuntu下安装python scipy

前段时间又安装了一下gensim这个库,然后惊奇的发现gensim需要numpy和scipy的支持(可能之前的电脑上有装过scipy,就没有留意),所以安装之前首先要准备numpy和scipy这两个包先说一下我的安装环境:ubuntu14.04 server首先pip install numpy ,安装这个一般能够成功(一定要先安装numpy, scipy的安装依赖于scipy)接着,

2015-06-04 16:04:38

python自然语言处理nltk库常用接口

最近准备面试,然后了解了一下nltk库的一些常用的接口,现在来跟大家分享一下首先是通过nltk对文本进行分词import nltknltk.word_tokenize("You raise me up")这个实际上就是将文本中的每个词提取出来然后我们可以吧提取出来的词做一个词性标注,接口是word_tokenizetext = nltk.word_tokenize("yo

2015-05-11 23:23:30

排序算法之归并排序

归并排序是分治思想体现得最充分的一种排序算法,所谓分治就是把多个问题拆分成若干个更容易解决的小问题那分治是怎么应用到排序中的呢?我们以归并排序为例把如果我们要对它排序,那是不是可以吧它分成两个序列,分别对这两个序列进行排序之后,再将两个有序的序列按找大小合并起来呢?答案是肯定的归并排序的最基本的思想实际上就是不停地划分序列,直至得到的子序列只有1个,然后将这些子序列按照顺序

2015-05-06 14:03:47

MFC中类突然消失的解决办法

我擦,今天下午被一个问题坑惨了  害我改了好久, visual c++6.0真不是人用的东西说一下问题吧,我遇到的问题就是在class view里面,类CPageManage突然消失了,怎么也找不回来解决方法就是:打开FileView, 查看你那个类的源文件,这里,我的时PageManage.cpp谢天谢地,源文件还在,那就好办点开PageManage.h  然后随便在

2015-04-26 18:00:19

LDA的python实现之模型参数训练

最近看了不少关于主题模型的东西,要说起主题模型,现在最火的当然是LDA,LDA全称是LatentDirichletAllocation(隐狄利克雷分布),而不是LinearDiscriminantAnalysis,相信大家很多都对lda的理解感到痛苦不已,因为里面涉及到的数学推导实在是太多了,从gamma函数,beta分布,狄利克雷分布,马尔可夫蒙特卡洛模型,看到都觉得反胃,不过今天

2015-04-25 00:27:29

centos7.0下配置mysql+mysql-python

之前写过一篇在centos6.5下配置mysql+python-flask,之所以要写这篇文章的原因就是centos7.0之后,就不支持mysql而是转向支持mysql的开源分支mariaDB也就是是  在yum的源里面实际上是没有mysql-server这个包的,yum search mysql-server也就是说如果你敲入这个指令,它会提示 错误:找不到这个包如果你直接输入下

2015-04-15 15:22:03

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!