自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Load key “id_rsa“: bad permissions [email protected]: Permission denied

Load key "id_rsa": bad permissions [email protected]: Permission denied (publickey,gssapi-keyex,gssapi-with-mic) 解决方案

2023-03-04 16:56:19 415

原创 doc2vec论文方法解析及基于Gensim库的Python代码实现

文章目录一、全文概述二、word2vec三、doc2vec1. PV-DM2. PV-DBOW三、Python代码实现本文主要讲解Mikolov在2014年发表的论文《Distributed Representations of Sentences and Documents》,论文主要是基于word2vec方法的一种改进,建议在理解word2vec的基础再来看这篇文章。一、全文概述基于wo...

2019-11-26 20:36:18 836

原创 WMD算法及python代码实现

本次讲解的论文来自J.Kusner等人2015年发表的论文,论文名字为From Word Embeddngs To Document Distances。一、全篇概述全篇最大的贡献是提出了WMD算法,并且为了提高计算速度,减低时间复杂度对模型进行了化简,得到WCD及RWMD算法,然后综合WCD及RWMD提出预取和修剪(Prefetch and prune),在几乎不影响算法准确率的情况下,大大...

2019-11-23 22:08:46 3767 3

原创 文本相似度综述

本文目录文本相似度的定义文本相似度计算方法基于字符串的方法基于语料库的方法基于词袋VSMLSA、PLSALDA(需要进一步了解)基于神经网络基于搜索引擎基于世界知识基于本体基于网络知识其他方法句法分析混合方法文本相似度的定义其中, common(A,B) 是 A 和 B 的共性信息,description(A,B) 是描述 A 和 B 的全部信息, 公式(1)表达出相似度与文本共性成正相关。...

2019-10-24 12:47:23 4184 4

转载 如何阅读英文论文?

链接:https://www.zhihu.com/question/19962502/answer/64867975来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。牛人告诉你如何读国外文献!毕业论文写作靠它了2015-04-07 国家社科期刊数据库为什么读文献?(从Ph.D到现在工作半年,发了12篇paper,7篇first author.)...

2019-09-21 21:29:47 1133

原创 关于做研究的方法论篇

0. 从问自己【为什么】开始做研究的第一步是选择一个新的领域进入,那么,好好问问自己为什么要进入这个领域很重要,它可以是热爱,也可以是恐惧。那么,我对人工智能中的NLP领域算的上是热爱,并且符合学院的大方向政策,在这个问题上,对于我应该是已经解决的问题了。1. 提纲挈领,掌握全貌这一步很重要。上来就扎到细节里并不是一件好事 —— 这就跟画画一样,你先从左上到右下进行构图,把大的形状...

2019-09-19 18:22:06 1099

原创 关于发论文的方法论篇

基本原则:追求高质量,不求多数量。基本完成2-3篇高质量论文比灌水一堆低质量论文要好的多!!!自我总结:简单的说啊,想写一篇好的论文的关键是idea!!!先有一个idea,再做实验,获取足够的数据来佐证你的idea,然后通过语言把这些组织起来就形成了一篇文章。idea可以是你的一个设想,可以是意外的发现,可以是前人没能搞清楚的理论等等等等。而idea是否足够创新,设计的实...

2019-09-19 15:52:02 696

原创 中文分词之最大匹配算法(前向、后向、双向及python实现)

文章目录1. 前向最大匹配算法1.1 前向最大匹配算法的原理2. 后向最大匹配算法2.1 后向最大匹配算法的原理3. 双向最大匹配算法3.1 双向最大匹配算法的原理1. 前向最大匹配算法1.1 前向最大匹配算法的原理首先,我们分词的目的是将一段中文分成若干个词语,前向最大匹配就是从前向后寻找在词典中存在的词。废话不多说,直接上例子:首先我们假设Max_len = 5,即假设单词的最大长度...

2019-09-19 09:33:28 14210 1

原创 归并排序及主定理的应用

归并排序归并排序算法是分治法的典型应用,具体排序过程如下:[归并演示1]每次合并过程中,是将两个分组里的数从第一个数开始比较,把数字较小的放入容器(升序排列)。以第二次合并过程为例:[归并演示2]归并算法渗透着递归的思想,它在不断的递归拆分数据的过程中会占用栈的空间,其空间复杂度为O(n)。它的时间复杂度为O(nlogn),那么如何计算它的时间复杂度呢?本文通过主算法推导计算归并排序...

2019-09-15 16:40:06 981

原创 NLP初探(1)

1. AI工程师必备的核心技能转化现实生活中的问题数学优化问题通过合适的工具解决2. What is NLPNLP = NLG+ NLUNLG(Natural language Generation):意思 -> 文本/语音NLU(Natural language Understanding): 语音/文本 -> 意思3. NLP的经典应用场景Question An...

2019-09-13 22:16:43 150

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除