4 Ryan_lee9410

尚未进行身份认证

暂无相关描述

等级
TA的排名 27w+

NLP领域相关的概念整理

分享和整理一些在学习NLP技术时碰到的术语1.OOV(OutOfVocabulary)在自然语言处理或者文本处理的时候,通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的(如WordNet语料库),或者是自己定义的,或者是从当前数据集提取的。假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是...

2019-08-03 16:57:28

python爬知网(CNKI)数据踩过的坑

前言朋友请我帮忙爬一下知网的信息,答应之后准备尝试一下爬CNKI的论文,在爬知网前,google了一下网上有没有现成的知网爬虫(想偷了个懒),发现GitHub上的知网爬虫都是好几年前的,于是准备自己动手写一个。正文写爬虫的python工具:selenium,在模拟了浏览器行为(包括打开浏览器,打开知网检索页面,勾选左侧响应的栏目,输入关键词,设置检索时间段)之后,点击“检索”,获取浏览...

2019-07-12 08:47:33

灰色文献(Grey Literature)详解

什么是灰色文献(GreyLiterature)?关于灰色文献的定义很多,但许多定义都没有全面概括灰色文献的特点。综合已有文献,笔者归纳出灰色文献的定义并做出相关阐释。灰色文献通常指不经赢利性出版商控制,而由各级政府、科研院所、学术机构、工商业界等所发布的非秘密的、不作为正常商业性出版物出售而又难以获取的各类印刷版与电子版文献资料。灰色文献(Greyliterature)是...

2019-05-28 09:46:59

关于“Threats to Validity”的介绍

写论文的时候,经常会遇到“ThreatstoValidity”问题,那么如何才能写出一个规范的ThreatstoValidity呢?内/外部有效性:定义&区别Internalvalidity(内部有效性)refersspecificallytowhetheranexperimentaltreatment/conditionmakesadifference...

2019-03-20 22:30:19

IDM下载器“一些网站不允许请求一个文件两次”的解决办法

在有些系统上下载时,可能会碰到弹出“一些网站不允许请求一个文件两次”的错误提示(如下图),而导致有些文件无法正常下载,及时是换了其他下载器(如迅雷),或者换了浏览器,换了电脑还是出现同样的问题,那么就不是下载器或者网络的问题,是属于目标系统的问题。解决步骤如下:(1)打开“选项”,在“常规”中点击“快捷键”。(2)将下面图中的“使用下列快捷键强制调用IDM下载任何链接”打上勾,...

2019-02-26 21:11:19

PhD candidate和PhD student区别

Q:WhatisthedifferencebetweenPhDcandidateandPhDstudent?A1:Duringthestudiesthatleadtothedegree,thestudentiscalledadoctoralstudentorPhDstudent;astudentwhohascompleteda...

2019-02-19 14:22:09

Python——%操作符

%s字符串string="hello"#%s打印时结果是helloprint"string=%s"%string#output:string=hello#%2s意思是字符串长度为2,当原字符串的长度超过2时,按原长度打印,所以%2s的打印结果还是helloprint"string=%2s"%string#outpu...

2019-02-16 19:27:37

python报错整理

声明:之前在用python写程序的过程中碰到过很多的报错,好多都是自己到处找解决方案之后解决的,很多答案都不正确,也浪费了不少时间,我会在日后的生活中会把我碰到的一些报错以及解决方法整理出来,方便大家查证,少走弯路,不喜勿喷。分类:一、安装路径错误导致的报错(1)安装完xrld包之后还会报错按照网上的答案发现安装完xrld包之后还是报错,如下图:解决方法:安装路径不对,类似的...

2019-02-11 18:49:38

进程和线程的区别——通俗易懂

前言有些知识点时间长了容易忘记,又得到处查,还不如有空的时候整理一下,方便他人也便于自查。进程和线程的通俗比喻假定工厂的电力有限,一次只能供给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是,单个CPU一次只能运行一个任务。进程就好比工厂的车间,它代表CPU所能处理的单个任务。任一时刻,CPU总是运行一个进程,其他进程处于非运行状态。一个车间里,可以有很多工人。...

2018-10-31 13:55:50

统计学习方法——均值、方差、标准差及协方差、协方差矩阵、相关系数

一、几个基本概念:均值、方差、标准差统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:,(在概率论和统计学中,数学期望(mean)(或均值,亦简称期望),一个意思,可用E(X)来表示,是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。)标准差(StandardDeviation):, 又叫均方差...

2018-10-09 15:59:56

Matlab图像处理常用函数

 目录一、Matlab常用的统计函数二、图像的读写、显示一、Matlab常用的统计函数求和 sum(X) 最小值 min(X) 均值 mean(X) 最大值 max(X) x的平方根 sqrt(x) 标准差 std(X) 方差 var(X)或cov(X) 协方差 cov(X,Y) MATLA...

2018-10-07 21:09:29

数据的标准化(normalization)

在处理数据的时候,经常会涉及到标准化问题。数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。一、数据标准化分类1.极差的标准化一批样本中,每个特征的最大值与最小值之差,称为极差。已知两个样本,每个样本有n个特征...

2018-10-07 16:58:59

计算机领域各种距离计算公式

目录1.绝对值距离2.欧氏距离3.曼哈顿距离4.切比雪夫距离5.闵可夫斯基距离(MinkowskiDistance)6.标准化欧氏距离(StandardizedEuclideandistance)7.马氏距离(MahalanobisDistance)8.巴氏距离(BhattacharyyaDistance)9.汉明距离(Hammi...

2018-10-07 15:34:23

几种数据库的对比——帮助选择合适的数据库

目录一、关系型数据库(RelationalDatabase)二、非关系型数据库(NoSQL)三、XML数据库四、资源描述框架(RDF)/三元组存储五、图形数据库(GraphDatabase)5.1TitanDB数据库5.2OrientDB数据库5.3Neo4j数据库一、关系型数据库(RelationalDatabase)当我们准备把...

2018-10-05 21:33:09

杂乱的概念整理+有趣的东西

整理了一些概念,便于自己查询和理解【乱七八糟的概念】1、Ad-HocQuery(即席查询)即席查询(AdHoc)是用户根据自己的需求,灵活的选择查询条件,系统能够根据用户的选择生成相应的统计报表。即席查询与普通应用查询最大的不同是普通的应用查询是定制开发的,而即席查询是由用户自定义查询条件的。  在数据仓库领域有一个概念叫Adhocqueries,中文一般翻译为“即席查询”...

2018-07-12 20:42:37

Git SSH密钥的配置教程

Git安装完成后,需要手动配置ssh密钥配置github的ssh密钥:(1)打开GitBash查看电脑上是否已经存在SSH密钥:输入cd~/.ssh若如上图显示无法找到该文件则要创建新的sshkey;(2)创建新的sshkey:输入 ssh-keygen -t rsa -C"youremail@youremail.com" 执行这条命令会如上图提示文...

2018-07-12 14:49:21

迭代和递归思想的总结

首先说一句,递归(recursion)和迭代(iteration)都是实现循环的手段。递归是重复调用函数自身实现循环(函数自己调用自己)。迭代是函数内某段代码实现循环。而迭代与普通循环的区别是:循环代码中参与运算的变量同时是保存结果的变量,当前保存的结果作为下一次循环计算的初始值。递归循环中,遇到满足终止条件的情况时逐层返回来结束。迭代则使用计数器结束循环。当然很多情况都是多种...

2018-07-02 16:38:30

正则表达式和在线测试

转载:(1)https://blog.csdn.net/drunkpragrammer/article/details/69677472(2)https://blog.csdn.net/HHTNAN/article/details/73792309原文看上面在线测试工具:http://tool.chinaz.com/regex/在线测试工具2:https://www.debug...

2018-06-23 20:00:31

matlab-画图函数:scatter和plot

由于需要画图的时候会经常忘记画图函数的具体参数,所以给总结了一下,便于自己和大家用的时候查起来方便,不用到处查,浪费很多时间。画图的时候常用的画图函数有scatter和plot,具体语法可以直接在MATLAB命令框里输入:help+空格+函数名,查看具体的语法规则,还附带例子的,比网上查的更清楚,也更全面。具体的图形的表示方法:颜色:'yellow'      'y',...

2018-05-29 13:22:46

Java编程语言——知识点总结

Java编程语言——知识点总结(1)main()方法有好几种定义格式,不管哪种方式,都必须保证main()方法的返回值有void,并且有public和static杆件自修饰。不能用abstract修饰!(2)每个程序中,main()方法是程序的入口,但是最先被执行的不一定是main()方法。在Java中,最先被调用的是静态块,即用static修饰的。(3)Java初始化的顺序如下:父类静态变量&g...

2018-05-05 22:58:20

查看更多

勋章 我的勋章
    暂无奖章