自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 Docker搭建ELK集群

1. 主机环境设置insert in /etc/sysctl.conf vm.max_map_count = 262144 or run sysctl -w vm.max_map_count=2621442. DOCKERDOCKER: https://hub.docker.com/r/cdrocker/elk6/启动命令:docker run -d -p 5601:56...

2018-05-19 17:19:02 3375 1

转载 达观数据自然语言处理框架

达观数据自然语言处理框架

2018-03-24 22:21:37 672

自然语言处理

自然语言处理处理技术词法分析依存句法分析词向量表示DNN语言模型词义相似度应用短文本相似度评论观点抽取情感倾向分析文章标签文章分类- 知识图谱...

2018-03-19 08:31:00 478

原创 规则学习

规则1. 基本概念⊕←f1∧f2⋯fL⊕←f1∧f2⋯fL\oplus\leftarrow f_1\wedge f_2\cdots f_L⊕⊕\oplus: 规则头f1∧f2⋯fLf1∧f2⋯fLf_1\wedge f_2\cdots f_L: 规则体 (合取式)一条规则是一个子模型,规则及是这些子模型的集合1.1规则冲突冲突消解的手段投票法排序法元规则法...

2018-03-17 19:35:31 1500

转载 机器学习术语表

Aaccuracy (准确率)分类模型预测准确的比例。在多类别分类中,准确率定义如下: accuracy=correctpredictionstotalnumberofexamplesaccuracy=correctpredictionstotalnumberofexamplesaccuracy =\frac{correct predictions}{total number of ...

2018-03-14 08:19:51 442

原创 中文分词工具ieba和pyltp功能对比

中文分词工具ieba和pyltp功能对比 功能 – jieba pyltp 分句 分句 √ 分词 全模式 √ 分词 精准模式 √ √ 分词 搜索引擎模式 √ 新词发现 新词发现 √ 自定义词典 词语 √ √ 自定义词典 词频 √...

2018-02-28 23:27:57 2047 1

转载 pyltp文档

安装 pyltp注:由于新版本增加了新的第三方依赖如dynet等,不再支持 windows 下 python2 环境。使用 pip 安装使用 pip 安装前,请确保您已安装了 pip$ pip install pyltp接下来,需要下载 LTP 模型文件。下载地址 - 模型下载当前模型版本 - 3.4.0注意在windows下 3.4.0 版本的 语义角色标注模...

2018-02-28 23:07:15 1373

转载 新词发现

挖掘新词的传统方法是,先对文本进行分词,然后猜测未能成功匹配的剩余片段就是新词。这似乎陷入了一个怪圈:分词的准确性本身就依赖于词库的完整性,如果词库中根本没有新词,我们又怎么能信任分词结果呢?此时,一种大胆的想法是,首先不依赖于任何已有的词库,仅仅根据词的共同特征,将一段大规模语料中可能成词的文本片段全部提取出来,不管它是新词还是旧词。然后,再把所有抽出来的词和已有词库进行比较,不就能找出新词了吗...

2018-02-26 22:47:31 2998

原创 Python实现简单二叉树

class BinaryTree: def __init__(self,rootObj): self.root = rootObj self.leftChild = None self.rightChild = None def insertLeft(self,newNode): if self.leftChild ...

2018-02-13 00:22:32 2127

原创 Python的递归

def Factorial(n): if n==1: return 1 else: return n*Factorial(n-1)print(Factorial(3))6上述代码用于计算阶乘n!=n∗(n−1)∗⋯∗1n!=n∗(n−1)∗⋯∗1n!=n*(n-1)*\cdots*1当n不为1时,将执行返回n*Factorial(n-...

2018-02-12 23:56:15 157

原创 Python的类

类的定义class Human(object): def eat(self): print('I can eat')DoctorLiu = Human()DoctorLiu.eat()I can eatclass Human(object)定义一个类叫做Human,Human类继承了object这个类,object类是python内的一个基础类,所...

2018-02-12 23:37:21 504

转载 Docker删除大量停止的container

1. 怎么做官方建议的批量删除停止容器使用docker rm $(sudo docker ps -a -q)千万不要用 docker rm -f $(sudo docker ps -a -q),会删除全部容器的2. 为什么这么做1. docker ps -a -qdocker ps 命令的解释: docker ps -a -q 列出所有容器的数字IDro...

2018-02-10 16:42:58 3483

转载 Python中 sys.argv[]的用法简明解释

sys.argv[]说白了就是一个从程序外部获取参数的桥梁,这个“外部”很关键,所以那些试图从代码来说明它作用的解释一直没看明白。因为我们从外部取得的参数可以是多个,所以获得的是一个列表(list),也就是说sys.argv其实可以看作是一个列表,所以才能用[]提取其中的元素。其第一个元素是程序本身,随后才依次是外部给予的参数。下面我们通过一个极简单的test.py程序的运行结果来说明它的用法

2018-01-28 22:03:24 385

原创 Java学习

Java的体系Java SE(J2SE) (Java 2 Platform Standard Edition, JAVA平台标准版) Java EE(J2EE) (Java 2 Platform Enterprise Edition, JAVA平台企业版) Java ME(J2ME) (Java 2 Platform Micro Edition, JAVA平台微型版)Java

2018-01-14 20:38:21 1666

原创 数据压缩与信息熵

Notes:本文目前大部分内容来源于:[http://www.ruanyifeng.com/blog/2014/09/information-entropy.html]。之后将增加互信息,左右信息熵等内容1992年,美国佐治亚州的WEB Technology公司,宣布做出了重大的技术突破。 该公司的DataFiles/16软件,号称可以将任意大于64KB的文件,压缩为原始大小的16分之一

2018-01-14 17:52:42 437

原创 docker容器中安装vi命令

在使用docker容器时,有时候里边没有安装vim,敲vim命令时提示说:vim: command not found,这个时候就需要安装vim,可是当你敲apt-get install vim命令时,提示: Reading package lists… Done Building dependency tree Reading state information… Done E:

2017-12-24 22:37:08 1813

原创 linux操作命令

查看linux ipifconfig

2017-12-24 22:36:14 131

原创 Docker 阿里云加速器

您可以通过修改daemon配置文件/etc/docker/daemon.json来使用加速器:sudo mkdir -p /etc/dockersudo tee /etc/docker/daemon.json 'EOF'{ "registry-mirrors": ["https://******.mirror.aliyuncs.com"]}EOFsudo systemctl

2017-12-24 22:31:01 219

转载 centos安装docker

安装必要工具集sudo yum install -y yum-utils安装Docker官方源sudo yum-config-manager \--add-repo \https://download.docker.com/linux/centos/docker-ce.repo更新yum缓存sudo yum makecache fast安装Dcokersudo yum -y install do

2017-12-24 22:25:37 134

转载 CentOS设置共享文件夹

安装vm toolmount /dev/cdrom /home/tmpcp /home/tmp/VMwareTools-9.6.0-1294478.tar.gz /tmpcd /tmptar -zxvf VMwareTools-9.6.0-1294478.tar.gzcd vmware-tools-distrib./vmware-install.pl按提示操作即可。有/mnt/hgfs但没

2017-12-24 22:02:27 1056 1

原创 NLP开源框架

NLP全系列处理框架 名称 包含模块和下载地址 开发语言 哈工大的Ltp 中文分词、词性标注、未登录词、句法分析、语义角色标注。网址: C++ Standford NLP 中文分词、词性标注、未登录词识别、句法分析等。网址: Java FudanNLP 中文分词、句法分析等。网址: Java HanLP 中文分词、句法分析等各类算法。网址:

2017-11-30 21:19:36 3864

原创 Docker入门笔记(慕课网)

3.1 Dockerfile介绍1.创建一个新文件夹,写Dockerfilemkdir dl #创建文件夹cd dllstouch Dockerfile #touch创建文件2.用vim在Dockerfile中写内容vim Dockerfilei #在vim中做插入操作FROM alpine:latest MAINTAINER TAO CMD echo "Good Mor

2017-10-29 15:21:16 1153

原创 python defacultdict

from collections import defaultdicta = defaultdicy(set)a为一个dict,当传入一个他没有的键值时,默认返回一个set,也可以设置为int、list等。

2017-10-26 22:23:18 204

原创 python wordcloud

wordcloud.WordCloudclass wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9, mask=None, scale=1, color_func=None, max_words=200, min_font

2017-10-26 22:01:17 368

原创 sklearn score

sss

2017-10-13 11:34:30 1480

原创 sklearn pipeline

管道:pipeline = Pipeline([('tfidf', TfidfVectorizer(ngram_range=(1, 3), analyzer='char', min_df=2, max_df=0.85)), ('lrc', OneVsRestClassifier(LogisticRegression( solver='liblinear'))])参数传递:param_gri

2017-10-12 20:19:33 332

原创 sklearn Classification metrics

http://scikit-learn.org/stable/modules/model_evaluation.html#classification-metrics

2017-10-12 20:12:21 1355

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除