5 icon_yu

尚未进行身份认证

暂无相关简介

等级
TA的排名 8w+

【知识图谱】neo4j安装---linux

1、下载社区版的neo4j,不要去官网下载,我的下载地址是:http://neo4j.com.cn/topic/5b003eae9662eee704f31cee2.无需安装,直接解压,然后进入它的bin目录,在终端敲:./neo4jstart,点击终端弹出的最后的网址就可进入了(它的初始账户和密码都是neo4j)3.如果报错,javajdk不匹配,则需要重新安装oraclej...

2019-11-05 14:43:49

pyhton使用ta-lib进行技术指标分析

一、TA-LIB库安装1.直接使用pipinstallTa-Lib会报错2.手动安装(1)https://www.lfd.uci.edu/~gohlke/pythonlibs/在网址中下载对应python版本的ta-lib的whl文件,其中python版本可以在cmd中输入python查找(2)cmd中安装(3)验证是否安装成功三、股票数据采集1.雅虎财经网(1)上...

2019-10-17 09:57:45

数据分析

一、异常值是指什么?请列举识别连续型变量异常值的方法?答:异常值是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。常用的检验法有(按优劣次序):(1)t检验法(2)格拉布斯检验法(3)峰度检验法(4)狄克逊检验法(5)偏度检验法...

2019-08-29 14:40:31

【NLP】NO6:隐马尔可夫HMM和条件随机场CRF

一、隐马尔可夫HMM二、条件随机场CRF

2019-08-26 16:43:04

【NLP】NO5:文本聚类

一、主要步骤语料加载->分词->去停用词->抽取词向量模型特征->基于tf-idf和word2vec进行kmeans中文文本聚类importrandomimportjiebaimportpandasaspdimportnumpyasnpfromsklearn.feature_extraction.textimportTfidfTransf...

2019-08-26 14:41:29

【NLP】NO4:文本分类

importpandasaspd#加载停用词,txt内容可以随项目进行改变stopwords=pd.read_csv('stopword.txt',index_col=False,quoting=3,sep='\t',names=['stopwords'],encoding='utf-8')stopwords=stopwords['stopwords'].values#加载...

2019-08-21 17:35:03

【NLP】NO3:文本可视化

常用可视化图:词云、分布图、DocumentCards、树状图、网络图、力导向图、叠式图、WordTree、地理热力图、ThemeRiver、SparkClouds、TextFlow、基于矩阵视图的情感分析可视化。一、词云分词、去停用词、统计词频、绘制词云#引入所需要的包importjiebaimportpandasaspdimportnumpyasnpfroms...

2019-08-20 19:51:28

【NLP】NO2:中文关键词提取

一、基于TF-IDF提取关键词importjieba.analyse#withWeight表示是否需要返回关键词权重值#allowPOS表示指定的词性word="".join(jieba.analyse.extract_tags(word,topK=20,withWeight=False,allowPOS=(['n','v'])))二、基于TextRank提取关键词1.核心思...

2019-08-20 19:30:09

【NLP】NO1:自然语言处理的完整机器处理流程

二、中文自然处理的主要步骤(1)语料清洗1.人工去重、对齐、删除和标注2.基于规则提取内容、正则表达式匹配3.根据词性和命名实体提取(2)中文分词—难点在于歧义和新词1.基于字符串匹配的分词方法2.基于理解的分词方法3.基于统计的分词方法4.基于规则的分词方法(3)词性标注1.定义词的词性,如形容词、动词等,在情感分析、知识推理中用,在文本分类中不用2.基于统...

2019-08-20 16:19:30

word中插入代码

1.打开这个网站http://www.planetb.ca/syntax-highlight-word2.将需要插入在word中的代码完整的复制到该网站提示的文本框内,选择你的代码类型,如C,C++,HTML等,并点击提交。3.该网页会自动将该代码生成到一个新的页面,此时ctrl+A全选,后ctrl+c复制到word中粘贴就好。...

2019-08-09 17:22:57

IOPub data rate exceeded问题解决

1.anacondaprompt中输入jupyternotebook--NotebookApp.iopub_data_rate_limit=21474836472.其中2147483647可以任意修改

2019-08-09 12:00:48

服务器相关操作

1.下载anaconda3$wgethttps://repo.continuum.io/archive/Anaconda3-4.2.0-Linux-x86_64.sh2.安装,上面的wget指令在哪个目录下运行anaconda包就会被下到该文件下$bashAnaconda3-4.2.0-Linux-x86_64.sh3.远程连接jupyter(1)远程服务器上xshell,输...

2019-07-31 11:42:42

【NLP】词的表示方式及word embeddings代码

1.one-hot编码给每个词分配一个数字ID,如“爸爸”=1=[010],“妈妈”=2=[001]缺点(1)高维度,稀疏(2)词之间相互独立,无法表示词之间的语义2.分布式表示(1)基于矩阵的分布表示词的相似度转换为向量的空间距离GlobalVector模型(2)基于聚类的分布表示(3)基于神经网络的分布表示----词向量/词嵌入wordembedding词嵌入空...

2019-07-15 16:29:57

机器学习:集成算法

一、Bagging和Boosting1.Bagging:1)样本有放回选取2)样本权重相同3)所有分类器的权重相等4)并行2.Boosting:1)使用全部样本2)根据错误率不断调整样例的权值,错误率越大则权重越大3)每个弱分类器都有相应的权重,对于分类误差小的分类器会有更大的权重4)串行,因为后一个模型参数需要前一轮模型的结果。二、随机森林三、GBDT四、XGBoost...

2019-05-28 09:52:14

机器学习:最小二乘法、梯度下降法

一、最小二乘法二、梯度下降法三、牛顿法四、极大似然估计

2019-05-21 19:38:40

机器学习:损失函数、代价函数、目标函数

一、损失函数、代价函数和目标函数损失函数:单个样本误差代价函数:所有样本误差平均值目标函数:代价函数+正则项

2019-05-20 20:04:32

机器学习:神经网络

一、sklearn代码#定义多层感知机分类算法fromsklearn.neural_networkimportMLPClassifier'''(1)hidden_layer_sizes:元祖(2)activation:激活函数(3)solver:优化算法{‘lbfgs’,‘sgd’,‘adam’}(4)alpha:L2惩罚(正则化项)参数。'''model=M...

2019-05-18 11:21:50

机器学习:K临近算法-KNN

一、sklearn代码fromsklearnimportneighbors'''(1)n_neighbors:使用邻居的数目'''model=neighbors.KNeighborsClassifier(n_neighbors=5,n_jobs=1)#分类model=neighbors.KNeighborsRegressor(n_neighbors=5,n_jo...

2019-05-18 11:19:59

机器学习:支持向量机SVM

一、sklearn代码fromsklearn.svmimportSVC'''(1)C:误差项的惩罚参数C(2)gamma:核相关系数'''model=SVC(C=1.0,kernel=’rbf’,gamma=’auto’)

2019-05-18 11:18:36

机器学习:朴素贝叶斯

一、sklearn代码fromsklearnimportnaive_bayes'''(1)alpha:平滑参数(2)fit_prior:是否要学习类的先验概率;false-使用统一的先验概率(3)class_prior:是否指定类的先验概率;若指定则不能根据参数调整(4)binarize:二值化的阈值,若为None,则假设输入由二进制向量组成'''model=naiv...

2019-05-18 11:12:26

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。