自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 六种分类算法的比较——以水果分类为例

在这篇机器学习入门教程中,我们将使用Python中最流行的机器学习工具scikit- learn,在Python中实现几种机器学习算法。使用简单的数据集来训练分类器区分不同类型的水果。这篇文章的目的是识别出最适合当前问题的机器学习算法。因此,我们要比较不同的算法,选择性能最好的算法。让我们开始吧!数据水果数据集由爱丁堡大学的Iain Murray博士创建。他买了几十个不同种类的橘子、柠檬和...

2019-11-19 18:15:48 8907

原创 python数据降维

数据为何要降维数据降维可以降低模型的计算量并减少模型运行时间、降低噪音变量信息对于模型结果的影响、便于通过可视化方式展示归约后的维度信息并减少数据存储空间。因此,大多数情况下,当我们面临高维数据时,都需要对数据做降维处理。数据降维有两种方式:特征选择,维度转换特征选择特征选择指根据一定的规则和经验,直接在原有的维度中挑选一部分参与到计算和建模过程,用选择的特征代替所有特征,不改变原有特征,...

2019-11-14 11:37:02 1190

原创 Python绘图集锦

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport warnings; warnings.filterwarnings(action='once')# Import Datadf = pd.read_csv('international-airline-passengers.csv')...

2019-11-13 15:05:47 331

原创 Matlab及Python实现插值——季度变月度

一维插值插值不同于拟合。插值函数经过样本点,拟合函数一般基于最小二乘法尽量靠近所有样本点穿过。常见插值方法有拉格朗日插值法、分段插值法、样条插值法。拉格朗日插值多项式:当节点数n较大时,拉格朗日插值多项式的次数较高,可能出现不一致的收敛情况,而且计算复杂。随着样点增加,高次插值会带来误差的震动现象称为龙格现象。分段插值:虽然收敛,但光滑性较差。样条插值:样条插值是使用一种名为样条的特殊分段...

2019-11-12 21:32:41 5219 2

原创 Matlab计算皮尔逊相关系数corr、互相关系数xcorr

计算皮尔逊相关系数——corr%% 多变量间相关性分析和选取相关性强的变量方法属于“属性约减”范畴。%即进行各变量间的相关性分析,选取相关性强的变量。%可以使用皮尔逊Pearson相关性系数r进行衡量,如果其绝对值越接近1,则变量X,Y的相关性越强。%对相关性系数进行排序,保留相关性强的变量,剔除相关性差的变量。% 一般来说,取绝对值后,0-0.09为没有相关性,0.3-弱,0.1-0....

2019-11-12 14:29:39 16872

原创 keras实现LSTM单变量时间序列预测——国际航班乘客预测

https://blog.csdn.net/zyxhangiian123456789/article/details/87458140对于较为简单的时间序列预测问题,可以使用Exponential Smoothing和ARIMA等传统模型非常方便地求解。然而,对于复杂的时间序列预测问题,LSTM不失为一种很好的选择。因此,本文旨在探讨如何利用LSTM神经网络求解时间序列预测问题。首先,需要明白时...

2019-11-05 23:22:58 5122

原创 keras实现LSTM单变量时间序列预测——股票价格预测

预测股市将如何变化历来是最困难的事情之一。这个预测行为中包含着如此之多的因素—包括物理或心理因素、理性或者不理性行为因素等等。所有这些因素结合在一起,使得股价波动剧烈,很难准确预测。使用机器学习可能改变游戏规则吗?机器学习技术使用最新的组织公告、季度收益等作为特征,有潜力挖掘出我们以前没有见过的模式和见解,并可用于准确无误的预测。在本文中,我们将研究上市公司股价的历史数据。我们将结合机器学习算...

2019-11-01 09:06:53 3640 4

原创 基于snownlp及朴素贝叶斯的情感分析——以大众点评网评论为例

中文文本情感分析的机器学习项目,今天的流程如下:数据情况和处理数据情况这里的数据为大众点评上的评论数据(王树义老师提供),主要就是评论文字和打分。我们首先读入数据,看下数据的情况:import numpy as npimport pandas as pddata = pd.read_csv('comment_dazhongdianping.csv')data.head()情感...

2019-10-22 13:22:57 10228 6

原创 Jieba+wordcloud制作词云

01 准备工作首先安装好python (我用的是3.7版本),再安装好几个扩展库解决conda无法安装jieba分词包conda install jieba错误pip install jieba正确安装wordcloud采用下面两种常见的安装方式都不行pip install wordcloudconda install wordcloud解决方法:到 http://www...

2019-10-17 17:36:13 696

原创 python爬虫(1)-百度新闻首页抓取

百度热点新闻上,前6条是在strong > a下面抓取,后30条,以及之后的各个分版块(国内,国际,地方,娱乐,体育等等),抓取的特征值是a标签下的mon的值,c=板块名称,pn=为每个分类下的第几条新闻,一个分类下显示12条(地方新闻显示8条),看看原网页就可以知道了。摸索期间,可以直接把网页下载到本地进行调试,代码如下:with open('本地文件路径',encoding='utf...

2019-10-17 10:57:59 1341 3

原创 Kesci:Tensorflow 实现 LSTM——时间序列预测(超详细)

云脑项目3 -真实业界数据的时间序列预测挑战https://www.kesci.com/home/project/5a391c670e1fc52691fde623这篇文章将讲解如何使用lstm进行时间序列方面的预测,重点讲lstm的应用,原理部分可参考以下两篇文章:Understanding LSTM Networks LSTM学习笔记编程环境:python3.7,tensorflow 1....

2019-10-13 08:43:27 6140 1

原创 Kesci:Tensorflow 实现 LSTM——时间序列预测

LSTMhttps://www.kesci.com/home/project/5a38a9c00e1fc52691fd9c72这篇文章将讲解如何使用lstm进行时间序列方面的预测,重点讲lstm的应用,原理部分可参考以下两篇文章:Understanding LSTM Networks LSTM学习笔记编程环境:python3.7,tensorflow 1.0本文所用的数据集来...

2019-10-13 08:06:46 1107 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除