自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 R语言实现RMF模型

RMF模型说明RMF模型是客户管理中,常被用来衡量客户价值和客户创利能力的重要方法。它主要考量三个指标:最近一次消费-Recency:近期购买的客户倾向于再度购买消费频率-Frequency:经常购买的客户再次购买概率高消费金额-Monetary:消费金额较多的客户再次消费可能性更大根据上述三个维度,对客户做细分,假定每个维度划分成五个等级,得到客户的R值(1-5),F值(1-

2015-12-29 17:06:15 8059

原创 R语言读取Excel文件

因为一个项目需要,原始数据全部是Excel文件,包括.xls和.xlsx格式,并且很多excel数据的格式并不规范,一个个转为csv格式不太现实,所以把所有能了解到的读取excel的方法都试了一遍,做个简单汇总。相关的包:RODBC、xlsx、openxlsx、gdata、readxl,测试平台win7。RODBC包-相关方法RODBC-odbcConnectExcel2007()

2015-11-25 13:34:44 84511 3

原创 数据挖掘算法基础-关联规则

数据挖掘中,被常拿来说的啤酒尿布的例子就是一个很典型的运用关联算法来做购物来分析的例子。常被用于交易数据、关系数据的分析,发现数据集中隐藏的频繁模式,这些频繁模式可以用关联规则的形式表示,有效的关联规则对商家的商品进出货摆放都有很大的指导意义。设 是项的集合,数据集D是事务的集合,每项事务T是一个非空项集,且T是I的非空子集。每项事务都有一个唯一标识符,定义为TID,A和B均为事务T中的非空子

2015-11-11 10:40:17 3093

原创 R语言使用RMySQL连接及读写Mysql数据库

简单说下安装过程,一般不会有问题,重点是RMySQL的使用方式。系统环境说明Redhat系统:Linux 460-42.6.32-431.29.2.el6.x86_64系统编码:LANG=zh_CN.UTF-8(中文UTF-8格式)mysql版本:mysql  Ver 14.14 Distrib 5.1.73, forredhat-linux-gnu (x86_64) using

2015-06-12 15:37:27 17417

原创 Redhat下在R中安装RODBC和RMySQL包

R里面连接数据库的包还挺多的,这两个是比较常用的。Redhat系统下,直接在R程序中用install.packages命令安装这两个包会出错,不可预测的错,可能是它需要依赖其它的软件。RODBC需要先安装下面两个:yum install unixODBCyum install unixODBC-develRMySQL需要先安装Mysql:yum install mysql-de

2015-06-11 17:00:28 1644

原创 R语言读写中文编码方式

R语言读写数据的方法很多,这里主要是我在使用read.csv/read.table和write.csv/write.table时遇到的一些中文格式编码的问题。常见的中文编码方式两种:GBK(GB2312)和UTF-8。    Windows系统下:    read.csv()和read.table()方法不指定文件格式时,默认读取的文件是GBK格式。Rstudio里面有设置默认文本编码方式

2015-06-11 09:35:04 90091 4

原创 Redhat下R安装Rwordseg包

常用来做中文文本分析的一个包是Rwordseg,虽然很久没见更新了,但是在做中文分词时,它还是一个很好地选择。Rwordseg包的安装很容易出错,不管是在windows还是在Linux的系统下。之前在windows系统下装过一次,各种纠结最后搞定,最近转战Redhat又重新遭遇各种新问题。还是把过程记录下来,留作以后查看。    Rwordseg依赖包rJava,但是安装rJava包也是一个比

2015-06-01 20:12:45 1977 2

原创 Redhat下安装配置R程序

主要是我在Redhat下开始尝试使用R时遇到的一些基本的问题,参考了很多文章,把自己的过程记录一下,留存。1.       安装R在Redhat下安装R程序有两种方式。一是下载编译安装,而是用yum安装。yum安装如果你的yum源能正常使用那么一条命令就能搞定:yum install R源码安装你可能需要自己定义一些安装项,那么可以选择源码安装。但是yum可以自动帮你下载安

2015-05-29 20:47:47 3968

原创 Redhat将yum源改为CentOS

Redhat需要注册才可使用其默认的yum源来下载更新软件,所以更好的选择是将yum源改为CentOS。今天尝试了给机器修改yum源,过程有些艰辛,但实际不难,把过程记录一下。    参考文章:http://blog.chinaunix.net/uid-20940095-id-3275311.html,里面的过程讲的特别详细,但是完全照着做会有版本的问题,参考文章中用到的6.3CentOS已经

2015-05-28 13:54:01 1426

原创 回归预测及R语言实现 Part2 回归R语言实现

下面是回归分析的各种变体的简单介绍,解释变量和相应变量就是指自变量和因变量。    常用普通最小二乘(OLS)回归法来拟合实现简单线性、多项式和多元线性等回归模型。最小二乘法的基本原理前面已经说明了,使得预测值和观察值之差最小。    R中实现拟合线性模型最基本的函数是lm(),应用格式为:    myfit     data为观测数据,应该为一个data.frame,

2015-05-26 16:41:14 8058

转载 R语言进行中文分词和聚类

原文来自:http://www.csdn123.com/html/itweb/20130911/113549_113527_113553.htm目标:对大约6w条微博进行分类环境:R语言 由于时间较紧,且人手不够,不能采用分类方法,主要是没有时间人工分类一部分生成训练集……所以只能用聚类方法,聚类最简单的方法无外乎:K-means与层次聚类。尝试过使用K-means方法,但结果

2015-05-20 13:00:25 4428

原创 回归预测及R语言实现 Part1 回归基础综述

Part1 回归基础综述回归方法有很多种,最常见的是线性回归(又有一元和多元之分)、多项式回归、非线性回归。另外还将简单说明对预测结果的检验方法。 线性回归一元线性回归,是最简单最常见的回归模型,类似初中数学中的一元一次方程,它的基本模型如下:我们常见的一元线性回归方程一般没有最后一项,确切的说,我们在实际的应用中也忽略了最后一项。最后一项ui的现实意义是:它是指除

2015-05-19 10:24:52 2204

原创 R语言基本备忘-统计分析

Part1 相关统计量说明峰度系数Coefficientof kurtosishttp://baike.baidu.com/link?url=gS_sgtNYSRdjLnadNWDDa357DIzJma-tdheAx5eKp0WzTvuH_PYg8hnMNIiP4-DRmewtftVQXXUbtIYzvz4bTq峰度系数(Kurtosis)用来度量数据在中心聚集程度。在正态分布情况下,

2015-05-12 09:46:02 7692

原创 常见预测方法及其特点

常见预测方法及其特点 方法名适用时间方法说明需要数据定性方法专家会议法长期预测组织专家以会议的形式进行预测,综合专家意见得出结论市场历史发展资料信息德尔菲法长期预测专家会依法的发展,对多名专家匿名调查,多轮反馈整理对

2015-05-07 14:06:26 23066

原创 R语言基础备忘-plot()详解

plot是R中的基本画图工具,直接plot(x),x为一个数据集,就能画出图,soeasy!但是细节往往制胜的关键。所以就详细来看下plot的所有可设置参数及参数设置方法。 下面讲到的图形参数,是graphic包中的常见参数,graphic不同图形方法中,这些参数都是相同的。type图形的类型“p”点图“l”线图“b”点线图,线不穿过点“c”虚线图“o”点线图,线穿

2015-05-06 17:10:08 24469

原创 R语言基础备忘

参考:《R语言实战》1.      获取帮助help.start()打开帮助文档首页help("foo")或?foo 查看函数foo的帮助(引号可以省略)help.search("foo")或??foo 以foo为关键词搜索本地帮助文档example("foo") 函

2015-04-17 11:14:14 1745

原创 R语言对苏州天气的分析及预测 温度篇

温度篇    前面已经讲了苏州的天气特点,还是用相同的数据,做接下来的苏州气温特点的分析预测,是的预测在这里!         首先看下2011年到2015年苏州整体的温度表现是什么样的。plot(suzhou$highestTemp,type="l",col="red",main="苏州2011-2015年气温图",xlab="时间轴",ylab="温度℃")lines(suz

2015-04-10 17:40:48 9246 6

原创 R语言对苏州天气的分析及预测 天气篇

坐标苏州,来这边刚好一年的时间,又到四月,梅雨季节(?)最能感受到烟雨江南的朦胧美,才怪!实际上的心情是,“清明时节雨纷纷,放假宅家欲断魂”,已经无力吐槽这春夏交战冬天突围的诡异天气变化了,正好有时间,所以想用高大上的技术语言来解读一下苏州的天气特点。    历史天气数据来源:http://tianqi.2345.com/wea_history/54511.htm,这是北京的历史数据,采样城市

2015-04-09 15:35:20 6879 15

原创 用R语言分析《我是歌手》出场顺序与名次的关系

上周《我是歌手》吵吵闹闹地落幕了,这一季是我最关注的一季,很认真的从头看到尾。网上各种讨论,特别反感那些说看到谁谁谁就不想看了的说法,其实单纯地去听他们的歌声,会觉得即使是之前不看好的那些歌手都能给你很多惊喜和感动。以前对清华哥哥的印象是歌都很好听,但是自己唱不红,翻唱都会变红啊,现在喜欢上他的声音了啊!不管这个节目有没有什么内部操作黑幕,单纯听他们的歌还是挺好的。当然,这篇文章的主旨不在此,我们

2015-04-02 13:19:08 3000 3

原创 提升R语言程序性能

1.       性能测评时间测定方法R中提供的测量时间最简单的方法是system.time函数。system.time(expr, gcFirst=TRUE)这个函数会在不降低程序运行性能的情况下,执行表达式expr,gcFrist则是指定程序运行前是否先执行垃圾回收。do.stuff <- function(){a <- 1:100000for(i in 1:100

2015-03-31 14:40:40 4965

原创 R语言绘图——Graphics包

先给出一下参考说明:R绘图 http://www.cnblogs.com/holbrook/archive/2013/05/13/3075777.htmlR语言中颜色对照表 http://wenku.baidu.com/link?url=PnCsIjv3e_OGw2COt4AEo3_tHTisOYoHLGf9bf-jjzkfGIJhFZpEQrS6CAELUypnR82Wdj6Vc

2015-03-20 17:14:34 10498

原创 R语言做文本挖掘 Part5情感分析

Part5情感分析 这是这个系列里面最后一篇文章了,其实这里文本挖掘每一个部分单拎出来都是值得深究和仔细研究的,我还处于初级研究阶段,用R里面现成的算法,来实现自己的需求,当然还参考了众多网友的智慧结晶,所以也想把我的收获总结出来分享给大家,希望也能像我一样在看大家的分享时得到自己的启发。网上翻了下中文文本情感分析的一些文章,再回想了一下我自己做情感分析的方法,觉得我的想法真的是简单粗

2015-03-19 17:14:13 10404 11

原创 R语言做文本挖掘 Part4文本分类

Part4文本分类Part3文本聚类里讲到过,分类跟聚类的简单差异。所以要做分类我们需要先整理出一个训练集,也就是已经有明确分类的文本;测试集,可以就用训练集来替代;预测集,就是未分类的文本,是分类方法最后的应用实现。1.       数据准备训练集准备是一个很繁琐的功能,暂时没发现什么省力的办法,根据文本内容去手动整理。这里还是使用的某品牌的官微数据,根据微博内容,我将它微博

2015-03-18 16:30:34 7341 9

原创 R语言做文本挖掘 Part3文本聚类

Part3文本聚类分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:分类算法:http://blog.csdn.net/chl033/article/details/5204220聚类算法:http://blog.chinaunix.net/uid-10289334-id-3758310.html文本分

2015-03-16 20:54:35 17900 15

原创 R语言的小个性

这篇文章用来记录我在学习使用R语言中遇到的一些区别于其他程序语言的小问题,以及一些解决方案。会持续记录下去。1.       除法R语言的除法运算符与其他常见语言一致:/> 8/5[1] 1.6但是取余运算符为:%%> 8%%5[1] 3除法运算取整除数:%/%> 8%/%5[1] 1除法四舍五入:round()round()后面再带一个参数表明保留

2015-03-12 14:20:50 3920

转载 jdk与jre的区别

原地址:http://www.cnblogs.com/myitm/archive/2011/05/03/2035942.html很多程序员已经干了一段时间java了依然不明白jdk与jre的区别。JDK就是Java Development Kit.简单的说JDK是面向开发人员使用的SDK,它提供了Java的开发环境和运行环境。SDK是Software Development K

2015-03-08 21:31:55 606

原创 R语言做文本挖掘 Part2分词处理

Part2分词处理在RStudio中安装完相关软件包之后,才能做相关分词处理,请参照Part1部分安装需要软件包。1.       RWordseg功能说明文档可在http://download.csdn.net/detail/cl1143015961/8436741下载,这里只做简单介绍。分词> segmentCN(c("如果你因为错过太阳而流泪", "你也会错过星星

2015-03-06 23:57:29 23289 37

原创 R语言做文本挖掘 Part1安装依赖包

Part1安装依赖包R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装Java。 第一步是安装Java,请安装JDK,JRE不行。请对应机型,下载安装32位的JDK。机器里已经有JDK的也请改成32位的,不然没办法使用Rwordseg,尝试使用过64位的,不可行。下载地址:http://www.oracle.com/t

2015-03-05 15:00:43 9422 4

翻译 时间序列的R语言实现_Part3

ARIMA模型前面讲到的指数平滑模型,对于预测误差要求是无相关性并且结果是满足以0为中心的正态分布的。对时间序列作分析是,有些情况下,把相关性考虑进去能做更好的预测。ARIMA模型就包含了对时间序列的无规律部分做预测的模型,在无规律部分,允许出现非零相关性。 对时间序列做差分ARIMA模型是针对稳定时间序列的。若是你的分析对象是非稳定的时间序列,那么你首先就需要对时间序列做差分,直

2015-01-05 17:01:47 2603

翻译 时间序列的R语言实现_Part2

用指数平滑做预测简单指数平滑(Simple Exponential Smoothing)对可用加性模型描述的,非周期性的时间序列数据,可用简单指数平滑来做短期的预测。指数平滑是根据平滑常熟α来做的,α取值在0-1的区间上,α越小越接近0,就表示做预测时对近期观测所取的比重较大。说明:指数平滑算法的原理就是利用历史观测数据对未来做预测,α的取值决定着对近期和远期观测数据所取的权重。详细的

2014-12-30 16:08:45 4342 1

翻译 时间序列的R语言实现_Part1

内容来自a little book of r for time series,查看资源请戳:点击打开链接。    翻译基本终于原文,加上了一些我自己的理解说明,有任何问题欢迎指正,谢谢!时间序列数据读取时间序列数据是指按时间排好序的数据。可以指定开始时间,时间周期等参数。下面是三个时间序列的读取的例子:1. 英国历任国王去世年龄klnq3Read42<一SCanite几

2014-12-29 14:31:56 4453

转载 时间序列平滑法在产品产量预测中的应用(很好的文章!!!)

来源:http://www.zgpg.net/Item/15574.aspx摘要:应用收益法进行企业价值评估必须对企业的未来收益进行预测。如何科学地预测企业的未来收益,始终是企业价值评估中的难点。而产品产量(销量)的预测又是企业未来收益预测的基础。本文介绍了布朗单一参数线性指数平滑法、霍特双参数指数平滑法、布朗三参数指数平滑法及温特线性和季节性指数平滑法四种时间序列平滑法在产品产量预测中的

2014-12-23 09:50:27 5707

原创 时间序列之灰色预测

灰色预测是针对灰色系统所做的预测。控制论中,信息的多少常以颜色的深浅来表示,信息充足、确定为白色;信息缺乏、不确定为黑色;部分确定部分不确定为灰色。灰色系统指信息不完全的系统,信息的不完全可能是系统因素不完全明确,元素关系不完全清楚,系统结构不完全知道,系统的作用原理不完全明了。灰色预测模型所需建模信息较少,运算方便,建模精度高,是处理小样本预测问题的有效工具,但缺少对系统内在机理的

2014-11-25 16:05:45 12634 1

原创 时间序列之差分自回归移动平均法(ARIMA)

ARIMA模型的基本思想是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARMIA模型有四种形式:移动平均模型-MA(q)、自回归模型-AR(p)、自回归移动平均模型ARMA(p,q)以及差分自回归移动平均模型ARIMA(p,d,q ),可以说所有模型都是ARIMA(p,d,q )的变体。 ARIMA(p,

2014-11-24 17:30:19 37384

原创 时间序列之指数平滑法(Exponential Smoothing)

统计中,预测方法除了利用多个影响因素建立回归模型来做预测外,在影响因素复杂,或者是没办法得到相关影响因素的数据信息时,回归模型就无能为力了。如果数据是时间序列上的值,在时间上可能呈现一定的稳态或者规律,利用过去时间区间的值来预测未来值,指数平滑法是其中的一个方法。α平滑常数的确定指数平滑法中最重要的一个参数是平滑常数α,α的取值范围是[0-1],α

2014-11-13 16:09:47 62249 3

原创 R软件的安装及常规操作

R软件是R语言的常用IDE,相比其他语言的开发环境而言,R软件轻量简单,但是功能还是很强大的。安装R软件在Windows系统上的安装过程:下载软件,地址http://ftp.heanet.ie/mirrors/cran.r-project.org,选择win运行环境下的下载,或者从这里下载……。安装软件,过程很简单,有语言选择和自定义安装,自己根据需要选择定义。自定义安

2014-11-05 17:27:50 5467 1

转载 HTTP 状态代码

如果向您的服务器发出了某项请求要求显示您网站21kaiyun.com上的某个网页(例如,当用户通过浏览器访问您的网页时),那么,您的服务器会返回HTTP 状态代码以响应该请求。此状态代码提供了有关请求状态的信息。一些常见的状态代码为:200 - 服务器成功返回网页404 - 请求的网页不存在503 - 服务器暂时不可用以下提供了 HTTP状态代码的完整列表。1x

2014-10-13 17:14:17 374

原创 Javascript获取url夹带参数

location.search可获取url的?后面携带的数据(包括?)location.search.slice(1)去掉?location.search.splite('=')按'='切割成数组有时候的url中带有的中文获取出来后是乱码,这是因为url会有一个加密解密的过程,这时候,对URL进行解密就行decodeURI(location.search.slice(1))

2014-10-13 17:10:28 546

转载 Javascript获取验证码方法

JS代码function getCode(){ var seed = new Array( 'abcdefghijklmnopqrstuvwxyz', 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', '0123456789');//验证码来源26个字母的大小写和10个阿拉伯数字 var idx,i; var r

2014-10-13 17:08:36 1028

转载 获取页面高度宽度的各种方法及其差别

网页可见区域宽:document.body.clientWidth;网页可见区域高:document.body.clientHeight;网页可见区域宽: document.body.offsetWidth    (包括边线的宽);网页可见区域高: document.body.offsetHeight   (包括边线的宽);网页正文全文宽:document.body.scrollW

2014-10-13 16:59:02 777

Rwordseg_Vignette_CN

Rwordseg 是一个R环境下的中文分词工具,使用rJava调用Java分词工具Ansj

2015-02-10

时间序列的R实现

如题,时间序列的R语言实现,英文版,2009年出版,涉及时间序列常见的几种预测模型,以及这些模型在实际中的应用。

2014-12-29

a little book of r for time series

时间序列的R语言实现,主要包括指数平滑法和ARIMA法的实现

2014-12-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除