9 EchoCaiCai

尚未进行身份认证

把一件事做到极致!

等级
博文 44
排名 2w+

R语言实现RMF模型

RMF模型说明RMF模型是客户管理中,常被用来衡量客户价值和客户创利能力的重要方法。它主要考量三个指标:最近一次消费-Recency:近期购买的客户倾向于再度购买消费频率-Frequency:经常购买的客户再次购买概率高消费金额-Monetary:消费金额较多的客户再次消费可能性更大根据上述三个维度,对客户做细分,假定每个维度划分成五个等级,得到客户的R值(1-5),F值(1-

2015-12-29 17:06:15

R语言读取Excel文件

因为一个项目需要,原始数据全部是Excel文件,包括.xls和.xlsx格式,并且很多excel数据的格式并不规范,一个个转为csv格式不太现实,所以把所有能了解到的读取excel的方法都试了一遍,做个简单汇总。相关的包:RODBC、xlsx、openxlsx、gdata、readxl,测试平台win7。RODBC包-相关方法RODBC-odbcConnectExcel2007()

2015-11-25 13:34:44

数据挖掘算法基础-关联规则

数据挖掘中,被常拿来说的啤酒尿布的例子就是一个很典型的运用关联算法来做购物来分析的例子。常被用于交易数据、关系数据的分析,发现数据集中隐藏的频繁模式,这些频繁模式可以用关联规则的形式表示,有效的关联规则对商家的商品进出货摆放都有很大的指导意义。设是项的集合,数据集D是事务的集合,每项事务T是一个非空项集,且T是I的非空子集。每项事务都有一个唯一标识符,定义为TID,A和B均为事务T中的非空子

2015-11-11 10:40:17

R语言使用RMySQL连接及读写Mysql数据库

简单说下安装过程,一般不会有问题,重点是RMySQL的使用方式。系统环境说明Redhat系统:Linux460-42.6.32-431.29.2.el6.x86_64系统编码:LANG=zh_CN.UTF-8(中文UTF-8格式)mysql版本:mysql Ver14.14Distrib5.1.73,forredhat-linux-gnu(x86_64)using

2015-06-12 15:37:27

Redhat下在R中安装RODBC和RMySQL包

R里面连接数据库的包还挺多的,这两个是比较常用的。Redhat系统下,直接在R程序中用install.packages命令安装这两个包会出错,不可预测的错,可能是它需要依赖其它的软件。RODBC需要先安装下面两个:yuminstallunixODBCyuminstallunixODBC-develRMySQL需要先安装Mysql:yuminstallmysql-de

2015-06-11 17:00:28

R语言读写中文编码方式

R语言读写数据的方法很多,这里主要是我在使用read.csv/read.table和write.csv/write.table时遇到的一些中文格式编码的问题。常见的中文编码方式两种:GBK(GB2312)和UTF-8。  Windows系统下:  read.csv()和read.table()方法不指定文件格式时,默认读取的文件是GBK格式。Rstudio里面有设置默认文本编码方式

2015-06-11 09:35:04

Redhat下R安装Rwordseg包

常用来做中文文本分析的一个包是Rwordseg,虽然很久没见更新了,但是在做中文分词时,它还是一个很好地选择。Rwordseg包的安装很容易出错,不管是在windows还是在Linux的系统下。之前在windows系统下装过一次,各种纠结最后搞定,最近转战Redhat又重新遭遇各种新问题。还是把过程记录下来,留作以后查看。  Rwordseg依赖包rJava,但是安装rJava包也是一个比

2015-06-01 20:12:45

Redhat下安装配置R程序

主要是我在Redhat下开始尝试使用R时遇到的一些基本的问题,参考了很多文章,把自己的过程记录一下,留存。1.      安装R在Redhat下安装R程序有两种方式。一是下载编译安装,而是用yum安装。yum安装如果你的yum源能正常使用那么一条命令就能搞定:yuminstallR源码安装你可能需要自己定义一些安装项,那么可以选择源码安装。但是yum可以自动帮你下载安

2015-05-29 20:47:47

Redhat将yum源改为CentOS

Redhat需要注册才可使用其默认的yum源来下载更新软件,所以更好的选择是将yum源改为CentOS。今天尝试了给机器修改yum源,过程有些艰辛,但实际不难,把过程记录一下。  参考文章:http://blog.chinaunix.net/uid-20940095-id-3275311.html,里面的过程讲的特别详细,但是完全照着做会有版本的问题,参考文章中用到的6.3CentOS已经

2015-05-28 13:54:01

回归预测及R语言实现 Part2 回归R语言实现

下面是回归分析的各种变体的简单介绍,解释变量和相应变量就是指自变量和因变量。  常用普通最小二乘(OLS)回归法来拟合实现简单线性、多项式和多元线性等回归模型。最小二乘法的基本原理前面已经说明了,使得预测值和观察值之差最小。  R中实现拟合线性模型最基本的函数是lm(),应用格式为:  myfit  data为观测数据,应该为一个data.frame,

2015-05-26 16:41:14

R语言进行中文分词和聚类

原文来自:http://www.csdn123.com/html/itweb/20130911/113549_113527_113553.htm目标:对大约6w条微博进行分类环境:R语言 由于时间较紧,且人手不够,不能采用分类方法,主要是没有时间人工分类一部分生成训练集……所以只能用聚类方法,聚类最简单的方法无外乎:K-means与层次聚类。尝试过使用K-means方法,但结果

2015-05-20 13:00:25

回归预测及R语言实现 Part1 回归基础综述

Part1回归基础综述回归方法有很多种,最常见的是线性回归(又有一元和多元之分)、多项式回归、非线性回归。另外还将简单说明对预测结果的检验方法。 线性回归一元线性回归,是最简单最常见的回归模型,类似初中数学中的一元一次方程,它的基本模型如下:我们常见的一元线性回归方程一般没有最后一项,确切的说,我们在实际的应用中也忽略了最后一项。最后一项ui的现实意义是:它是指除

2015-05-19 10:24:52

R语言基本备忘-统计分析

Part1相关统计量说明峰度系数Coefficientofkurtosishttp://baike.baidu.com/link?url=gS_sgtNYSRdjLnadNWDDa357DIzJma-tdheAx5eKp0WzTvuH_PYg8hnMNIiP4-DRmewtftVQXXUbtIYzvz4bTq峰度系数(Kurtosis)用来度量数据在中心聚集程度。在正态分布情况下,

2015-05-12 09:46:02

常见预测方法及其特点

常见预测方法及其特点 方法名适用时间方法说明需要数据定性方法专家会议法长期预测组织专家以会议的形式进行预测,综合专家意见得出结论市场历史发展资料信息德尔菲法长期预测专家会依法的发展,对多名专家匿名调查,多轮反馈整理对

2015-05-07 14:06:26

R语言基础备忘-plot()详解

plot是R中的基本画图工具,直接plot(x),x为一个数据集,就能画出图,soeasy!但是细节往往制胜的关键。所以就详细来看下plot的所有可设置参数及参数设置方法。 下面讲到的图形参数,是graphic包中的常见参数,graphic不同图形方法中,这些参数都是相同的。type图形的类型“p”点图“l”线图“b”点线图,线不穿过点“c”虚线图“o”点线图,线穿

2015-05-06 17:10:08

R语言基础备忘

参考:《R语言实战》1.      获取帮助help.start()打开帮助文档首页help("foo")或?foo查看函数foo的帮助(引号可以省略)help.search("foo")或??foo以foo为关键词搜索本地帮助文档example("foo")函

2015-04-17 11:14:14

R语言对苏州天气的分析及预测 温度篇

温度篇  前面已经讲了苏州的天气特点,还是用相同的数据,做接下来的苏州气温特点的分析预测,是的预测在这里!     首先看下2011年到2015年苏州整体的温度表现是什么样的。plot(suzhou$highestTemp,type="l",col="red",main="苏州2011-2015年气温图",xlab="时间轴",ylab="温度℃")lines(suz

2015-04-10 17:40:48

R语言对苏州天气的分析及预测 天气篇

坐标苏州,来这边刚好一年的时间,又到四月,梅雨季节(?)最能感受到烟雨江南的朦胧美,才怪!实际上的心情是,“清明时节雨纷纷,放假宅家欲断魂”,已经无力吐槽这春夏交战冬天突围的诡异天气变化了,正好有时间,所以想用高大上的技术语言来解读一下苏州的天气特点。  历史天气数据来源:http://tianqi.2345.com/wea_history/54511.htm,这是北京的历史数据,采样城市

2015-04-09 15:35:20

用R语言分析《我是歌手》出场顺序与名次的关系

上周《我是歌手》吵吵闹闹地落幕了,这一季是我最关注的一季,很认真的从头看到尾。网上各种讨论,特别反感那些说看到谁谁谁就不想看了的说法,其实单纯地去听他们的歌声,会觉得即使是之前不看好的那些歌手都能给你很多惊喜和感动。以前对清华哥哥的印象是歌都很好听,但是自己唱不红,翻唱都会变红啊,现在喜欢上他的声音了啊!不管这个节目有没有什么内部操作黑幕,单纯听他们的歌还是挺好的。当然,这篇文章的主旨不在此,我们

2015-04-02 13:19:08

提升R语言程序性能

1.      性能测评时间测定方法R中提供的测量时间最简单的方法是system.time函数。system.time(expr,gcFirst=TRUE)这个函数会在不降低程序运行性能的情况下,执行表达式expr,gcFrist则是指定程序运行前是否先执行垃圾回收。do.stuff<-function(){a<-1:100000for(iin1:100

2015-03-31 14:40:40
奖章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!