自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhangyangfeiyu的专栏

数据分析进阶之路

  • 博客(8)
  • 收藏
  • 关注

原创 随机森林:客户流失预测

http://blog.csdn.net/zhangyangfeiyu/article/details/79586549上篇主要针对客户价值进行分析,对于客户流失并没有具体的分析。本文主要对客户流失进行分类预测。1 背景与挖掘目标1.1 背景1、客户流失对利润增长造成的负面影响非常大,仅次于公司规模、市场占有率、单位成本等因素的影响;2、流失一个老客户比获得一个新客户对公司的损失更大;3、航空市场...

2018-03-19 01:00:58 12257 3

原创 K-Means 聚类:客户价值分析

1 背景与挖掘目标1.1 背景1、航空公司业务竞争激烈,企业营销焦点从产品中心转为客户中心;2、针对不同类型客户,进行精准营销,实现利润最大化;3、建立合理的客户价值评估模型,进行客户分类,是解决问题的关键。1.2 挖掘目标1、借助航空公司客户数据,对客户进行分类;2、对不同的客户类别进行特征分析,比较不同类客户的客户价值;3、对不同价值的客户类别提供个性化服务,制定相应的营销策略。2 分析方法与...

2018-03-16 20:36:21 33838 9

原创 IMDB数据看影响电影票房的因素分析

本文是在上一篇的基础上对影响电影票房的因素进行分析,具体如下:一、分析数据选取原则上一篇中我们知道每年电影产出量从1980年开始,呈指数形式增长,2000年左右达到峰值。黑白电影每年产出数量极少,因此在接下来的分析中只对彩色影片进行分析。按国家统计每年电影上映数量,发现电影高产国主要集中在欧美地区。其中美国以2961部的绝对优势排名第一,中国电影数量极少,可能是“国内同类产品竞

2018-01-24 19:43:57 10319 3

转载 R语言:spdep包(空间数据分析与R语言实践)

摘要: 在空间取样中位置越接近的点相应的变量也可能越相近,这种现象称为空间自相关。空间自相关能够改变人们对某些事物原因的判断。举例来说,一个地点物种数高,临近的点物种数也相应得会高些,但这并不一定是由于两个地 ...在空间取样中位置越接近的点相应的变量也可能越相近,这种现象称为空间自相关。空间自相关能够改变人们对某些事物原因的判断。举例来说,一个地点物种数高,临近的

2016-10-26 17:07:50 15903 3

翻译 使用R语言绘制芝加哥矢量图

昨日,一个在南大学城市规划的同学在新浪微博上@我,按照他的意思是把Json数据转换为矢量图,我之前并没有听过好这么转换的,上网站看了一下,发现芝加哥真的把城市规划的数据放在了github上面,具体见这里 :http://thechangelog.com/the-city-of-chicago-is-on-github/随意选择其中的一个,我这里选择的是Bikeroutes in

2016-10-26 16:02:38 1721

转载 R语言常用命令

以下是R编程常用的一些命令(不包括统计分析与作图)。###################################运算符##################################数学运算:+,-,*,/,^,%%。(加,减,乘,除,乘方,求余。)比较运算:>,=,逻辑运算:&,|,!。(与,或,非。)

2016-10-26 15:31:26 849

转载 R 语言常用函数整理

基本一、数据管理vector:向量 numeric:数值型向量 logical:逻辑型向量character;字符型向量 list:列表 data.frame:数据框c:连接为向量或列表 length:求长度 subset:求子集seq,from:to,sequence:等差序列rep:重复 NA:缺失值 NULL:空对象sort,order,unique,rev:排序unlist:展

2016-10-26 15:28:48 1116

转载 R语言数据储存与读取

1 首先用getwd() 获得当前目录,用setwd("C:/data")设定当前目录 2 数据保存创建数据框d>d data.frame(obs = c(1, 2, 3), treat = c("A", "B", "A"), weight = c(2.3, NA, 9))2.1 保存为简单文本>write.table(d, file = "c:/d

2016-10-26 15:17:00 4004

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除