自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 资源 (4)
  • 收藏
  • 关注

原创 服务和小区分类

2019-01-13 14:36:26 549

原创 空闲模式

RRC_IDLE是一种UE驻留在某个小区但没有建立任何无线资源控制(RRC)连接的接入层(Access Stratum)状态。一般来说,没有任何RRC连接意味UE在小区内没有被网络识别,因为eNB没有UE的上下文信息。一旦一个UE开启,它会执行PLMN选择过程。一旦PLMN被选定,为了选择适当的预占小区,小区选择过程随之进行。在成功进行小区选择后,UE会尝试通过执行在NAS层的附加过程在MM...

2019-01-13 14:18:55 1314

原创 3GPP规范列表

2019-01-13 14:00:16 3909

原创 网络关系图

g <- graph(c(2,1,3,1,4,1,5,1,6,1,7,1),directed = F)par(mfrow=c(2,3))plot(g,vertex.size=40,layout=layout_on_grid,main="简单网络布局")plot(g,vertex.size=40,layout=layout.auto,main="自动布局")plot(g,vertex....

2018-12-23 19:42:54 5742

原创 智能推荐

Recommender(data, method, parameter = NULL)类“ratingMatrix”:用于评级数据的虚拟类类“realRatingMatrix”:实值评级矩阵对象可以通过调用new形式(“realRatingMatrix”,data = m)创建,其中m是包矩阵中类dgCMatrix的稀疏矩阵,或者通过强制从一个常规矩阵、一个包含用户/项/评级三联的dat...

2018-12-23 13:10:17 1446

原创 用户分析

1、用户分类新增用户、留存用户、活跃用户、有效用户、流失用户、僵尸用户。2、LTVLifetime Value 生命周期价值,新增用户在给定时间内的活跃天数。ARPU平均每活跃用户收入。3、用户物品购买关联分析Apriori 算法支持度:交集/全集置信度:X∩Y/X提升度:X∩Y/(Y-X∩Y)data1 = read.csv("玩家购物数据.csv")library(resh...

2018-12-23 11:14:44 552

原创 留存分析

# 前期实际留存率数据(day <- seq(1:7)) # 天数(ratio <- c(0.392,0.278,0.196,0.166,0.106,0.096,0.046)) # 留存率值# 利用nls函数求出幂指数函数y=a*x^b的系数a、bfit <- nls(ratio~a*day^b,start = list(a=1,b=1))# 查看模型结果summar...

2018-12-18 23:41:25 819

原创 路径分析

# sunburst事件路径图# 加载sunburstR包require(sunburstR)# 导入sequences数据sequences <- read.csv( system.file("examples/visit-sequences.csv",package="sunburstR") ,header = FALSE ,stringsAsFactors = FA...

2018-12-16 11:04:13 3703

原创 漏斗模型图

data3 <- read.csv("新手教程路径留存人数统计.csv")data3data3_ordered <- data3[order(data3$用户数),] barplot(data3_ordered$用户数,horiz = T,axes=F,border=F, space=0.5,col="steelblue1",xlim=c(-700,700),ma

2018-12-16 10:24:22 1608

原创 交互式图形

library(leaflet)leaflet() %>% addTiles() %>% addMarkers(lng=112.768,lat=31.852,popup="8888")LTV <- read.csv("LTV.csv")LTV.ts <- ts(LTV)dygraph(LTV.ts,main="LTV forecast") %>% ...

2018-12-16 10:13:07 744

原创 plotly包

plot_ly(revenue,x=~游戏名称,y=~本周,type="bar",name="本周")plot_ly(revenue,x=~游戏名称,y=~本周,type="bar",name="本周")%>% add_trace(y=~上周,name="上周")layout(barmode='stack',xaxis=list(title=""),yaxis

2018-12-15 18:00:52 566

原创 rbokeh包

带拟合线的散点图z <- lm(dist~speed,data = cars)p <- figure(width = 600,height = 600) %>% ly_points(cars,hover = cars) %>% ly_lines(lowess(cars),legend = "lowess") %>% ly_abline(z,type =...

2018-12-15 17:21:58 253

原创 recharts包

library(recharts)echartr(iris,Sepal.Length,Sepal.Width)echartr(iris,Sepal.Length,Sepal.Width,series = Species)#分组可以把修改用%>%串联起来echartr(iris,Sepal.Length,Sepal.Width,series = Species) %>...

2018-12-15 17:02:45 920

原创 交互式绘图

library(rCharts)hair_eye_male <- subset(as.data.frame(HairEyeColor),Sex=="Male")hair_eye_male[,1] <- paste0("Hair",hair_eye_male[,1])hair_eye_male[,2] <- paste0("EYE",hair_eye_male[,2])nP...

2018-12-15 15:41:20 668

原创 ggplot2绘图工具

qplotqplot(Species,Sepal.Length,data = iris,geom = "boxplot",fill=Species, main = "根据种类分组的花萼长度")小提琴图qplot(Species,Sepal.Length,data=iris,geom=c("violin","jitter"),fill=Species,main = "小提琴图...

2018-12-15 14:47:03 584 1

原创 lattice绘图工具

library(lattice)data1 <- data.frame(x=seq(0,14),y=seq(3,17),z=rep(c("a","b","c"),times=5))xyplot(y~x,data = data1)show.settings()xyplot(y~x,groups = z,data = data1)myset

2018-12-15 12:57:11 1352

原创 高级绘图函数

函数描述plot(x)x元素值为纵坐标plot(x,y)sunflowerplot(x,y)花瓣数为点个数pie(x)饼图boxplot(x)箱型图dotchart(x)mosaicplot(x)马赛克图pairs(x)散点图矩阵hist(x)直方图barplot(x)条形图qqnorm(x)正态...

2018-12-12 20:24:20 635

原创 电力窃漏电用户自动识别 细节

# 计算每类用户类别及用户数Type <- table(data_FB[, 3])# 方法1:基础绘图p <- barplot(Type, space = 0, ylim = c(0, 30), col = rainbow(7), xaxt = "n", ylab = "计数", main = "窃电用户用电类别分布分析")df <- dat...

2018-12-12 09:16:26 716 1

原创 电力窃漏电用户自动识别

一、背景与挖掘目标传统防窃漏电主要通过定期巡检、定期校验电表、用户举报等手段来发现窃电或者计量装置故障。但这种方法对人的依赖性太强,抓取查漏目标不明确。目前,很多供电局主要通过营销稽查人员、用电检查人员和计量工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况的在线监控,通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息,建立数据分析模型,来实时监测窃漏电情况和计量装置故...

2018-12-11 23:35:17 1239 3

原创 低级绘图--点、文字、线

points(x, y = NULL, type = “p”, …)type:一个字符串,给出所需的绘图类型。对于细节,可以使用以下值:“p”表示点,“l”表示线,“b”表示点和线,“c”表示由线连接的空点,“o”表示过度绘制的点和线,“s”和“s”表示楼梯,“h”表示直方图样的垂直线。最后,“n”不产生任何点或直线text(x, y = NULL, labels = seq_along(x$...

2018-12-11 14:23:36 182

原创 低级绘图--网格线

grid(nx = NULL, ny = nx, col = "lightgray", lty = "dotted", lwd = par("lwd"), equilogs = TRUE)nx:垂直网格的数据ny:水平网格的数据barplot(VADeaths,besides=TRUE,col = cm.colors(5))grid()barplot(VADeaths,bes...

2018-12-11 14:14:56 323

原创 低级绘图--图例

legend(x, y = NULL, legend, fill = NULL, col = par(“col”),border = “black”, lty, lwd, pch,angle = 45, density = NULL, bty = “o”, bg = par(“bg”),box.lwd = par(“lwd”), box.lty = par(“lty”), box.col =...

2018-12-11 14:06:43 310

原创 低级绘图--坐标轴

axis(side, at = NULL, labels = TRUE, tick = TRUE, line = NA,pos = NA, outer = FALSE, font = NA, lty = “solid”,lwd = 1, lwd.ticks = lwd, col = NULL, col.ticks = NULL,hadj = NA, padj = NA, …)side : ...

2018-12-11 13:34:43 366

原创 低级绘图--标题

attach(iris)boxplot(Sepal.Length ~ Species,col=heat.colors(3),main = list("Sepal.Length按照Species分类的箱型图",font=4, col="red",cex=2))title(main = NULL, sub = NULL, xlab = NULL, ylab = NULL,line = NA...

2018-12-11 12:36:56 163

原创 时序模式

模型算法描述平滑法常用于趋势分析和预测,利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化。可具体分为移动平均和指数平均趋势拟合法时间作为自变量,相应的序列观察值作为因变量,建立回归模型。根据序列的特征,可具体分为线性拟合和曲线拟合组合模型时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响。可构建加法模型和乘法模型AR模...

2018-12-11 12:17:47 540

原创 关联规则

算法名称算法描述Apriori关联规则最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连续产生候选像及其支持度然后通过剪枝生成频繁项集FT-Tree针对Apriori算法固有的多次扫描事务数据集的缺陷,提出的不产生候选频繁项集的方法Eclat一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间划分为较小的子空间...

2018-12-11 11:57:52 638

原创 聚类分析

聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。类别主要算法划分方法K-Means、K-MEDOIDS(K中心点)、CLARANS(基于选择的方法)层次分析方法BIRCH(平衡迭代规约和聚类)、CURE(代表点聚类)、CHAMELEON(动态模型)基于密度的方法DBSCAN(基于高密度连续区域)、DENCLUE(密度分布函数)、O...

2018-12-11 11:49:02 710

原创 常用的分类与预测算法

算法名称算法描述回归分析确定预测属性与其他变量间相互依赖的定量关系最常用的统计学方法决策树自顶向下的递归方式,在内部节点进行属性值的比较,并根据不同的属性值从该节点下分支,最终得到的叶节点是学习划分的类人工神经网络输入与输出之间关系的模型贝叶斯网络不确定知识表达和推理领域最有效的理论模型之一支持向量机把低维的非线性可分转化为高维的线性可分,在高...

2018-12-11 11:37:27 18773

原创 逐条输入构建图形元素

颜色参数描述col默认绘图颜色fg图形前景颜色bg图形背景颜色col.axis坐标轴刻度文字颜色col.lab坐标轴标签颜色col.main标题颜色col.sub副标题颜色plot(women,main="身高VS体重散点图",sub="数据来源:women数据集",col="red",col.main="green",...

2018-12-10 17:13:09 120

原创 玩家偏好分析

计算简单的对应分析data2 <- read.csv("玩家喜好分析数据.csv")head(data2)row.names(data2) <- data2[,1]head(data2)library(ca)data2.ca <- ca(data2[,-1])data2.ca第一部分,各特征根的值及贡献率第二、三部分,列联表的卡方检验plot(data2....

2018-12-10 14:40:13 423

原创 主成分分析与因子分析

主成分分析1、标准化处理,消除量纲2、特征根与特征向量3、方差贡献率、累积贡献率4、确定主成分主成分与因子分析主成分分析会把主成分表示成各原始变量的线性组合,因子分析则把原始变量表示成各个因子的线性组合。主成分分析重点解释原始变量之间总方差,因子分析重点解释原始变量的协方差。主成分分析中,有几个原始变量就有几个主成分,因子分析中,因子量可以认为根据环境确定。princomp(x,...

2018-12-10 14:10:37 989

原创 游戏数据相关分析案例

data1 <- read.csv("logindata.csv")str(data1)因子转哑变量library(caret)dmy <- dummyVars(~.,data = data1)dmytsrf <- data.frame(predict(dmy,newdata = data1))str(dmytsrf)# 自定义相关性函数cor.prob...

2018-12-10 13:48:04 2177

原创 相关关系可视化

corrgram函数生成相关矩阵的图形显示,称为correlogram。矩阵的单元格可以用阴影或彩色来表示相关值corrgram(x, type = NULL, order = FALSE, labels, panel = panel.shade,lower.panel = panel, upper.panel = panel, diag.panel = NULL,text.panel = ...

2018-12-10 13:14:55 866 2

原创 相关分析

cor(x, y = NULL, use = “everything”,method = c(“pearson”, “kendall”, “spearman”))use:一种可选的字符串,提供了一种在缺少值时计算协方差的方法。这必须是字符串“everything”、“all.obs”, “complete.obs”, “na.or.complete”, or "pairwise.complet...

2018-12-10 13:00:27 536

原创 时间序列数据预测

ts(data = NA, start = 1, end = numeric(), frequency = 1,deltat = 1, ts.eps = getOption(“ts.eps”), class = , names = )start:第一次观测的时间。单个数字或两个整数的向量,它们指定一个自然时间单位和进入时间单位的(基于1的)样本数量end:最后一次观测的时间,用与开始相同的方...

2018-12-08 17:55:17 1668

原创 指标数据可视化

1、单指标线性图2、双指标散点图data1 <- read.csv("可视化数据.csv")plot(data1$活跃用户~data1$新增用户,pch=16)abline(lm(data1$活跃用户~data1$新增用户),col="blue",)3、三指标plot(data1$活跃用户~data1$新增用户,pch=16,cex=data1$付费率*2,col="vi...

2018-12-08 12:50:30 1333

原创 哑变量处理

dummyVars(formula, data, sep = “.”, levelsOnly = FALSE, fullRank = FALSE, …)sep:因子变量名及其级别之间的可选分隔符。使用sep = NULL表示没有分隔符(即模型的正常行为)。data4 <- read.csv("玩家玩牌数据.csv")head(data4)library(VIM)aggr(data...

2018-12-08 12:28:23 2870

原创 数据转换

衍生变量data1 <- read.csv("数据转换数据.csv",na.strings = NA)#日期格式转换data1$registration <- as.Date(paste(substr(data1$registration,1,4), substr(data1$registration,5,6...

2018-12-08 10:47:15 744

原创 异常值判断处理

1、简单统计量分析2、3σ准则data <- rnorm(20)plot(data,type = "l",lwd=1.5,ylim = c(-4,4),xlim = c(0,23), xlab=NA,ylab=NA,main = "质量控制图")lines(rep(mean(data),20),lwd=1.8)text(21,mean(data),"均值线")lines...

2018-12-07 22:59:07 1382

原创 对缺失值赋值

查看数据缺失情况questionnaire <- read.csv("问卷调研数据.csv",header = TRUE)dim(questionnaire)#查看行数和变量library(VIM)aggr(questionnaire[,-1],prop=FALSE,numbers=TRUE)#不要序号,以绝对数显示,有标签建立逻辑回归模型,对性别进行预测for(i in 2...

2018-12-06 23:25:41 996

Tableau商业分析案例数据源

使用最新的 Tableau 2018.1 版本对分析过程重新截图,而且按照高校的教学目标匹配了案例的广度与深度。书中的案例,部分选自 Tableau 原厂的演示数据,其他绝大多数则由国内的真实案例修改而来。

2018-12-06

CDA数据分析师基础理论

数据库、数据分析师、大数据方面的经典教程;人大经济论坛教程

2018-12-04

《用商业案例学R语言数据挖掘》教材代码及数据

本书是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据挖掘的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及,而且都辅以图形做形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。但是本书强调每种方法的假设、适用条件都与商业数据分析的主题匹配。在教学实践中,我们发现业务经验丰富和有较好商业模式理解的学员,在学习数据挖掘时有更好的效果,主要原因可能是这类学员有较强的思辨能力、分析能力、学习目的性和质量意识,而不是简单地模仿和套用数学公式。

2018-11-28

预测分析中的建模技术:商务问题与R语言解决方案

《预测分析中的建模技术:商务问题与R语言解决方案》着眼于真实的案例和真实的数据。每章通过对一个实际问题的描述和讨论引出特定的预测分析模型,分析的结果通过可视化图表进行展示,章节末尾还提供了R语言编写的应用程序

2018-11-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除