自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Plum

数据分析 数据挖掘 机器学习 数据可视化

  • 博客(19)
  • 收藏
  • 关注

原创 R语言可视化 ggplot2—工具箱(展示数据分布)

展示数据分布Part 1Part 1.1调整组距Part 1.2调整组距+分面(密度)累积直方图频率多边形Part 2箱线图分箱抖动型散点图 jitter密度图(基于核平滑方法进行平滑后得到的频率多边形)有一些几何对象可以用于展示数据的分布,具体使用哪种取决于分布的维度、分布是连续型或是离散型,以及我们感兴趣的是条件分布还是联合分布。对于一维连续型分布,最重要的几何对象是直方图。下图使用直方图展...

2020-03-29 11:57:55 2442 5

原创 R语言可视化 ggplot2—工具箱(基本图形类型)

基本图形类型载入所需包基本图形类型简述实践例子点图+标题条形图+标题+对“值”进行计数折线图+标题面积图(在普通线图的基础上,填充了线下方的面积)路径图(按照数据出现的顺序连接)含标签的散点图(指定点添加标签)色深图或水平图绘制多边形,即填充后的路径载入所需包library(effects)library(ggplot2)基本图形类型简述以下几何对象是ggplot2图形的基本组成部分。...

2020-03-29 10:46:02 2850 6

原创 R语言可视化 ggplot2—统计变换+位置调整+整合

555统计变换位置调整图4.10 直方图的三种变体。例:nlme包的Oxboys数据集统计变换统计变换可将输入的数据集看做输入,将返回的数据集作为输出,因此统计变换可以向原数据集中插入新的变量。例如,常被用来绘制直方图的stat_bin统计变换会生成如下变量:count,每个组里观测值的数目;density,每个组里观测值的密度(占整体的百分数/组宽);x,组的中心位置。这些生成变...

2020-03-28 14:14:21 2989 7

原创 R语言实用技巧——快速设置工作目录

众所周知,从“我的电脑”里面复制的目录长这样:F:\rwork\list-m但是R语言导入的目录的格式为\\或者/这样,如果工作目录较长,我们需要修改的地方就很多,很麻烦。下面我们提供一个快速设置目录的办法,不需要进行修改,直接从“我的电脑”的复制粘贴目录即可。注意只需要把复制好的路径粘贴到第2行位置path<-readline()#括号不写内容,默认读取下一行F:\rwor...

2020-03-27 11:02:56 2740 7

原创 R语言可视化 ggplot2—设定、映射、分组、匹配图形属性和图形对象

p <- ggplot(mtcars, aes(mpg, wt))p + geom_point(colour = “darkblue”)注意这里将颜色映射到’darkblue’与上面将颜色设定给’darkblue’的区别p + geom_point(aes(colour = “darkblue”))The difference between (left) setting colou...

2020-03-27 10:38:46 10230 6

原创 R语言可视化 ggplot2—用图层构建图像

用图层构建图像创建绘图对象图层手动创建图形对象并添加图层应用“快捷函数”,得到与上例相同的图形下面将展示ggplot()和qplot()的等价用法在用ggplot创建的图形对象上添加图层也可以给qplot添加图层例:用不同的数据初始化后添加相同的图层用%*%添加新的数据集来代替原来的数据集图形属性映射aes函数的参数也可以使用变量的函数值作为参数图和图层使用默认的参数映射来添加图层修改图形属性。用...

2020-03-26 12:35:26 2994 9

原创 R语言可视化 ggplot2—语法突破-图形图层语法

图形图层语法耗油量数据散点图散点图+回归线散点图+回归线+分面四种不同标度的图例(大小、颜色、形状、颜色)坐标系保存图形对象读入图形对象将图片保存成png格式library(ggplot2)耗油量数据散点图发动机排量(以升为单位displ)对高速公路耗油量(英里每加仑hwy)散点图。点根据汽缸数目着色。该图可以发现影响燃油经济性最重要的因素:发动机排量大小。qplot(displ...

2020-03-25 19:19:55 1573 3

原创 R语言可视化 ggplot2—分面+其他选项

分面+其他选项分面其他选项分面qplot()中默认的分面方法是将图形拆分成若干个窗格,这可以通过形如row_var~col_var的表达式进行指定。你可以指定任意数量的行变量和列变量,但请注意当变量数超过两个时,生成的图形可能会非常大,以至于不适合在屏幕上显示。如果只想指定一行或一列,可以使用.作为占位符,例如row_var-.会创建一个单列多行的图形矩阵。下用了两张图来展示这个技巧,它们是...

2020-03-25 07:26:40 1348

原创 R语言可视化 ggplot2—几何对象

几何对象重量与价格的散点图中加入了平滑曲线。上图为dsmall数据集,下图为完整数据集。qplot(carat, price, data = dsmall, geom = c("point", "smooth"))qplot(carat, price, data = diamonds, geom = c("point", "smooth"))...

2020-03-24 15:09:27 2272 4

原创 R语言可视化 ggplot2—基本用法+颜色、大小、形状和其他图形属性

自定义标题基本用法颜色、颜色、大小、形状和其他图形属性基本用法library(ggplot2)让样本可重复set.seed(1410) 在diamonds数据集中随机取100个数据dsmall <- diamonds[sample(nrow(diamonds), 100), ]画图,默认点图qplot(carat, price, data = diamonds)这...

2020-03-23 23:09:47 7292

原创 Latex排版 Chapter2格式调整(长度单位、字体、段落、页面、目录)

Chapter2格式调整格式调整字体使用字体编码字体族名字体系列字体大小段落对齐居中对齐单侧对齐页面大小布局目录页格式格式调整\section{格式调整}\subsection{各种长度单位}字体使用\subsection{字体使用}在LaTeX中,一个字体有5种属性:编码(encoding)、族名(family),系列(series)、形状(shape)和大小(size)。字...

2020-03-21 18:05:50 7982

原创 Latex排版 Chapter1基本使用(文档结构插入表格、图片)

设置文章种类\documentclass[a4paper,11pt]{article}文章种类article/book/report/letter\setlength\parindent{2em}载入包\usepackage{ctex} %支持中文\usepackage{graphicx}%插入图片\usepackage{listings}%插入代码\usepackage...

2020-03-20 21:18:42 5995 1

原创 R语言实现 预测数值型数据——回归方法(线性回归、回归树、模型树)

Example: Predicting Medical ExpensesPart 1: Linear RegressionStep 1: Exploring and preparing the data ----insurance <- read.csv("F:\\rwork\\Machine Learning with R (2nd Ed.)\\Chapter 06\\insuran...

2020-01-16 07:59:15 7713 1

原创 R语言实现 独立而治之——规则分类(区分有毒蘑菇)

Example: Identifying Poisonous Mushrooms ----每年都会有很多人因为摄入有毒的野生蘑菇生病,有时甚至死亡。由于许多蘑菇在外观上彼此都非常相似,所以有时甚至经验丰富的蘑菇采集者都会中毒。与识别其他有毒的植物(比如有毒的橡树或者有毒的常春藤)不- -样,识别- -种野生蘑菇是否有毒或者是否可以食用并没有明确的规则,如(有毒的常春藤)“三片叶子,不要碰它们...

2020-01-15 09:31:20 1638 1

原创 R语言实现 分而治之——应用决策树

2007——2008年的全球金融危机凸显了透明度和严密性在银行业务中的重要性。由于信贷供应受到了限制,所以银行正日益紧缩其贷款体系,转向机器学习来更准确地识别高风险贷款。因为决策树的准确性高,以通俗易懂的方法建立统计模型的能力强,所以它广泛地应用于银行业。由于许多国家的政府机构密切监控贷款业务,所以银行的高管必须能够解释为什么一个申请者被拒绝贷款申请,而其他人获得批准。此信息对于希望判断为何自己...

2020-01-14 11:03:17 1031 1

原创 R语言实现 懒惰学习——使用近邻分类

Example: Classifying Cancer Samples ----乳腺癌数据包括569例细胞活检案例,每个案例有32个特征。一个特征是识别号码,一个特征是癌症诊断结果,其他30个特征是数值型的实验室测量结果。癌症诊断结果用编码“M”表示恶性,用编码“B”表示良性。Step 1: Exploring and preparing the data ----import the C...

2020-01-13 09:49:58 1483 1

原创 R语言实现 黑箱方法——支持向量机

Support Vector Machines -------------------Step 1: Exploring and preparing the data ----read in data and examine structure将输入读入到R中,确认接收到的数据具有16个特征,这些特征定义了每一个字母的案例。letters <- read.csv("F:\\rwork...

2020-01-12 17:01:16 603

原创 R语言实现 黑箱方法——神经网络

用人工神经网络对混泥土的强度strength进行建模** ----Step 1: Exploring and preparing the data ----探索与准备数据以下有8个描述混合物成分的特征read in data and examine structure读入数据concrete <- read.csv("F:\\rwork\\Machine Learning wit...

2020-01-11 16:08:01 1990 1

原创 R语言实现 朴素贝叶斯分类

用R进行朴素贝叶斯分类Example: Filtering spam SMS messages ----Step 2: Exploring and preparing the data ----read the sms data into the sms data frameexamine the structure of the sms dataconvert spam/ham to facto...

2020-01-10 19:35:34 5425 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除