自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据分析进阶

不会写 Python 的产品经理不是一个好的数据分析师

  • 博客(12)
  • 收藏
  • 关注

原创 R 语言使用 ggplot2 绘制常见条形图

R 语言使用 ggplot2 绘制常见条形图,包括单个条形图、多个条形图、堆积条形图和百分比堆积条形图

2022-12-28 18:16:57 1132 1

原创 R语言 tidyverse 之数据处理:dplyr (下)

dplyr 包中也有特定的连接函数,用来实现不同数据框之间的连接操作,类似于 SQL 中的 join。这一节我们使用 nycflights13 数据集,这个数据集中包含了纽约市 336776 次航班的信息,使用前先安装一下:install.packages(‘nycflights13’)。library(dplyr)library(nycflights13)# flights 数据框slice_head(flights, n = 5)# airlines 数据框slice_head(air

2021-08-03 11:45:29 1132

原创 R语言 tidyverse 之数据处理:dplyr (中)

在 dplyr 中使用 summarize 函数进行数据汇总时,通常要结合分组函数 group_by 一起使用。1. group_by:分组函数group_by 一般会和 mean、sum、max、min、median 等函数一起使用,对数据进行分组汇总,可以同时处理多个字段。library(dplyr)library(gapminder)# 按 year 字段分组, 统计 lifeExp 的均值、对 pop 求和gapminder %>% group_by(year) %&gt

2021-08-02 17:17:52 2342

原创 R语言 tidyverse 之数据处理:dplyr (上)

dplyr 包提供了一系列好用的函数,用来进行数据处理和转换,掌握之后可以高效解决数据处理中的绝大多数问题,我们先来看一下 dplyr 包最核心的 5 个函数。select: 筛选字段filter: 按条件过滤arrange: 按字段排序mutate: 创建新字段summarize: 数据汇总这一章需要使用 gapminder 数据集,该数据集记录了 140 多个国家的人口、寿命、国内生产总值(gdp)等,使用前安装一下 install.packages(‘gapminder’)libra

2021-07-31 10:29:47 604

原创 R 语言 tidyverse 之数据框:tibble

tidyverse 是 R 语言大神 Hadley Wickham 设计的一套进行数据处理和可视化的 R 包集合,包括 ggplot2、dplyr、tidyr、readr、stringr、forcats、tibble、purrr,其中各个包的主要功能如下:ggplot2: 数据可视化dplyr: 数据处理和转换tidyr: 数据清洗readr: 文件读取stringr: 字符串处理forcats: 因子处理tibble: 新一代数据框purrr: 增强R的函数式编程熟练掌握以上包的使

2021-07-29 20:41:26 1988

原创 学习R之日期和时间

1. 日期和时间类1.1 POSIX 日期和时间R 中的两个标准的日期-时间类是 POSIXct 和 POSIXlt。POSIXct 类记录了以世界标准时 UTC 时区为准的从 1970 年开始计时的秒数计数,POSIXlt 则将日期存储为一个列表,其中包括秒、 分钟、小时和月份等。POSIXct 最适用于存储和计算时间,而 POSIXlt 最适用于提取日期中的某个特定部分。# 以 POSIXct 的形式返回当前的日期和时间(now_ct <- Sys.time())>> [

2021-03-16 12:38:45 496

原创 学习R之流程控制和循环

1. 流程控制在执行代码时,并不仅仅是逐行执行,而需要更好地控制执行流程,这就涉及到流程控制语句。1.1 if 和 else最简单的流程控制语句是 if 语句,if 接受一个逻辑值,该值为 TURE 时才会执行下一条语句。当然,大部分时候都不会直接传入 TRUE 或 FALSE 值,而是传递一个变量或表达式,满足 if 语句的条件才会继续执行。# 这条语句会执行if(TRUE) { message("It was true!")}>> It was true!# 这

2021-03-15 08:15:08 161

原创 学习R之函数和作用域

1. 创建和调用函数键入一个函数的名称,将显示其运行的代码,以下是 rt 函数,该函数将生成基于 T 分布的随机数:rt>> function (n, df, ncp) >> {>> if (missing(ncp)) >> .Call(C_rt, n, df)>> else rnorm(n, ncp)/sqrt(rchisq(n, df)/df)>> }rt 函数需要传入三个参数:

2021-03-14 08:38:13 1779

原创 学习R之字符串和因子

1. 字符串1.1 创建和输出字符串字符向量可用 c 函数创建,可以用单引号或双引号把字符串引用起来,只要引号之间匹配即可,推荐使用双引号:c("learn", "character", "and", "factor", "of", "r")>> [1] "learn" "character" "and" "factor" "of" "r"paste 函数能将不同字符串组合在一起,默认分隔符为空格,可以使用参数 sep 更改分隔符。所有的字

2021-03-13 11:38:14 930

原创 学习R之列表和数据框

1. 列表1.1 创建列表列表由 list 函数创建,且能像 c 函数那样指定内容,只需简单地用逗号分隔每个参数即可指定列表中的内容。列表中元素变量的类型不限, 可以是向量、矩阵,甚至函数。与向量的命名类似,可以在构造列表时就给元素命名,或在构造之后使用 names 函数命名:(a_list <- list( c(1, 1, 2, 5, 14, 42), month.abb, matrix(c(3, -8, 1, -3), nrow = 2), asin))

2021-03-03 20:30:35 301 1

原创 学习R之向量、数组和矩阵

1. 向量之前已经介绍过,可以使用冒号运算符来创建从某个数到另一个数的序列,以及 c 函数拼接数值和向量,从而创建更长的向量。8.5:4.5>> [1] 8.5 7.5 6.5 5.5 4.5c(1, 1:3, c(5, 8), 13)>> [1] 1 1 2 3 5 8 13vector 函数能创建一个指定类型和长度的矢量,其结果中的值可为零、FALSE、空字符串。为简便起见,用每个类型的包装函数,如 numeric、logical、character

2021-03-02 17:52:09 413

原创 学习R之基础运算

1. 运算符和向量R 中的算术运算符包括:加 (+)、减(-)、乘(*)、除(/)、整除(%/%)、取余(%%)、乘方(^),除了可以直接作用于两个数字,还可以对向量进行运算。向量化操作的优点是:运算符或者函数作用于向量中的每个元素,而无需显式编写循环语句。c 函数可以把一系列的值拼接起来创建为向量。c(1, 3, 5, 7, 9) + 1>> [1] 2 4 6 8 10c(2, 4, 6, 8, 10) - 2>> [1] 0 2 4 6 81:10

2021-03-01 15:03:16 571

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除