自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(222)
  • 收藏
  • 关注

原创 人群归因分数(2):多分类变量、控制变量

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本文接上篇继续介绍人群归因分数(PAF)的计算,主要介绍风险因子是多分类变量、含控制变量两种情况。本篇目录如下:1 多分类变量2 含控制变量2.1 错误计算方法2.2 正确计算方法12.3 正确计算方法2(条件PAF)2.4 正确计算方法33 总结1 多分类变量上篇举的例子中,风险因子phys是二分变量。有读者问到风险因子是多分类变...

2023-05-15 09:00:41 1331 1

原创 人群归因分数(Population Attributable Fraction, PAF):概念、简单计算案例

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇目录如下:1 人群归因分数1.1 相对风险度1.2 人群归因分数2 案例2.1 示例数据2.2 计算案例12.3 计算案例22.4 计算案例33 总结1 人群归因分数人群归因分数(Population Attributable Fraction, PAF)是疾病负担研究中常用的指标,其大致含义是,假设人群的风险暴露降低至理想水平...

2023-05-11 08:02:22 1864 1

原创 VGAM | tobit模型

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇来介绍tobit模型,使用的工具包是VGAM。library(VGAM)目录如下:1 Tobit分布2 tobit模型3 运行模型例1例2例34 其他1 Tobit分布tobit模型主要应用于因变量存在删失的情况。以正态分布为例,变量的取值范围理论上应为,但实际取值范围只是某个区间。例如在做调查时,年收入在一定区间范围内需要精确...

2023-05-02 09:00:28 1742

原创 《Advanced R》学习笔记 | Chapter4 Subsetting

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇推文是学堂君学习第4章“Subsetting”的笔记,原文链接是https://adv-r.hadley.nz/subsetting.html,可在文末“阅读原文”处直达。本章系统总结了各类数据结构提取子集(subsetting)的方式,以及三个操作符[、[[、$的用法和区别。4.1 Introduction4.2 Select...

2023-04-24 08:00:17 291

原创 空间矢量数据保存为GeoJSON、PDF等文件格式

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集我们使用的空间矢量数据一般是Shapefile格式的,它在ArcGIS、R语言中都能加载,但是这种数据格式在使用时也有不便:它是由多个文件构成的,一般有.shp、.shx、.dbf、.prj等,此外还可能有.sbx、.cpg、.shp.xml、atx、.sbn等。尽管在加载时通常只需要关注.shp文件,但是太多的组成文件还是会对数据...

2023-04-18 22:39:33 571

原创 《Advanced R》学习笔记 | Chapter3 Vectors

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇推文是学堂君学习第3章“Vectors”的笔记,原文链接是https://adv-r.hadley.nz/vectors-chap.html,可在文末“阅读原文”处直达。通过本章的学习,我们可以更清晰地理解R语言中各种数据结构之间的关系。3.1 Introduction3.2 Atomic vectors3.2.1 Scalar...

2023-04-13 09:01:01 360

原创 《Advanced R》学习笔记 | Chapter2 Names and values

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集Advanced R是R语言大神Hadley Wickham写的一本书,主要介绍R语言底层的运行原理,帮助用户从R User转变为R Programmer。该书最新版为第二版,网页版地址为:https://adv-r.hadley.nz/。本书共25章。第1章为“Introduction”,不涉及具体知识。本篇推文是学堂君学习第2章...

2023-04-09 09:00:04 444

原创 控制程序进程的几个函数:stop、break、next、try

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集下面几个函数可以帮助用户更好地控制程序进程:stop函数break函数next函数try函数stop函数顾名思义,stop()函数会直接终止当前执行语句,并返回一个错误警告``Error in...`。该函数通常接在if语句后面。stop()函数的一个常用场景是在编写函数时判断输入参数是否合适,如不合适则终止程序并报错。例如,编写一...

2023-04-05 09:00:04 904 2

原创 R语言学堂推文索引 - 2023年3月

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集更新时间: 2023.3.310 前言1 数据处理通识专辑1.1 base-R1.2 dplyr和tidyr工具包1.3 文本/日期/分类数据处理1.4 向量化运算1.5 文档沟通1.6 面向对象的编程1.7 数据获取方法2 制表与可视化专辑2.1 基础绘图系统2.2 ggplot2工具包2.3 ggplot2拓展包2.4 各类图形...

2023-03-31 20:25:26 313

原创 spatialreg | 基于特征向量的空间滤波方法(2)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集阅读本篇推文前,请先阅读如下推文:spatialreg | 基于特征向量的空间滤波方法上面这篇推文介绍了空间滤波方法的原理以及应用于线性模型的案例。本篇推文介绍应用于广义线性模型的案例。主要参考文献1[1]。本篇目录如下:0 示例数据1 ME函数2 案例0 示例数据首先加载示例矢量文件、计算空间邻接和权重矩阵:##加载示例文件l...

2023-03-26 21:57:34 482

原创 ggplot2的组图拓展包(1):patchwork(下篇)组合ggplot2和基础绘图系统图形

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集ggplot2绘图系统和基础绘图系统各有各的优点,不过二者不相兼容,因此有时绘图不得不选择其中一种。本篇推文所介绍的patchwork工具包可以将两种系统绘制的图形组合起来,允许我们在绘制不同子图时选择对应更方便的绘图系统。0 示例图形library(ggplot2)library(patchwork)p1<-gg...

2023-03-23 08:00:09 149

原创 ggplot2 | 调整图形的边框和边距

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集推文《基础绘图系统(二)—— 绘图参数及par函数》介绍了基础绘图系统的图形存在4种边框和区域。本篇来介绍ggplot2绘图系统中的一些边框和区域概念,以及调整它们间距的方法。本篇目录如下:1 两个区域2 边距3 patchwork工具包示例数据:set.seed(0314)data<-data.frame(x=...

2023-03-19 22:59:29 5763

原创 图形标签如何添加特殊文本和特殊格式?

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集凡是不能直接使用英文状态下的电脑键盘输入的文本都可视为“特殊文本”,如希腊字母、数学求和符号等;“特殊格式”可泛指常规格式以外的所有格式,如斜体、粗体、上下标等。图形标签如何添加这些特殊文本和特殊格式呢?在编程语言中,这些特殊文本和特殊格式都有特定的表达式。对于R语言的图形来说,这些表达式由grDevices工具包所有定义,先前的一...

2023-03-15 21:15:41 200

原创 地理加权回归 | 模型如何应用于新数据的预测?

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集有读者不知道如何用地理加权回归去预测新的数据。本篇以常用的两个工具包为例进行介绍。本篇目录如下:0 数据准备1 spgwr工具包2 GWmodel工具包3 结语相关推文:spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归spgwr | R语言与地理加权回归(Ⅰ-2):广义线性地理加权回归GWmodel | 地理加权模型...

2023-03-12 21:20:47 695

原创 ggplot2的组图拓展包(1):patchwork(中篇)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集上篇和上篇续介绍了使用操作符进行组图的方法,这里默认读者已经能够理解各种操作符在本篇推文中的使用场景。本篇目录如下:0 示例图形6 plot_layout函数(下)6.1 guides参数6.2 guide_area函数6.3 design参数6.4 area函数7 plot_annotation函数7.1 添加标题7.2 子图编号...

2023-03-09 22:05:39 593

原创 ggplot2的组图拓展包(1):patchwork(上篇续)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇接上篇patchwork(上篇),目录如下:0 示例图形4 星号`*`4.1 基本功能4.2 优先级4.3 识别嵌套水平5 `&`操作符0 示例图形首先,参考官方文档[1],生成如下4个ggplot对象:library(ggplot2)p1<-ggplot(mtcars)+geom_point(ae...

2023-03-08 09:00:41 198

原创 ggplot2的组图拓展包(1):patchwork(上篇)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集patchwork是ggplot绘图系统的拓展包,主要功能是将多个ggplot格式的图形组合成一幅大图,即组图。patchwork工具包十分好用,它主要利用几个类似四则运算符号的操作符进行组图,只要掌握每个操作符的功能特点及少量函数的用法,就可以很灵活地进行组图。本篇目录如下:0 示例图形1 竖杠`|`和斜杠`/`1.1 单独运算1...

2023-03-06 09:00:36 855

原创 多元线性回归的系数及其标准差估计

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集线性回归是最基础的回归模型,但不知道有多少读者了解它的回归系数以及标准差是如何估计出来的。本篇就来介绍一下,目录如下:1 符号说明2 系数估计3 系数标准差4 相关函数和操作符4.1 %*%4.2 t函数4.3 solve函数4.4 diag函数5 案例1 符号说明使用表示样本标识,表示样本的因变量取值,表示自变量表示(,其中为自变...

2023-02-28 09:00:59 4064

原创 相关系数和相关性分析(下):肯德尔相关系数

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集前面已经介绍了皮尔逊相关系数和斯皮尔曼相关系数,详见推文:相关系数和相关性分析(上):皮尔逊相关系数、斯皮尔曼相关系数。本篇目录如下:3 肯德尔(Kendall)相关系数3.1 符号说明3.2 计算公式3.3 显著性检验3.4 案例3 肯德尔(Kendall)相关系数3.1 符号说明与斯皮尔曼系数一样,肯德尔相关系数也是用来度量有序...

2023-02-26 00:00:44 2555

原创 spatialreg | 基于特征向量的空间滤波方法

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集回归模型的残差不应当含有任何可以预测的成分。对于普通回归模型,我们通常需要检验残差的正态性(见推文:残差分析和异常点检验);对于时间序列模型,我们通常需要检查残差是否为白噪音(见推文:ARMA模型的拟合);而对于空间计量模型来说,我们也应检查残差是否具有空间自相关性。本篇目录如下:1 引例2 理论基础3 SpatialFilteri...

2023-02-22 08:00:31 474

原创 时间序列数据的移动平均

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集移动平均(Moving Average)是对时间序列数据常用的一种处理办法,目的是减弱数据因偶然因素造成的波动性,便于分析数据的变化趋势。本篇推文目录如下:理论基础R语言的函数filter函数定义新函数多列数据求移动平均特别注意理论基础阶简单移动平均的方法是:时间点的移动平均值是它与前面个时间点(滞后期)的原始数据的平均数。即对于简...

2023-02-19 08:51:27 1317

原创 空间矢量数据处理 | 第一讲:矢量数据的读入与保存

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本期视频教程主要基于如下推文:sf | 读取和保存空间矢量数据目前,空间矢量数据在R语言中主要有两种储存格式:一种与sp工具包有关,数据以Spatial*DataFrame形式储存,又可细分为如下几类:SpatialPointsDataFrameSpatialLinesDataFrameSpatialPolygonsDataFram...

2023-02-12 06:30:30 573

原创 相关系数和相关性分析(上):皮尔逊相关系数、斯皮尔曼相关系数

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集我们最常用的相关系数是皮尔逊(Pearson)相关系数,也叫简单相关系数,用来衡量两个配对连续变量的线性相关程度。此外,还有斯皮尔曼(Spearman)相关系数和肯德尔(Kendall)相关系数可以度量有序变量之间的相关性。在R语言中,这三个相关系数均可使用stats工具包中的cor()函数和cor.test()函数进行计算和显著性...

2023-02-07 08:00:52 4625

原创 tidyverse与数据处理 | 第二讲:数据导入和预处理的常用函数(上)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集使用各种数据分析方法之前往往需要先将原始数据加工成特定的格式,即数据预处理。执行的操作比如有筛选样本和变量、定义变量类型、处理缺失值等。在这个过程中,tidyverse系列工具包的相关函数使用的十分频繁。本讲主要介绍数据导入函数和dplyr包中的一些重要函数。相关推文:dplyr | 数据导入和预处理的常用函数本讲为上部分,目录如下...

2023-01-29 07:30:25 271

原创 使用最小二乘法和最大似然法估计非线性模型

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本文是年前的最后一篇推文,我们来学习一下使用最小二乘法和最大似然法进行非线性模型估计。模型估计是指,在模型形式已知的情况下,求解出可以使已有数据与模型形式最大程度上相符合的待定系数的过程。这个过程实际上是一个数学优化过程,不同的估计方法所使用的目标函数不同。最小二乘法和最大似然法是最常见的两种方法。从表面上看,前者不需要对数据分布做...

2023-01-20 08:00:36 1802 3

原创 tree | 分类回归树模型

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集分类回归树(Classification and Regression Trees,CART)模型分为分类树模型和回归树模型:当因变量为分类变量(因子变量)时,使用的是分类树模型;当因变量是连续变量(数值变量)时,使用的是回归树模型。分类回归树模型不同于线性模型和Logistics模型,它没有具体的模型方程,而是根据自变量多次二分将...

2023-01-15 08:00:11 481

原创 R语言的模型表达式含义解析

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇介绍各式各样的模型表达式的含义,主要参考资料是《An Introduction to R》(链接:https://cran.r-project.org/doc/manuals/r-devel/R-intro.pdf)第11.1节的内容。本篇目录如下:1 示例数据2 常用操作符和函数3 基本形式4 转换形式5 多项式6 交互式6....

2023-01-08 08:00:54 933

原创 tidyverse与数据处理 | 第一讲:管道操作符

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集各位读者,新年快乐!从今年开始,学堂君计划陆续推出一些视频教程。在初期阶段,这些视频会上传至付费合集,订阅的读者可以观看;形成系列化之后可能会建立专门的课程商店。本篇课程内容是《tidyverse与数据处理》的第一讲:管道操作符。相关推文:magrittr | 管道操作符在介绍管道操作符之前,可以先认识操作符。常见的操作符有:数学运...

2023-01-02 23:34:53 643

原创 ncdf4 | netCDF数据格式处理工具包(3):其他函数

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集前面两篇推文已经介绍了netCDF文件在R语言中的读入、查询、添加变量、创建新文件等操作,本篇来介绍ncdf4工具包其他几个比较重要的函数。目录如下:3 其他函数3.1 ncvar_rename函数3.2 ncvar_change_missval函数3.3 nc_close函数3 其他函数本篇示例数据为上篇推文新创建的PM25_to...

2022-12-26 08:00:02 470

原创 ncdf4 | netCDF数据格式处理工具包(2):定义新变量

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集上篇介绍了使用R语言读入netCDF文件并进行查询的操作,本篇介绍用户如何自定义新变量到netCDF文件中。目录如下:2 定义新变量2.1 ncdim_def函数2.2 ncvar_def函数2.3 ncvar_add和nc_create函数2.4 ncvar_put函数2.5 ncatt_put函数2 定义新变量只有当netCDF...

2022-12-24 21:23:44 1095

原创 ncdf4 | netCDF数据格式处理工具包(1):数据读取和查询

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集netCDF是一种数据储存格式,文件后缀名为.nc,用来储存N维变量,一般是地理数据,例如温度是经度、维度和海拔的函数。netCDF文件可以同时储存一个或多个变量。在R语言中,可以使用ncdf4工具包来读入、修改和创建netCDF文件。library(ncdf4)本篇目录如下:1 读入数据1.1 字段1.2 变量1.3 缺失值1 读...

2022-12-18 21:43:58 1499

原创 R语言学堂推文索引-2022年12月

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集更新时间: 2022.12.120 前言1 数据处理通识专辑1.1 R语言基础与base-R1.2 数据处理与tidy-R1.3 各类型数据处理方案1.4 高级数据管理1.5 数据获取方法2 制表与可视化专辑2.1 基础绘图系统2.2 ggplot2绘图系统2.3 各类图形绘制方法/框架2.4 图形配色方法2.5 图形布局/拼图方法...

2022-12-12 08:00:05 260

原创 面向对象编程的一个例子——减少代码重复

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇推文缘起于上篇推文plot3D | 三维数据绘图(3):mesh函数、surf3D函数、spheresurf3D函数。学堂君在介绍surf3D()函数时举了两个例子。第一个例子是绘制球形:library(plot3D)M=mesh(x=seq(0,2*pi,length.out=100),y=s...

2022-12-10 22:20:46 364

原创 plot3D | 三维数据绘图(3):mesh函数、surf3D函数、spheresurf3D函数

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇是专门介绍plot3D工具包的最后一篇推文,主要介绍三个函数,其余函数读者可根据需要自行学习。本篇目录如下:mesh函数surf3D函数spheresurf3D函数library(plot3D)mesh函数mesh()函数是个很有用的辅助函数,可以根据两个或三个向量生成矩阵或数组。mesh(x,y,z=NULL)x、y、...

2022-12-08 08:00:42 2165

原创 plot3D | 三维数据绘图(2):常见图形——线段、箭头、矩形、长方体、箱线、多边形...

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇推文介绍几种常见的图形在plot3D工具包中的绘制函数。目录如下:线段箭头矩形长方体箱线多边形add参数library(plot3D)线段graphcis工具包里绘制线段的函数是segments(),对应到plot3D工具包的函数就是segments3D()和segments2D()。参数中,x0、y0、z0表示线段起点的坐标,...

2022-12-05 08:00:31 827

原创 plot3D | 三维数据绘图(2):常见图形——线段、箭头、矩形、长方体、箱线、多边形...

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇推文介绍几种常见的图形在plot3D工具包中的绘制函数。目录如下:线段箭头矩形长方体箱线多边形add参数library(plot3D)线段graphcis工具包里绘制线段的函数是segments(),对应到plot3D工具包的函数就是segments3D()和segments2D()。参数中,x0、y0、z0表示线段起点的坐标,...

2022-12-05 08:00:31 658

原创 plot3D | 三维数据绘图(1):散点图、栅格图、透视图

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集plot3D可以视作基础包graphcis的拓展包,用于多维数据的图形绘制。基础绘图系统里好像只有一个persp()函数与三维绘图有关,关于该函数的介绍见如下推文:基础绘图系统(九)——栅格图、点密度图、等高线(填充)图、三维图plot3D包的作者写道:“很多函数都源自persp()函数,另外一些函数来自image和contour(...

2022-11-27 07:40:24 5560

原创 R语言基础 | 方差分析(3):多因素方差分析(下)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集本篇接上篇继续介绍多因素方差分析。目录如下:2 多因素方差分析2.6 TukeyHSD函数2.7 anova函数2.8 不含交互项的II型和III型方差分析2.9 含交互项的II型和III型方差分析2 多因素方差分析2.6 TukeyHSD函数方差分析使用F统计量检验各组样本均值是否存在显著差异:当分组数在三组以上时,只要任意两组样...

2022-11-20 08:00:11 1824

原创 R语言基础 | 方差分析(2):多因素方差分析(上)

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集当存在两个及以上的分组变量时,可以使用多因素方差分析(N-way ANOVA、Multifactor ANOVA)检验各组的样本均值是否存在显著差异。本篇主要以双因素方差分析(Two-way ANOVA)为例介绍相关内容。本篇的目录如下:2 多因素方差分析2.1 示例数据2.2 平衡试验设计2.3 I型方差分析2.4 交互效应2...

2022-11-18 08:00:44 4123

原创 R语言基础 | 方差分析(1):单因素方差分析

专注系列化、高质量的R语言教程推文索引 | 联系小编 | 付费合集方差分析(Analysis of Variance, ANOVA)于1918年由Ronald Fisher(也是F分布的提出者)提出,用于比较多组样本的均值是否存在显著差异,是t检验的拓展。本篇来介绍单因素方差分析,目录如下:1 单因素方差分析1.1 学生t检验和Welch t检验1.2 单因素方差分析1.3 aov函数1.4 单因...

2022-11-13 08:00:33 2888

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除