天桥下的卖艺者-CSDN博客

原创代码+视频，R语言对数据进行多重插补后回归分析

我们在临床做回顾性研究分析中经常要面对数据缺失的问题，如果数据缺失量大就会对我们的研究结果产生影响，近年来，对数据进行多重插补广泛应用于SCI论文中。我们在之前的文章中已经演示了使用SPSS对数据进行多重插补并分析。今天，我们通过视频演示使用R语言的Mice包来演示多重插补并对数据进行分析。R语言对数据插补并进行分析。

2024-04-19 09:36:35 91

今天分享一个R语言的实用小技巧，如果咱们重新安装了电脑（我重装了电脑）或者因为需要卸载旧版本的R软件，安装新版本的R，那么必然会造成R包的库缺失，需要重新下载，有些还不是官方的R包，下载非常麻烦。from就是我旧版本的R软件的位置，to就是我新版本的R软件的位置。这个R包的迁移的函数是copy.packages.between.libraries函数，有点长，大概的格式就是下面这样的。咱们可以使用installr包把旧版本的R的R包库转移到新的版本，非常简单。我觉得还是挺简单使用的，本期结束啦。

2024-04-16 09:02:31 244

原创 18篇文章带你深入浅出了解亚组交互作用（p for Interaction）及可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技，几乎在高分的SCI中必出现，因为把人群分为亚组后再进行统计可以增强文章结果的可靠性，进行可视化后可以清晰的表明变量之间的关系。2. SPSS联合Excel进行logistic回归亚组交互效应（交互作用）的可视化分析，不用代码操作也能做出交互效应图。编写NHANES亚组交互函数，可以一键生存亚组分析交互效应表并绘制森林图，目前已经更新到1.7版本。5.使用visreg包快速进行R语言logistic回归交互项的可视化分析。

2024-04-14 10:48:07 1111

原创代码+视频，R语言手动绘制连续线条的校准曲线（Calibration curve）(3)

校准曲线图表示的是预测值和实际值的差距，作为预测模型的重要部分，目前很多函数能绘制校准曲线。一般分为两种，一种是通过Hosmer-Lemeshow检验，把P值分为10等分，求出每等分的预测值和实际值的差距。我们既往已经通过多篇文章介绍了等分的校准曲线绘制，今天来视频介绍一下上图这种连续的，线条样的校准曲线绘制。

2024-04-12 10:14:33 186

转载两种方法手把手教你R语言多分类变量亚组相加交互模型分析

不少粉丝问如何进行多分类的相加交互模型分析，今天咱们来演示一下，继续使用咱们的不孕症数据（公众号回复：不孕症，可以获得这个数据）Education：教育程度，age:年龄，parity产次，induced：人流次数，case：是否不孕，这是结局指标，spontaneous：自然流产次数。这样fage就是年龄进行等分后的变量，是个3等分的变量，spontaneous自然流产次数也是个3等分的变量，等下咱们就是研究这两个变量的交互。有文献表明，单单只用乘法交互效应低估了疾病协同的危险性，从而低估了发病率。

2024-04-09 09:11:35 164

原创代码+视频，手动绘制logistic回归预测模型校准曲线（Calibration curve）（2）

我们既往文章《手动绘制logistic回归预测模型校准曲线》已经进行了手动绘制logistic回归预测模型校准曲线，今天继续视频来介绍外部数据的校准曲线验证和分类数据的校准曲线。一般分为两种，一种是通过Hosmer-Lemeshow检验，把P值分为10等分，求出每等分的预测值和实际值的差距。R语言手动绘制logistic回归预测模型校准曲线（Calibration curve）（2）校准曲线图表示的是预测值和实际值的差距，作为预测模型的重要部分，目前很多函数能绘制校准曲线。

2024-04-07 12:47:48 304

原创 R语言使用 ggscidca包优雅的绘制竞争风险模型决策曲线

对于不同的结果， ggscidca包的结果是根据决策曲线发明者大佬AndrewVickers博士提供的stdca.R函数生成结果的，stdca.R函数其实是可以进行竞争风险模型分析的，但是stdca.R单独生成结果有点小问题（其实不算问题，应该认知不同），我稍微修改了一点，让它更易于分析竞争风险模型（核心代码没有动），我反复比对了stdca.R的代码原理和数据生成的结果，认为没有错，那只能是dcurves包错了。这步不做就没法分析，你原先就是0，1，2形式的不用改，直接下一步就行。

2024-04-03 09:09:16 911

原创分享一个nhanes数据报错的解决方案

美国国家健康与营养调查（ NHANES, National Health and Nutrition Examination Survey）是一项基于人群的横断面调查，旨在收集有关美国家庭人口健康和营养的信息。今天分享一个小的NANES报错小方案，目前有不少粉丝私信我是说：使用survey包的时候出现如下图错误：stratum has only one PSU at stage 1。这个报错是因为survey进行权重抽样计算的时候PSU分配到单一的变量所致，咱们导入包的时候可以对它进行一下设置。

2024-03-31 11:01:53 277

原创代码+视频，手动绘制logistic回归预测模型校准曲线（Calibration curve）（1）

今天我们来视频演示第一种，手动绘制的好处在于加深你对绘图的理解，而且能个性化的进一步处理图形。第一种绘图本质就是我们的折线图，一般分为两种，一种是通过Hosmer-Lemeshow检验，把P值分为10等分，求出每等分的预测值和实际值的差距.R语言手动绘制logistic回归预测模型校准曲线（Calibration curve）（1）校准曲线图表示的是预测值和实际值的差距，作为预测模型的重要部分，目前很多函数能绘制校准曲线。另外一种是calibration函数重抽样绘制连续的校准图。

2024-03-30 11:38:30 392

原创 R语言使用dietaryindex包计算NHANES数据多种营养指数（2）

健康饮食指数 (HEI) 是评估一组食物是否符合美国人膳食指南 (DGA) 的指标。Dietindex包提供用户友好的简化方法，将饮食摄入数据标准化为基于指数的饮食模式，从而能够评估流行病学和临床研究中对这些模式的遵守情况，从而促进精准营养。该软件包可以计算以下饮食模式指数：• 2020 年健康饮食指数（HEI2020 和 HEI-Toddlers-2020）• 2015 年健康饮食指数 (HEI2015)• 另类健康饮食指数（AHEI）• 控制高血压指数 (DASH) 的饮食方法。

2024-03-28 08:42:14 1241

原创代码+视频，R语言logistic回归交互项（交互作用）的可视化分析

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技，几乎在高分的SCI中必出现，因为把人群分为亚组后再进行统计可以增强文章结果的可靠性，不仅如此，交互作用还可以使用来进行数据挖掘。在既往文章中，我们已经介绍了怎么使用R语言可视化visreg包对交互作用进行可视化分析（见下图）使用visreg包后我们对图形的细节掌控力不够，今天我们视频介绍使用重新绘制手动图形，这在SCI论文中非常实用，几乎可以做出所有的交互可视化，也有利于我们了解制图原理。

2024-03-22 10:00:48 808

原创 R语言使用 ggscidca包优雅的绘制随机森林决策曲线

DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法，在2006年由AndrewVickers博士创建，我们通常判断一个疾病喜欢使用ROC曲线的AUC值来判定模型的准确性，但ROC曲线通常是通过特异度和敏感度来评价，实际临床中我们还应该考虑，假阳性和假阴性对病人带来的影响，因此在DCA曲线中引入了阈概率和净获益的概念。应粉丝的要求在，在新版本ggscidca包添加了虚线功能，你可以在阈值的两点添加虚线，加上线条也是可以的，线条还可以改颜色，线型和大小。

2024-03-20 09:09:31 306

原创代码+视频，R语言使用BOOT重抽样获取cox回归方程C-index（C指数）可信区间

BOOT重抽样在我们统计中处理数据还是很有用的，本期我们来介绍一下怎么使用BOOT重抽样获取cox回归方程C-index（C指数）可信区间，这也是一个粉丝向我问的问题，我觉得蛮有典型性和实用性的，因此就拿出来讲讲。bootstrap自采样目前广泛应用与统计学中，其原理很简单就是通过自身原始数据抽取一定量的样本（也就是取子集），通过对抽取的样本进行统计学分析，然后继续重新抽取样本进行分析，不断的重复这一过程N（大于500次以上）次，然后得到N个统计结果，然后进行区间分析，得到最终结果。

2024-03-15 08:28:57 498

原创 R语言tidycmprsk包分析竞争风险模型

既往我们在文章《手把手教你使用R语言做竞争风险模型并绘制列线图》和《一步到位：手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线》已经介绍了使用cmprsk包绘制和QHScrnomo包进行分析，今天咱们来介绍一下tidycmprsk包，它也是基于cmprsk包进行分析，但是功能更多，绘制图形更加精美。接下来咱们来演示多因素分析，如果你不指定结局的话，会默认的把第一个结局当成存活，最后一个结局当成竞争风险指标，就是咱们常见的0,1,2形式。咱们也可以进一步指定，这样清楚一点。

2024-03-12 09:02:09 630

原创 NHANES数据(复杂调查数据)亚组交互函数1.7（P for interaction）发布-纠正了目前的一个问题

大家好，有粉丝私信我说NHANES数据(复杂调查数据)亚组交互函数1.版本交互函数有点问题，我查看了一下，有个代码调用失效了。就是下面这个，本来我是这样调用数据的。应该是由于R版本或者survy包升级后导致这个调用代码失效了，导致了调查数据没有加权，给您带来不便敬请见谅。

2024-03-08 11:42:44 350

原创首发ggscidca包，来来来---绘制个不一样的决策曲线，让你审稿人眼前一亮

上图这个图形我考虑过ggplot2包的多个函数，如geom_bar，geom_raster，geom_col等，其中geom_col本来最满意，可以绘制出渐变风格的区域条形图，但是geom_col不好嵌入字体（应该是我技术水平还不够，以后水平高了再重新写一下），后面刚好看到其他博主使用geom_rect来复现这个图片，复现得还挺不错的，后面就参考了一部分他的方法，geom_rect主要的有点是灵活多变，可以应对不同的情况。生成图形后，如果你想对这个条形图进行调整，也是可以的，要关注函数生成的2行信息。

2024-03-05 09:08:08 1004

原创代码+视频R语言使用BOOT重抽样获取回归方程系数95%可信区间

bootstrap自采样目前广泛应用与统计学中，其原理很简单就是通过自身原始数据抽取一定量的样本（也就是取子集），通过对抽取的样本进行统计学分析，然后继续重新抽取样本进行分析，不断的重复这一过程N（大于500次以上）次，然后得到N个统计结果，然后进行区间分析，得到最终结果。bootstrap自采样对于小样本数据计算效果较好，也可以在线性方程中通过bootstrap自采样计算并绘制出可信区间。本期视频介绍R语言使用BOOT重抽样获取回归方程系数95%可信区间。

2024-03-01 09:34:02 185

原创 R语言使用dietaryindex包计算NHANES数据多种健康饮食指数 (HEI等)（1）

FPED 人口文件是指 WWEIA 中食品的食品模式等效文件，可以在这个网址下载：https://www.ars.usda.gov/northeast-area/beltsville-md-bhnrc/beltsville-human-nutrition-research-center/food-surveys-research-group/docs/fped-databases/最后的DEMO文件是指人口统计变量和样本权重中的DEMO文件，在下面这个地址可以下载，选年份和上面是一样的。

2024-02-28 16:17:56 2368 1

原创代码+视频手把手教你R语言基于pROC包绘制多条ROC曲线

可以做ROC曲线的软件很多，如SPSS,R语言，Stata, SAS等等，既往我们已经介绍了使用SPSS制作ROC曲线，今天我们来视频介绍怎么使用R语言绘制多条ROC曲线，继续使用我们的肺炎数据(公众号回复：肺炎，可以获得数据)ROC曲线是根据一系列不同的二分类方式(分界值或决定阈)，以真阳性率(灵敏度)为纵坐标，假阳性率(1-特异度)为横坐标绘制的曲线。ROC曲线主要应用于二分类结局，比如是否死亡，疾病诊断，肿瘤复发等等，可以用于自变量为连续变量的截点判定。

2024-02-23 08:59:27 594

原创 ggrcs包3.8版本发布—增加了密度曲线，X轴截断和字体设定

本次主要增加了3个内容，1是增加了单组的密度曲线图，2是增加了X轴的截断和限制功能3是增加了字体的设置功能。这个图目前只能做单组，因为双组的话rms包会把两个数据重组分布，然后经过从新缩放，双组的话两个密度曲线会叠加一起，这个涉及到了绘图的核心逻辑，目前没什么好办法。绘制成这个样子主要是因为数据不是正态分布，分布范围太广了，除了改成单纯RCS曲线，咱们可以改成密度曲线。除了字体，字的大小也可以改的，这里分为刻度的字体和标签的字体都可以调整。下面我来演示一下，先导入数据和R包，直接使用R包自带的吸烟数据。

2024-02-19 09:05:34 610 10

原创迎新年，送新手福利，送2篇nhanes文章全套复现代码

这篇文章反映的是一些身体指标和活动代谢的关系，这篇文章虽然作者给出了复盘文章的全套代码，但是nhanesaccel包已经损害不能安装使用了，我重新修复了nhanesaccel包的代码，使得文章能全盘复制，我还做了很多代码的注释，可以更好的分析代码，了解思路，让您事半功倍。每篇文章都超过600行代码，从数据下载到数据清洗，再到数据分析，绘制表格。本次赠送2篇关于nhanes数据的已经发表的文章的全套代码，可以手把手复现文章的表格和结论，对刚进行nhanes数据分析的新手应该会特别有帮助，老手可以跳过。

2024-02-16 10:33:18 596

原创代码+视频基于R语言进行K折交叉验证

可以看成是留一交叉验证的简化版，是将原始数据据随机平均分为k个子集（通常5-10个），每个子集做测试集的同时，其余k-1个子集合并作为训练，进行ｋ次训练，取各评价指标（灵敏度、特异度、ＡＵＣ等）的平均值。：是我们临床论文中最常使用到的，从数据中随机选择中随机选择70%点的数据作为训练集建立模型，30%的数据当做外部数据来验证模型的预测能力。１０折交叉验证是指将原始数据集随机划分为样本数近乎相等的１０个子集，轮流将其中的９个合并作为训练集，其余1个作为测试试集。基于R语言进行K折交叉验证。

2024-02-14 11:07:07 993

原创代码+视频一步到位：手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

我们在既往文章《手把手教你使用R语言做竞争风险模型并绘制列线图》中已经介绍了cmprsk包建立竞争风险模型和绘制列线图，但是cmprsk包功能还是相对简单一点，而且制作列线图的时候还需要对数据进行加权，对新手不怎么友好，许多人做不出来。今天我们来介绍一下QHScrnomo包，QHScrnomo是在cmprsk包的基础上将功能呢继续完善，简化流程，可以做出竞争风险模型建模-列线图-校准曲线-K折验证-外部验证-决策曲线等诸多功能，总有一款适合你。好了，废话不多说，立即开始。为竞争风险模型构建列线图。

2024-02-06 09:21:34 248

原创 R语言阈值效应函数cut.tab2.0版发布（支持线性回归、逻辑回归、cox回归，自定义拐点）

在既往我们在文章《cox回归RCS阈值效应函数cut.tab1.3发布》发布了自写的阈值效应函数1.3版本，反应还不错，不过1.3版本只能支持cox回归，本次发布了新的2.0版本，支持线性回归、逻辑回归、cox回归, 还有自定义拐点功能。泊松回归还不支持，目前正在开发中。接下来使用cuttab函数生成拐点数据，这里注意一下，新版本和旧版本不同的是这里是cph生成生存模型，cuttab重点是没有点这个符号的。接下来咱们还要建一个新的fit1和原来的fit稍微有点不一样的，这个是没有rcs函数的。

2024-02-05 11:28:24 1554

原创聊聊Nhanes数据怎么做中介效应分析

研究的是银屑病和冠心病发病的中介因素，咱们来看下统计学部分，这篇文章介绍缺失超过30%的变量被删除，以后咱们也可以这样做。这个研究是探索挥发性有机物的个体代谢产物和组合代谢产物之间的关系尿液中的（mVOCs），代表VOCs的内部暴露水平，具有骨密度（BMD），骨质疏松症（OP）和骨折以及潜在的介质。最后来介绍一篇7分的文献，为什么放在最后介绍呢，因为它是个统计专业的杂志，应该可靠性很强，而且它还附带了代码。看到了把，使用的是mediation包，这是个常用的中介分析的包，我已经有多篇文章进行介绍了。

2024-02-02 09:06:28 775 2

原创代码+视频，PM3包进行3组倾向评分匹配并绘制smd图

在观察研究中，由于种种原因，数据偏差（bias）和混杂变量（confounding variable）较多，倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响，以便对实验组和对照组进行更合理的比较。我们的回顾性研究都是过去的数据，很难像RCT一样进行严格的筛选出两组患者基线相近的基础资料，但我们可以通过倾向评分匹配把回归性的数据进行筛选，把基线资料相近的患者进行匹配，得到近似RCT的效果。目前，本人写的第二个R包pm3包的1.8版本已经正式在CRAN上线，用于3组倾向评分匹配，只能3组不能多也不能少。

2024-01-29 09:54:25 415

原创代码+视频，R语言forestploter包优雅的绘制孟德尔随机化研究森林图

我们今天来做个上图这样的森林图，使用的是《R语言复现一篇6分的孟德尔随机化文章》的数据，这篇文章作者直接提供了数据，所以我就直接拿来用了。作者分析了很多精神病和骨密度的结果，这里我就取精神分裂症和骨密度结果来分析。在既往文章中，我们对孟德尔随机化研究做了一个简单的介绍。我们可以发现，使用TwoSampleMR包做出来的森林图并不是很美观。今天我们使用R语言forestploter包优雅的绘制孟德尔随机化研究森林图。使用TwoSampleMR包做出来的森林图是这样的。而很多SCI文章中的森林图是这样的。

2024-01-26 08:58:37 791

原创 R语言VRPM包绘制多种模型的彩色列线图

列线图，又称诺莫图（Nomogram），它是建立在回归分析的基础上，使用多个临床指标或者生物属性，然后采用带有分数高低的线段，从而达到设置的目的：基于多个变量的值预测一定的临床结局或者某类事件发生的概率。咱们既往已经多篇文章介绍绘制列线图，今天咱们来介绍一下VRPM包绘制彩色列线图，这个包可以绘制多个模型的列线图，咱们一一来介绍。这是很简单的数据，admit是个分类的结局变量，其他的是协变量,（公众号回复：列线图数据，可以获得这个数据。数据中的rfst是生存时间，cens是结局变量，其他的是协变量。

2024-01-24 08:54:11 754

原创代码+视频R语言绘制逆概率加权后的基线表

基于 PS （倾向评分）的逆概率加权(IPTW )法首先由Ｒosenbaum作为一种以模型为基础的直接标准化法提出，属于边际结构模型。简单来说，就是把许多协变量和混杂因素打包成一个概率并进行加权，这样的话，我只用计算它的权重就可以了，方便了许多。那么，如何将多个协变量的影响用一个倾向评分值来表示呢?根据 Rosen-baum 和 Rubin 的定义:倾向评分值为在给定一组协变量(X i )条件下，研究对象 i(i =1，2，…N)被分配到某处理组或接受某暴露因素(Z i =1)的条件概率。

2024-01-22 09:16:52 661

原创回顾2023年总结和2024年计划

2.不少粉丝说ggrcs包不能做大于10万的数据，还有一些国外的老外也发邮件来问这个问题，其实这是rms包的限制，随着我对rms包理解加深，本人最近已经改良算法成功，在未来新版的新版ggrcs包将支持超过10万数据的绘图，为seer数据等大型数据提供支持。如果你确实需要帮助，问的时候要提供详细的资料，比如完全的代码、数据结构，报错代码，你做了什么尝试都要说的，你就发个报错代码，其他都没有，除非很简单，不然我也看不出来的。

2024-01-19 10:03:34 952

原创代码+视频R语言3组以上倾向评分逆概率加权(IPTW)

PS为观察单位的倾向评分值。后台有粉丝问，怎么使用R进行3组以上的倾向评分逆概率加权（IPTW），看了上面内容我们就明白，只要知道每组数据的倾向评分（也就是概率），根据公式转成权重数就可以了，和做两组的步骤基本一样，今日咱们来演示一下语言3组以上倾向评分逆概率加权(IPTW)。综上所述：倾向评分加权法首先将多个主要混杂变量的信息综合为一个变量倾向评分 ,然后将倾向评分作为需要平衡的混杂因素 ,通过标准化法的原理加权,使各对比组中倾向评分分布一致 ,则达到使各混杂因素在各比较组分布一致的目的。

2024-01-18 09:14:43 490

原创代码+视频--NHANES数据(复杂调查数据)亚组交互函数1.6尝鲜版（P for interaction）发布---用于一键生成交互效应表

在SCI文章中，交互效应表格（通常是表五）能为文章锦上添花，增加文章的信服力，增加结果的可信程度，还能进行数据挖掘。什么是亚组，通常就是特殊类型人群，比如男女，种族等，就是说你的数据放入特殊人群中结果还可靠吗？在既往文章《NHANES数据(复杂调查数据)亚组交互函数1.4尝鲜版（P for interaction）发布—用于一键生成交互效应表》中，咱们发布了svy.scitb5函数，反响还不错，基本没啥大问题，有个小问题是下载到的NHANES数据需要整理一下，不能直接拿来分析，比如像这种带连接符的数据。

2024-01-16 10:40:41 847

原创代码+视频，超详细的R语言svykm函数绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)

我们在既往的文章《R语言绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)》中介绍了怎么使用jskm包的svykm函数绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)，今天来视频操作一下。超详细的R语言svykm函数绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)

2024-01-11 09:33:54 602

原创机器学习系列--R语言随机森林进行生存分析（2）

这条斜着的虚线是这两种方法的分界点，蓝色的点代表vimp大于0的，红色的点代表vimp小于0。红色斜着的虚线上的点，代表这个变量在两种分类方法排名相同，高于红色虚线上的点，代表它的vimp的排名更加高，低于红色虚线上的点，表明它的最小深度排名更高。如果我们根据阈值5.2757进行筛选，那么最终可以选出"bili" ，“albumin” ，“copper” ，“prothrombin” ，"edema"这5个变量，有些文章介绍有临床意义的变量也是可以选进来的。但是对于生存数据，我们还要考虑时间的影响，

2024-01-10 09:07:14 1207 1

原创代码+视频手把手教你基于R语言逆概率加权(IPTW)并行生存曲线分析

逆概率加权法最早由Ｈｏｒｖｉｔｚ和Ｔｈｏｍｐｓｏｎ提出，即对每个可观测的ｙi的概率取倒数，作为被观测的 yi 的权重，修正由缺失数据或有偏抽样带来的估计偏差.IPTW 是减少多组观察性数据间混杂偏倚的有效方法, 在处理多组间变量混杂偏倚中起到了重要作用。简单来说，就是把许多协变量和混杂因素打包成一个概率并进行加权，这样的话，我只用计算它的权重就可以了，方便了许多。代码+视频手把手教你基于R语言逆概率加权(IPTW)并行生存曲线分析。

2024-01-09 10:18:53 871 2

原创代码+视频，手把手教你R语言使用forestploter包绘制单组及双组森林图

森林图在论文中很常见，多用于表示多因素分析中的变量与结果变量的比值效应，可以用图示的方法比较直观的绘制出来。既往我们在文章《R语言快速绘制多因素回归分析森林图（1）》已经介绍了怎么绘制森林图，但是绘图比较简单，不够美观，不能绘制相对复杂的森林图。今天我们来介绍一下forestploter包，它等于是在forestplot包的基础上进一步强化功能，制作方法也相对简单一点，而且加强了对图形的精细控制，而且可以绘制单组和多组森林图。R语言使用forestploter包绘制单组及双组森林图代码：

2024-01-05 09:05:40 1226

原创代码+视频，手把手教你R语言使用scitb包绘制倾向性评分匹配后的标准化平均差图

我们的回顾性研究都是过去的数据，很难像RCT一样进行严格的筛选出两组患者基线相近的基础资料，但我们可以通过倾向评分匹配把回归性的数据进行筛选，把基线资料相近的患者进行匹配，得到近似RCT的效果。绘制倾向性评分匹配后的标准化平均差（Standardized mean difference SMD）可视化图，vars这里填入你所有的基线资料的变量，Unmatchdata这里填入未匹配前的数据，matchdata这里填入匹配后的数据。我们需要先看一下这个数据的基线情况，先要定义全部变量，分类变量，分层变量。

2024-01-03 08:34:33 1219 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

早产数据，可以用于文章中的统计学方法研究

2000年美国总统全国选举数据，可用于数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据2（第二部分），可用于时间相关序列数据分析

美国芝加哥1987年至 2000年大气污染与死亡数据，可用于数据分析

患者的体检数据2（第二部分），可以用于进行数据分析

体检数据，可用于进行文章中的数据分析

原发性胆道胆管炎数据,可以用来做数据分析

nhanes插补数据，可以用于nhanes插补数据的分析

森林图数据，可以用于绘制森林图

纽约房价数据，可用于数据分析

自己提取的nhanes数据库

利用广义可加模型对分类数据进行曲线拟合代码

一步到位：手把手教你R语言竞争风险模型建模-列线图-校准曲线-K折验证-外部验证- 决策曲线

利用重抽样获取广义可加模型曲线的可信区间重抽样代码

SPSS中介效应分析插件（Process和mediate插件）

SPSS主成分分析绘图操作

stata临床决策曲线包.rar

eicu数据库考试答案.rar

nomocox.zip

nomolog.zip

空空如也