211统计课堂-CSDN博客

原创主成分分析

其基本思想是变量的降维，就是将原来众多的具有一定相关性的变量重新组合成一组新的相互无关的综合变量来代替原来的变量。将注意力集中于各次观测中具有最大变异的那些变量，对各次观测中变化不大的变量，可视为常数处理，因而降低了问题中的变量的维数。某研究者测得84名10岁男孩的身高（cm）、坐高（cm）、体重（Kg）、胸围（cm）、肩宽（cm）、肺活量（l）等6项生长发育指标，试利用主成分分析找出少数几个相互独立的主成分，以便进一步的研究。该分析从每个原始变量中提取的信息，变量“肩宽”和“体重”损失的变量较少；

2023-09-08 15:26:48 3962 6

原创 SPSS教程：手把手教你绘制簇状条形图

描述使用不同手机品牌（无序多分类变量：华为、苹果、小米、OPPO）和运营商（无序多分类变量：移动，联通和电信）的用户，对手机信号的满意度（有序多分类变量：非常满意，比较满意，一般，比较不满意和非常不满意）。如需改变X轴属性，则可以在Edit Properties of. 框中选择“X-Axis (Bar1)”，改变坐标轴标签（Axis Label框），改变X轴变量的排序（Categories框中：Sort by、Direction或Order框中上下箭头进行调整）。”框，变量Index拖至“Y-Axis?

2023-09-07 14:35:33 868 29

原创二元Logistic回归分析

被调查者的性别（女：0，男：1）、年龄（岁）、鼻咽癌家族史（否：0，是：1）、慢性鼻炎史（否：0，是：1）、职业接触有害物质（否：0，是：1）、吸烟（否：0，是：1）、饮茶（否：0，是：1）、长期锻炼（否：0，是：1）、生活工作压力（否：0，是：1）、鼻咽癌是否发生（否：0，是：1）。肿瘤家族史（无：0，是：1），前面设置协变量的参考类别为“第一个”，即“0”，方程中给出的exp（B）也是相对于“0”。（五）单击“选项”，勾选“Hosmer-Lemeshow拟合度”和“exp”（OR值），继续。

2023-09-05 14:59:04 2113

原创如何构建一个在线商店网站，可以让用户购买商品并进行付款

请注意，这是一个非常简化的示例，实际应用中需要处理更多的细节，例如用户认证、库存管理、订单状态管理等。这个网站应该包括以下几个关键部分：商品展示页面、购物车、结账和付款。结账：用户选择要购买的商品后，可以进入结账页面。这个页面应该显示订单的总额，并提供付款方式供用户选择。商品展示页面：用户可以浏览和搜索商品。这个页面应该包括商品的图片、名称、描述和价格等信息。购物车：用户可以将商品添加到购物车，并随时查看购物车中的商品列表。付款：用户选择付款方式并完成支付后，网站需要处理付款并生成订单。

2023-09-04 19:11:19 179

原创 SPSS统计作图教程：百分条图堆积条图

首先，在“编辑以下对象的的属性”框选“条形图1”。其次，在“统计”框中点击下拉菜单并选择“百分比（）”，并点击“设置参数”后选择“每个X轴类别的总计”，然后点击“继续”。某研究者想看不同年龄分组人群（Age_cat）中不同程度的维生素D缺乏（VD）的百分构成比，部分数据如图1。（1）在主界面点击图形----图表构建器，打开“图表构建器”对话框。选择左下条形图中的堆积条图（第三个）（3）将年龄（Age_cat）拖入X轴，将维生素D缺乏状态（VD）拖入右侧堆积框中。（2）将堆积条图拖拽到图表预览窗格中。

2023-09-02 21:30:32 538 1

原创 SPSS教程：如何绘制带误差的折线图

如需改变X轴属性，在Edit Properties框中选择“X-Axis（Line1），改变坐标轴标签（Axis Label框），改变X轴变量的排序（Categories框中：Sort by、Direction或Order框中上下箭头进行调整）。绘制简单折线图时，研究者可能需要更改连续变量（即Y轴上的因变量）的刻度属性。研究者想研究45-65岁健康男性中，静坐时长和血胆固醇水平的关系，故招募100名研究对象询问其每天静坐时长（time），并检测其血液中胆固醇水平（cholesterol），部分数据如图1。

2023-09-01 14:27:26 871 33

原创 SPSS统计作图教程：频率多边形

如有必要，重新设置该数值再生成合适的频率多边形。选择Histogram后，其右侧显示4个选项，将第3个图拖拽至上方预览窗格中（如果鼠标悬停在该图上方会提示Frequency polygon，即频率多边形）。如果研究者想改变Y轴展示的统计量，如频数或百分比，选择Edit Properties of框中“Area1”，在Statistics下拉框中选择相应的统计量。，尽管添加变量时预览窗格中图形发生变化，但它不能准确根据数据绘图，因此，不要质疑自己操作错误，最后会根据真实数据显示正确的点图。

2023-08-31 20:02:29 444

原创 SPSS--s04典型相关分析

对 84 例 10岁男孩的四项生长发育指标：肺活量（L）、身高（cm）、体重（Kg）、胸围（cm）与四项反映身体素质的指标：50m 跑（s）、跳高（cm）、跳远（m）、实心球掷远（m）进行典型相关分析。除此之外，通过典型相关系数的正负可以判断变量X与变量Y的正负相关，以变量Y1为例，U1中的各变量与Y1呈负相关。,而且又不抛弃原来变量的信息 ,这两个新的变量分别由第一组变量和第二组变量的线性组合构成 ,并且两组变量的个数可以是不同的 ,两组变量所代表的内容也可以是不同的。设两组变量X1、X2、……

2023-08-30 20:05:53 742 29

原创 Python基础小讲堂之条件分支与循环

对于算数操作符的前四个加减乘除，大家都懂，在python中对于a = a + 1 或b = b – 2 可以简写成 a += 1 或 b -= 2这种形式。双星号（**）也称幂运算操作符，左边称为底数，右边称为指数，使用python进行幂运算时要注意优先级的问题。接下来就是条件分支：if 条件:条件为真（True）执行的操作else:条件为假（False）执行的操作。在学条件分支与循环之前，先掌握一下python的基本操作符。条件分支与循环的初步介绍就到这里啦，我们下期再会！=是不等于，==是等于。

2023-08-29 20:20:56 201 1

原创 Python实现T检验

今天来分享一下T检验的python实现方法。01先来上一波概念。1.单样本t检验，又称单样本均数t检验，适用于来自正态分布的某个样本均数与已知总体均数的比较，其比较目的是检验样本均数所代表的总体均数是否与已知总体均数有差别。已知总体均数一般为标准值、理论值或经大量观察得到的较稳定的参数。2.两独立样本均数比较的t检验，又称成组t检验，适用于完全随机设计下两样本均数的比较，其目的是检验两样本所来自总体的均数是否相等，要求两样本所在的总体服从正态分布。3. 配对样本均数t检验，简称配对 t检验，又称非独立两样

2023-08-28 16:02:35 763 9

原创如何评估分类模型的好坏

一般来说，ROC曲线会更稳定，在正负样本足够（样本均衡）的情况下，ROC曲线会比较稳定，能够反映模型的整体质量。但是，即使是正样本非常少的情况下，PR表现的效果也比较好。因为，ROC曲线一般都处于对角线的上方，即模型的效果应该比瞎猜（猜中的概率为50%）要好，所以AUC的取值范围一般是[0.5，1]。显然，我们希望的是TPR越高越好，而FPR越低越好，即要求两条折线离得越开越好，这说明模型对于正负样本区分度更好。可以知道，KS曲线和ROC曲线一样，描述的都是TPR和FPR的关系，只是横坐标的取法不一样。

2023-08-26 00:15:00 956 20

原创如何使用python连接MySQL数据库？

有个小插曲，MySQL和MariaDB相当于姐姐妹妹的关系，两者由同一个人（Widenius）创建的。MySQL被Oracle收购后，Widenius先生觉得不爽，于是搞了个MariaDB，可以完全替代MySQL。更新数据：UPDATE 表名称 SET 列名1=新数据1，列名2=新数据2 WHERE 某列=某数据；给出下载地址：MySQL，MariaDB，安装过程很简单，一路Next Step，不过要记好密码。插入数据：INSERT INTO 表名称（列名1，列名2） VALUES（数据1，数据2）；

2023-08-25 00:30:00 243

原创 R语言主成分分析

具体来说，与Rape关系紧密的几个州为Michigan、Texas等，与Murder关系密切的州为Georgia等，与Assault关系紧密的州为Maryland等。以上就是用R语言进行主成分分析的三种方法，小伙伴们如果觉着有用，可以随意分享给更多的小伙伴，大家一起学习交流！prcomp这功能是R安装的时候就自带的，不用再特意安装其他包了，非常方便实用。与prcomp功能一样，princomp也不用额外安装包了。从这个选择主成分的碎石图里，也可以清晰看出，2是“拐点”，选2，没错。

2023-08-24 13:53:33 792

原创如何撰写骨灰级博士论文？这是史上最全博士论文指导！

最后，在科学研究中，新方法的使用是十分重要的，事实上，有些研究得到的结果可能是平凡的（即人们早已经知道的，或者凭直观就知道的），但是，运用新方法研究这些问题也是有价值的；在许多一级杂志上，是鼓励基金类课题的研究论文发表的。②是已经确定了大致方向，希望了解本研究领域的进展，此时应当请教这一领域的专家，搞清楚哪些人是这一领域的牛人，搜索他们的文章—— 国外的传统，很多杂志要介绍某个领域的成就和进展，都会邀请牛人来写综述——只有知道哪些人是这一领域的杰出代表，才可能从这些人的著作中体验这一领域激动人心的发展。

2023-08-23 14:20:00 411 25

原创 SPSS中级统计--卡方独立性检验之n×c表资料

以上我们只得出了不同地区畸形率有差别，但是是三个地区都不同，还是哪两个地区不同呢？（2）如果理论度小于5的细胞数大于20％，且没有理论度小于1的情况，n大于等于40更好，通过连续性校正；（1）对于理论度1≤T＜5的单元格，不超过20％，使用Pearson，n大于等于40更好；4.点击‘统计（statistic），选择“卡方”，“单元格”选择行百分比。2.加权频数：点击‘数据’-‘加权个案’-‘频数’，点击确定；＜0.01，故拒绝原假设，认为不同地区畸形率有差别。H1：不同污染地区的动物畸形率有差别；

2023-08-22 14:03:24 384 2

原创 SPSS--如何使用分层分析以及分层分析案例分享

有些是随机变异的结果，有些是各种偏倚所致的，而有些却是极其重要的需要揭示的结果(如效用修饰或交互作用)。因此，在计算出各层的效应估计值后，应对其进行检验与分析，以明确层别效应估计值的变化有无统计学意义和重要的流行病学意义。层别效应一致性的假设检验即为同质性检验( homogeneity test)(即假设在各层有一个恒定的效应估计值) ,它是以一致效应的总估计值与层别效应估计值的比较为基础的，即在同质性假设条件下,期望数与实际观察数的比较。分层分析的最重要的用途是评估和控制混杂因子所致的混杂偏倚。

2023-08-21 14:09:13 2124 48

原创 spss---如何使用信度分析以及案例分析

毕竟问卷的设计者的想法跟被调查者的真实想法之间存在差距, 通过对问卷的预调查结果的信度分析可以找出问卷中的哪个题目设计得有问题——与整个问卷之间的关联性不大。为了保证问卷具有较高的可靠性和有效性，在形成正式问卷之前，应当对问卷进行试测，并对试测结果进行信度和效度分析，根据分析结果筛选问卷题项，调整问卷结构，从而提高问卷的信度和效度。问卷调查法是教育研究中广泛采用的一种调查方法，根据调查目的设计的调查问卷是问卷调查法获取信息的工具，其质量高低对调查结果的真实性、适用性等具有决定性的作用。

2023-08-19 13:58:06 1095 19

原创单因素多变量方差分析

以身高为例，检验方法为Tamhane ，检验水准α = 0.05 ，地区甲与乙（P=0.002）和甲与丙（P0.05）无统计学意义。由结果可知，地区（F=10.983，P

2023-08-18 13:53:21 487 17

原创拉丁方设计资料的方差分析（SPSS版+SAS版）

每个因素的类别数或水平数相等，此时可采用拉丁方设计，将两个控制因素分别安排在拉丁方设计的行和列上。在对拉丁方设计试验结果进行统计分析时，由于能将横行、列行二个单位组间的变异从试验误差中分离出来，抵消由于实验处理的先后顺序的影响而产生的顺序误差。处理组（药物，F=3.738，p=0.015），拒绝H0，即6种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等。某研究者为了比较甲、乙、丙、丁、戊、己6种药物给家兔注射后产生的皮肤疱疹大小（mm2），采用拉丁方设计，选用6只家兔并在每只家兔的6个不同部位进行注射。

2023-08-17 13:38:34 623 19

原创 99%的Python用户都不知道的f-string隐秘技巧

3.6版本开始引入的特性，通过它我们可以更加方便地向字符串中嵌入自定义内容，但。真正蕴含的功能远比大多数用户知道的要丰富，今天我们就来一起get它们~通过最外层包裹小括号，我们可以像下面这样非常灵活地撰写多行。以上就是本文的全部内容，欢迎在评论区分享你的观点和意见~默认为右对齐，就像上面的例子，但我们可以像下面这样使用。针对日期类型的变量，我们可以参考下面的方式，直接在。最基础的用法很简单，如下例所示，在前缀。用户都基础性的使用过，作为。

2023-08-16 14:25:41 260 17

原创对应分析介绍及SPSS案例分析

简单对应分析是分析某一研究事件两个分类变量间的关系，其基本思想以点的形式在较低纬的空间中表示列联表的行和列中各元素的比例结构，可以在二维空间更加直观的通过空间距离反映两个分类变量间的关系。又称相应分析，它善于展示两个/多个分类变量各类间的关系，能够将交叉列联表的数据信息转化为二维散点图，直观、简单的描述庞杂的列联表数据中所蕴含的对应关系。”给出了各类别在相关维度上的评分，如：品牌AA在二维空间中的坐标值是（-0.782，-0.073），依次类推，根据坐标值能得到最终的对应分析散点图。

2023-08-15 14:04:37 1350 30

原创 spss--数据分析Log-Binonial模型

Deddens等学者提出先对原始数据集调整扩充后再拟合 log-binomial模型，称为COPY方法扩充原始数据集的步骤：当log-binomial 回归模型不收敛时，将原始数据集中Y=1的个案增加 c-l倍，然后再将原始数据集Y值互换，将这两个新的数据集合并成一个数据集，即为复制(COPY )数据集，再利用 COPY 数据集拟合log-binomial 回归模型从而达到解决模型不收敛问题。对于此案例，最直接的方法是采用logistic回归模型，但是Y患病率大于20%，可能会高估OR值。

2023-08-14 14:45:00 1144 27

原创 spss数据分析--相关性分析与酷炫图

用pheatmap来展示热力图，颜色越接近红色，相关系数越大。然后咱们再用这个设置后的颜色，来个挑战一点的，画相关性矩阵三角矩阵图。这个图由于有一个变量的协方差过大（超过15000），因此，衬托的其他部分数值过小，大部分都是蓝色了。其中，颜色col(10)的意思是在设置的三种颜色范围内，取深浅不同的10个颜色，对应相关系数大小。dim的结果里，第一个数是行数，第二个数是列数，也就是这数据里有32种车，11个道路测试指标。我们先算一下cov，这个函数计算的是列与列的协方差，值越大，说明变化趋势越一致。

2023-08-12 14:14:19 2195 11

原创在SPSS中实现数据转置

通常，数据清洗和处理过程可以在Excel中完成，但对于上述这种简单的数据处理过程如果也要转到Excel中进行转置，那导入导出的过程会很麻烦，花费更多的时间。其中的每一行数据展示的是一位学生的得分情况（测量对象），每一列数据展示的是不同评委对学生的评分（测量方法/评价者）。同时，“转置”自动创建了新的变量名称，并显示新的变量名称列表。我们可以看到，曾经的3个评委变量组成了一个新的字符串变量。如上，“转置”创建一个新的数据文件，初始数据文件中的行列被变换，使个案（行）成为变量同时变量（列）成为个案。

2023-08-11 14:14:56 278 15

原创 spss什么是描述性分析，以及如何去处理。

探索菜单是用于对分布状况不清的连续资料进行探索性分析，它能输出很多描述性统计量，包括：平均值、中位数、方差、标准差、最大值、最小值、全距、四分位距、偏度、峰度等。描述性分析是数据分析的第一步，是了解和认识数据基本特征和结构的方法，只有在完成了描述性统计分析，充分的了解和认识数据特征后，才能更好地开展后续更复杂的数据分析。通常，SPSS直接输出的图表很难完全满足大家的需求，多少需要进行一些格式的微调。功能，它不仅可以开展频率分析、交叉分析和分组汇总分析，还可以自定义输出的统计表格类型，以及需要输出的统计量。

2023-08-10 14:22:12 1329 1

原创 spss--因子分析案例介绍

我们来看输出的总的方差解释这张表，注意看【累计的方差贡献率】，以及【总计】这两列，【总计】这列表示的是特征值，所谓特征值通俗的讲就是它代表相当于原来平均多少个题目，特征值小于1的因子代表性比不上原有的一个题目，所以软件默认只提取特征值大于1的因子。可以通过取消小系数，来查看因子的结构。31个题目，178个观测（因子分析对观测数有规定，一般要求观测的记录数为题目数量的5到10倍，至少5倍，此数据集的记录数基本满足要求），现在希望对此数据集进行因子分析，提取出几个因子，提取出因子后，需要对因子进行命名。

2023-08-09 13:47:07 599 17

原创 SPSS--相关关系是怎样的关系？

有时候，两个完全不相干的变量间也可能存在很强的相关关系，比如说：“当明星”和“长得好看”之间具有很强的相关性，但并不能说“因为当了明星，所以才长得好看”，也不能得出“因为长得好看，所以是明星”的结论。以及样本所反映的变量间的关系能否代表总体变量间的关系？是一种非确定性的关系，它能够分析变量间的关联程度和关联形式，并且可以在相关分析的基础上，再通过回归分析来确定变量之间的数量关系，进而用于生产控制和预测。函数关系是变量间一一对应的确定关系，比如长方体的高与体积之间的关系是线性函数关系。

2023-08-08 15:19:00 865 27

原创今天开始学习如何正式调查

就说要准备调查多少人确定好样本容量之后又要考虑设计的调查问卷。样本容量调查方式调查问卷的回收。我们重点来讲一下量表式调查问卷和非量表式调查问卷。样本容量确定的基本原则就是要求样本要具有代表性。所谓代表性就是样本能够反映总体信息的程度。样本容量一般是量表提项的5-10倍。其次样本容量他和调查的精确度有关系。总体的信息是最全的最好去调查总体。那么无形当中又增加了调查的成本。那么样本容量就是150-300。传统的大样本的容量他的定义就是。就是看人家在研究相关问题的时候。

2023-08-07 15:56:44 218 12

转载样本量n＞30时，还能继续使用T检验吗？

后一种方法是基于一个相当重要的原则产生的，该原则对正态方程基础上的总体检验有极其重要的作用。先看Levene"s Test for Equality of Variances，如果方差齐性检验「没有显著差异」，即两方差齐(Equal Variances)，故接著的t检验的结果表中要看第一排的数据，亦即方差齐的情况下的t检验的结果。反之，如果方差齐性检验「有显著差异」，即两方差不齐(Unequal Variances)，故接著的t检验的结果表中要看第二排的数据，亦即方差不齐的情况下的t检验的结果。

2023-08-05 13:25:08 732 10

原创 SPSS‖参数与非参数检验对比课程中的配对样本T检验

特点：在配对样本T检验中，强调被试一定要同质（同一样本，不同变量环境），其目的就为了消除目的是额外变量的影响，更能反映自变量和因变量之间的关系。•配对样本t检验的过程，是对两个同质的样本分别接受两种不同的处理或一个样本先后接受不同的处理，来判断不同的处理是否有差别。由此可见，这种训练方法确实能提高学生的下肢爆发力。•问题：某体育教学组织最新研究出了一种训练下肢爆发力的方法，如何才能知道该训练方法是否能提高学生的下肢爆发力？•这种检验的目的在于根据样本数据对样本来自的配对总体的均值是否有显著差异进行判断的。

2023-08-04 13:44:38 289 4

原创 SPSS数据分析--假设检验的两种原假设取舍决定方式

我们先假定原假设是成立的，这样正常情况之下，计算的统计量应该是落在两根线之间的区域的，而如果计算的统计量超出了这个区域，那么说明原假设是有问题的。对应于图中就是，红色部分的数值出现的概率很小，出现了就不正常，就要否定原假设，接受备择假设。这两种方法本质是一样的，但是一般我们在学校学习计算时，是用前一种方法来判断，而统计软件给出的是第二种判断方法。现在我们来看，两根线与横轴相交的地方，是一个数值，统计量小于这个数值的绝对值（说绝对值是因为两边都有线），那么统计量就落在中间的。如果选择接受原假设，那么原假设。

2023-08-03 13:43:39 786 15

原创 Stata---混合OLS回归

这个体效应检验一般是在做完固定效应模型之后他那个会在stata回归结果后面会显示一个f值。可以看到我们这里的个体效应检验的这个f值是等于1.55三颗星是至少在1%的水平上显著。它的定义是这样的:各个截面估计方程的截距项和斜率项是一样的。和这个固定效应模型他们之间的这个l的这个系数是相差非常大的。我们先看一下这个括号上面的-0.225这个是回归系数。如果我们模型存在个体效应选择不存在个体效应的。那么该个体的回归的估计方程结局效应也就越大。我们今天先讲这个不存在个体效应的模型。

2023-08-02 14:00:11 4296 10

原创 Stata的--随机效应模型处理，以及介绍

既不存在个体效应的话我们就要选择整个OlS模型来估计我们的模型面板数据。这里我们要用随机效应和固定效应的话就要将我们的数据设置成面板格式。那么这个时候我们就要构建个体效应模型来估计我们的面板数据。当我们的U与x是不相关的那我们就选择随机效应模型来估计。因为我们是将我们的面板数据当成横截面数据来处理的。当我们的面板数据在个体效应检验结果不显著的时候。我们的这个个体效应与这个解释变样是存在相关性的。可以看到我们这里的这个表格是选择了固定效应模型。可以我们可以看到随机效应模型跟Ols模型的差。

2023-08-01 14:12:00 2092 1

原创 SPSS常见图表一览

我在本文中展示的图表大多经过了后续的编辑美化，对于统计分析软件来说表现已经挺不错了，但SPSS毕竟不是专业的可视化分析工具，如果你还追求更精美的图表和更具交互式的体验，可以去学Excel、Tableau和PowerBI等等工具。这篇推文主要是小编使用SPSS绘制图表的经验之谈，希望能给大家一定的启发，让大家对SPSS图表有个整体的认识，轻松Pass这个版块，让自己的SPSS进阶路更轻松顺畅。因此，SPSS中的图表并不复杂，但不能说不重要，我们不需要花费太多时间深究，但应对其有整体把握，因此就有了这篇推文。

2023-07-31 14:32:11 661

原创结构方程模型的绘制

这样的话我们的画布就变成了一个横向的A4纸的一个大小。然后模型都绘制完之后就可以进行一个分析属性的一个设置。那么下面来看一下模型图的绘制的一些简单的一些要求。这样的话更加的直观减少我们犯错误的一个可能性。首先要绘制的就是a和b之间的一个相关斜方叉。还需要绘制的是他们之间的一个影响的一个关系。在拖拽这个相应的测量变量的时候才有一个依据。使得最终模型图非常符合一个直观的一个想象。根据各个模型图之间的一个相应的关系给出的。关于中间计算过程和背后的理论的一个结果。一定要注意符合我们的一个行为的一个习惯。

2023-07-30 17:00:53 202 1

原创 Pearson correlation皮尔逊相关性分析

如果想要保留SPSS语法文件，可以先点击“粘贴”，保存本次所有操作，如图5.4所示。下次还要执行同样的操作，直接全选以后，点击绿色小三角符号，就可以生成皮尔逊分析结果了。如果P值小于0.05，那么两个变量呈显著的相关性。第三步，点击“选项”，可以勾选统计，计算平均数与标准差等，如下图所示。然后再看相关系数的方向性，报告两个变量是显著的正相关或负相关。第二步，在相关系数里，选择“皮尔逊”。如果相关系数接近0，说明两个变量之间彼此独立，没有相关性。第一步，选择“分析”——“相关”——“双变量”。

2023-07-29 16:12:35 6100 1

原创什么是ROC曲线

而一些原本类别是0的样本，却被预测为了1。随着分类的概率阈值的减少，Sensitivity和1-Specificity也相应增加（也即Specificity相应减少），所以ROC曲线呈从左下角垂直上升到顶线，水平方向向右延伸到右上角的递增态势。ROC曲线图中45度线下的面积是0.5，ROC曲线与它偏离越大，越向左上方靠拢，它下方的面积（AUC）就越大，其AUC值也越接近于1。因此，preddef2比preddef1的AUC值略大，但它们的95%的置信区间存在交叉，因此可以认为它们的预测效果不存在显著差异。

2023-07-28 20:12:07 2492

原创 Meta论文文献检索国内外检索数据库

也就是说你的关键词在百度学术上减少之后可能还有一部分国内的文献你查不到。其实这个embase它也包括了很多很多的一些医学方面的文献。可能需要一些这个企业的或者说是一些单位的一些邮箱账号去注册。发表之前发表过的文献尽量的达到搜全，就是把它检索的更全面。每一个数据库都有他自己独特的一些其他平台所没有的一些文献。所以你在去检索的过程中同样也是要把这些平台全部检索。所以第一个也是大家很熟悉的也经常用到的叫百度学术。当然百度学术里面也会有很多很好的一些英文的文献。我们看到是一个百度学术的一个高级的一个搜索页面。

2023-07-27 20:38:57 166

原创如何才能做Cox呢？今天带来Cox回归分析步骤详解

Cox回归的结果如下：首先，是omnibus综合检验结果，这个检验是看变量的纳入模型与不纳入模型是否有显著的区别。Cox回归的结果如下：首先，是omnibus综合检验结果，这个检验是看变量的纳入模型与不纳入模型是否有显著的区别。需要注意的是，数据里必须包含结局、生存时间这两列数据。这是一种半参数回归模型，以结局和生存时间为因变量，还可以同时分析多个因素对生存期的影响，碰到数据缺失的情况也不怕！这是一种半参数回归模型，以结局和生存时间为因变量，还可以同时分析多个因素对生存期的影响，碰到数据缺失的情况也不怕！

2023-07-26 19:30:49 1783

原创用R语言来进行ababoost模型的构建

它的核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）。Adaboost与Xgboost模型都属于集成学习模型，但比Xgboost更加“古老”。这个图采用不同颜色标明特征的重要程度，颜色越深越重要。此外，这个图的上方还加了刻度，方便比较各个特征的数值上的差异。将训练集、测试集按8:2进行划分。接下来，让我们用R语言来构建一个adaboost模型。每天进步一点点，今天来分享怎么用R语言来进行ababoost模型的构建。

2023-07-25 16:03:07 397 1

空空如也

空空如也