自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

KopWelkin的博客

千里之行始于足下

  • 博客(377)
  • 收藏
  • 关注

转载 R语言 面试题

什么是R语言编程?R语言是一种用于统计分析和为此目的创建图形的编程语言。不是数据类型,它具有用于计算的数据对象。它用于数据挖掘,回归分析,概率估计等领域,使用其中可用的许多软件包。R语言中的不同数据对象是什么?它们是R语言中的6个数据对象。它们是向量,列表,数组,矩阵,数据框和表。什么使R语言中的有效变量名?有效的变量名称由字母,数字和点或下划线字符组成。变量名以字母或...

2018-05-06 10:27:59 5848

转载 R语言 卡方检验

卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。 这两个变量应该来自相同的人口,他们应该是类似 - 是/否,男/女,红/绿等。例如,我们可以建立一个观察人们的冰淇淋购买模式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋的味道相关联。 如果发现相关性,我们可以通过了解访问的人的性别的数量来计划适当的味道库存。语法用于执行卡方检验的函数是chisq.test()。 ...

2018-05-06 10:11:02 3485

转载 R语言 生存分析

生存分析处理预测特定事件将要发生的时间。 它也被称为故障时间分析或分析死亡时间。 例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间。命名为survival的R语言包用于进行生存分析。 此包包含函数Surv(),它将输入数据作为R语言公式,并在选择的变量中创建一个生存对象用于分析。 然后我们使用函数survfit()创建一个分析图。安装软件包install.packa...

2018-05-04 17:58:47 12558

转载 R语言 随机森林算法

在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。对构建树时未使用的情况进行错误估计。 这称为OOB(袋外)误差估计,其被提及为百分比。R语言包“randomForest”用于创建随机森林。安装R包在R语言控制台中使用以下命令安装软件包。 您还必须安装相关软件包(如果...

2018-05-03 13:22:06 2636

转载 R语言 决策树

决策树是以树的形式表示选择及其结果的图。图中的节点表示事件或选择,并且图的边缘表示决策规则或条件。它主要用于使用R的机器学习和数据挖掘应用程序。决策树的使用的例子是 - 预测电子邮件是垃圾邮件或非垃圾邮件,预测肿瘤癌变,或者基于这些因素预测贷款的信用风险。通常,使用观测数据(也称为训练数据)来创建模型。然后使用一组验证数据来验证和改进模型。 R具有用于创建和可视化决策树的包。对于新的预测变量集...

2018-05-02 14:17:49 2010

转载 R语言 非线性最小二乘

当模拟真实世界数据用于回归分析时,我们观察到,很少情况下,模型的方程是给出线性图的线性方程。大多数时候,真实世界数据模型的方程涉及更高程度的数学函数,如3的指数或sin函数。在这种情况下,模型的图给出了曲线而不是线。线性和非线性回归的目的是调整模型参数的值,以找到最接近您的数据的线或曲线。在找到这些值时,我们将能够以良好的精确度估计响应变量。在最小二乘回归中,我们建立了一个回归模型,其中来自回...

2018-05-01 15:47:16 2283

转载 R语言 时间序列分析

时间序列是一系列数据点,其中每个数据点与时间戳相关联。 一个简单的例子是股票在某一天的不同时间点的股票价格。 另一个例子是一个地区在一年中不同月份的降雨量。 R语言使用许多函数来创建,操作和绘制时间序列数据。 时间序列的数据存储在称为时间序列对象的R对象中。 它也是一个R语言数据对象,如矢量或数据帧。使用ts()函数创建时间序列对象。语法时间序列分析中ts()函数的基本语法是 -t...

2018-04-30 20:06:34 2030 1

转载 R语言 协方差分析

我们使用回归分析创建模型,描述变量在预测变量对响应变量的影响。 有时,如果我们有一个类别变量,如Yes / No或Male / Female等。简单的回归分析为分类变量的每个值提供多个结果。 在这种情况下,我们可以通过将分类变量与预测变量一起使用并比较分类变量的每个级别的回归线来研究分类变量的效果。 这样的分析被称为协方差分析,也称为ANCOVA。例考虑在数据集mtcars中内置的R语...

2018-04-29 17:42:55 12083

转载 R语言 泊松回归

泊松回归包括回归模型,其中响应变量是计数而不是分数的形式。 例如,足球比赛系列中的出生次数或胜利次数。 此外,响应变量的值遵循泊松分布。泊松回归的一般数学方程为 -log(y) = a + b1x1 + b2x2 + bnxn.....以下是所使用的参数的描述 - y是响应变量。a和b是数字系数。x是预测变量。用于创建泊松回归模型的函数是glm()函数。语法...

2018-04-28 14:24:14 8740

转载 R语言 二项分布

二项分布模型处理在一系列实验中仅发现两个可能结果的事件的成功概率。 例如,掷硬币总是给出头或尾。 在二项分布期间估计在10次重复抛掷硬币中精确找到3个头的概率。R语言有四个内置函数来生成二项分布。 它们描述如下。dbinom(x, size, prob)pbinom(x, size, prob)qbinom(p, size, prob)rbinom(n, size, prob)...

2018-04-27 13:22:37 12815

转载 R语言 标准分布

在来自独立源的数据的随机集合中,通常观察到数据的分布是正常的。 这意味着,在绘制水平轴上的变量值和垂直轴上的值的计数的图形时,我们得到钟形曲线。 曲线的中心表示数据集的平均值。 在图中,50%的值位于平均值的左侧,另外50%位于图表的右侧。 这在统计学中被称为正态分布。R语言有四个内置函数来产生正态分布。 它们描述如下。dnorm(x, mean, sd)pnorm(x, mean,...

2018-04-26 12:58:20 3038

转载 R语言 逻辑回归

逻辑回归是回归模型,其中响应变量(因变量)具有诸如True / False或0/1的分类值。 它实际上基于将其与预测变量相关的数学方程测量二元响应的概率作为响应变量的值。逻辑回归的一般数学方程为 -y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...))以下是所使用的参数的描述 - y是响应变量。x是预测变量。a和b是作为数字常数的系数。用于创建回归模...

2018-04-25 08:55:17 2554

转载 R语言 多重回归

多元回归是线性回归到两个以上变量之间的关系的延伸。 在简单线性关系中,我们有一个预测变量和一个响应变量,但在多元回归中,我们有多个预测变量和一个响应变量。多元回归的一般数学方程为 -y = a + b1x1 + b2x2 +...bnxn以下是所使用的参数的描述 - y是响应变量。a,b1,b2 … bn是系数。x1,x2,… xn是预测变量。我们使用R语言中的lm...

2018-04-24 13:00:48 889

转载 R语言 线性回归

回归分析是一种非常广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值从预测变量派生。在线性回归中,这两个变量通过方程相关,其中这两个变量的指数(幂)为1.数学上,线性关系表示当绘制为曲线图时的直线。 任何变量的指数不等于1的非线性关系将创建一条曲线。线性回归的一般数学方程为 -y = ax + b以下...

2018-04-23 12:47:45 885

转载 R语言 平均值,中位数和模式

R中的统计分析通过使用许多内置函数来执行。 这些函数大多数是R基础包的一部分。 这些函数将R向量作为输入和参数,并给出结果。我们在本章中讨论的功能是平均值,中位数和模式。Mean平均值通过求出数据集的和再除以求和数的总量得到平均值函数mean()用于在R语言中计算平均值。语法用于计算R中的平均值的基本语法是 -mean(x, trim = 0, na.rm = ...

2018-04-22 20:25:17 8071

转载 R语言 数据库

数据是关系数据库系统以规范化格式存储。 因此,要进行统计计算,我们将需要非常先进和复杂的Sql查询。 但R语言可以轻松地连接到许多关系数据库,如MySql,Oracle,Sql服务器等,并从它们获取记录作为数据框。 一旦数据在R语言环境中可用,它就变成正常的R语言数据集,并且可以使用所有强大的包和函数来操作或分析。 在本教程中,我们将使用MySql作为连接到R语言的参考数据库。RMySQ...

2018-04-21 13:06:24 4352

转载 R语言 Web数据

许多网站提供数据供其用户使用。 例如,世界卫生组织(WHO)以CSV,txt和XML文件的形式提供健康和医疗信息的报告。 使用R语言程序,我们可以从这些网站以编程方式提取特定数据。 R语言中用于从网站中提取数据的一些包是“RCurl”,XML“和”stringr“,它们用于连接到URL,识别文件所需的链接并将它们下载到本地环境。安装R语言的包处理URL和链接到文件需要以下的包。 如果它...

2018-04-20 10:04:11 443

转载 R语言 JSON文件

JSON文件以人类可读格式将数据存储为文本。 Json代表JavaScript Object Notation。 R可以使用rjson包读取JSON文件。安装rjson包在R语言控制台中,您可以发出以下命令来安装rjson包。install.packages("rjson")输入数据通过将以下数据复制到文本编辑器(如记事本)中来创建JSON文件。 使用.json扩展...

2018-04-19 19:20:16 4680 1

转载 R语言 XML文件

XML是一种文件格式,它使用标准ASCII文本共享万维网,内部网和其他地方的文件格式和数据。 它代表可扩展标记语言(XML)。 类似于HTML它包含标记标签。 但是与HTML中的标记标记描述页面的结构不同,在xml中,标记标记描述了包含在文件中的数据的含义。您可以使用“XML”包读取R语言中的xml文件。 此软件包可以使用以下命令安装。install.packages("XML")...

2018-04-18 13:13:48 4619

转载 R语言 二进制文件

二进制文件是包含仅以位和字节(0和1)的形式存储的信息的文件。它们不是人类可读的,因为它中的字节转换为包含许多其他不可打印字符的字符和符号。尝试使用任何文本编辑器读取二进制文件将显示如Ø和ð的字符。二进制文件必须由特定程序读取才能使用。例如,Microsoft Word程序的二进制文件只能通过Word程序读取到人类可读的形式。这表示,除了人类可读的文本之外,还有更多的信息,例如字符和页码等的格...

2018-04-17 12:48:07 2068 1

转载 R语言 Excel文件

Microsoft Excel是最广泛使用的电子表格程序,以.xls或.xlsx格式存储数据。 R语言可以直接从这些文件使用一些excel特定的包。 很少这样的包是 - XLConnect,xlsx,gdata等。我们将使用xlsx包。 R语言也可以使用这个包写入excel文件。安装xlsx软件包您可以在R控制台中使用以下命令来安装“xlsx”软件包。 它可能会要求安装一些额外的软件包...

2018-04-16 13:08:12 522

转载 R语言 CSV文件

在R语言中,我们可以从存储在R语言环境外的文件中读取数据。 我们还可以将数据写入将被操作系统存储和访问的文件。 R语言可以读取和写入各种文件格式,如csv,excel,xml等。在本章中,我们将学习从csv文件读取数据,然后将数据写入csv文件。 该文件应该存在于当前工作目录中,以便R语言可以读取它。 当然我们也可以设置我们自己的目录并从那里读取文件。获取和设置工作目录您可以使用g...

2018-04-15 14:37:55 3986

转载 R语言 饼状图

R编程语言有许多库来创建图表和图表。 饼图是将值表示为具有不同颜色的圆的切片。 切片被标记,并且对应于每个片的数字也在图表中表示。 在R语言中,饼图是使用pie()函数创建的,它使用正数作为向量输入。 附加参数用于控制标签,颜色,标题等。语法使用R语言创建饼图的基本语法是 -pie(x, labels, radius, main, col, clockwise)以下是所使...

2018-04-14 22:51:18 11149 1

转载 R语言 散点图

散点图显示在笛卡尔平面中绘制的许多点。 每个点表示两个变量的值。 在水平轴上选择一个变量,在垂直轴上选择另一个变量。 使用plot()函数创建简单散点图。语法在R语言中创建散点图的基本语法是 -plot(x, y, main, xlab, ylab, xlim, ylim, axes)以下是所使用的参数的描述 - x是其值为水平坐标的数据集。y是其值是垂直坐标的数...

2018-04-13 14:35:43 3640

转载 R语言 折线图

折线图是通过在它们之间绘制线段来连接一系列点的图。 这些点在它们的坐标(通常是x坐标)值之一中排序。 折线图通常用于识别数据中的趋势。R语言中的plot()函数用于创建折线图。语法在R语言中创建折线图的基本语法是 -plot(v,type,col,xlab,ylab)以下是所使用的参数的描述 - v是包含数值的向量。类型采用值“p”仅绘制点,“l”仅绘制线和“o...

2018-04-12 00:55:25 42616

转载 R语言 直方图

直方图表示被存储到范围中的变量的值的频率。 直方图类似于条形图,但不同之处在于将值分组为连续范围。 直方图中的每个柱表示该范围中存在的值的数量的高度。R语言使用hist()函数创建直方图。 此函数使用向量作为输入,并使用一些更多的参数来绘制直方图。语法使用R语言创建直方图的基本语法是 -hist(v,main,xlab,xlim,ylim,breaks,col,border...

2018-04-11 10:45:10 19586 1

转载 R语言 箱线图

箱线图是数据集中的数据分布良好的度量。 它将数据集分成三个四分位数。 此图表表示数据集中的最小值,最大值,中值,第一四分位数和第三四分位数。 它还可用于通过绘制每个数据集的箱线图来比较数据集之间的数据分布。 R语言中使用boxplot()函数来创建箱线图。语法在R语言中创建箱线图的基本语法是 -boxplot(x, data, notch, varwidth, names, ...

2018-04-10 09:57:17 25253 1

转载 R语言 条形图

条形图表示矩形条中的数据,条的长度与变量的值成比例。 R语言使用函数barplot()创建条形图。 R语言可以在条形图中绘制垂直和水平条。 在条形图中,每个条可以给予不同的颜色。语法在R语言中创建条形图的基本语法是 -barplot(H, xlab, ylab, main, names.arg, col)以下是所使用的参数的描述 - H是包含在条形图中使用的数值的向量...

2018-04-09 09:14:05 9668

转载 R语言 数据帧

数据帧是表或二维阵列状结构,其中每一列包含一个变量的值,并且每一行包含来自每一列的一组值。 以下是数据帧的特性。 - 列名称应为非空。 - 行名称应该是唯一的。 - 存储在数据帧中的数据可以是数字,因子或字符类型。 - 每个列应包含相同数量的数据项。创建数据帧# Create the data frame.emp.data <- data.frame( em...

2018-04-08 09:02:42 1067

转载 R语言 因子

因子是用于对数据进行分类并将其存储为级别的数据对象。 它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中很有用。 像“男性”,“女性”和True,False等。它们在统计建模的数据分析中很有用。 使用factor()函数通过将向量作为输入创建因子。例# Create a vector as input.data <- c("East","West","East"...

2018-04-07 15:54:36 794

转载 R语言 数组

数组是可以在两个以上维度中存储数据的R数据对象。 例如 - 如果我们创建一个维度(2,3,4)的数组,则它创建4个矩形矩阵,每个矩阵具有2行和3列。 数组只能存储数据类型。 使用array()函数创建数组。 它使用向量作为输入,并使用dim参数中的值创建数组。例以下示例创建一个由两个3x3矩阵组成的数组,每个矩阵具有3行和3列。# Create two vectors of ...

2018-04-06 15:38:03 4763

转载 R语言 矩阵

矩阵是其中元素以二维矩形布局布置的R对象。 它们包含相同原子类型的元素。 虽然我们可以创建一个只包含字符或只包含逻辑值的矩阵,但它们没有太多用处。 我们使用包含数字元素的矩阵用于数学计算。使用matrix()函数创建一个矩阵。语法在R语言中创建矩阵的基本语法是 -matrix(data, nrow, ncol, byrow, dimnames)以下是所使用的参数的说明 ...

2018-04-05 17:54:38 680

转载 R语言 列表

列表是R语言对象,它包含不同类型的元素,如数字,字符串,向量和其中的另一个列表。 列表还可以包含矩阵或函数作为其元素。 列表是使用list()函数创建的。创建列表以下是创建包含字符串,数字,向量和逻辑值的列表的示例# Create a list containing strings, numbers, vectors and a logical values.list_dat...

2018-04-04 10:04:19 1075

转载 R语言 向量

向量是最基本的R语言数据对象,有六种类型的原子向量。 它们是逻辑,整数,双精度,复杂,字符和原始。创建向量单元素向量即使在R语言中只写入一个值,它也将成为长度为1的向量,并且属于上述向量类型之一。# Atomic vector of type character.print("abc");# Atomic vector of type double.print(...

2018-04-03 09:39:47 851

转载 R语言 字符串

在R语言中的单引号或双引号对中写入的任何值都被视为字符串。 R语言存储的每个字符串都在双引号内,即使是使用单引号创建的依旧如此。在字符串构造中应用的规则在字符串的开头和结尾的引号应该是两个双引号或两个单引号。它们不能被混合。双引号可以插入到以单引号开头和结尾的字符串中。单引号可以插入以双引号开头和结尾的字符串。双引号不能插入以双引号开头和结尾的字符串。单引号不能插入以单引号开...

2018-04-02 09:45:01 1148

转载 R语言 函数

函数是一组组合在一起以执行特定任务的语句。 R语言具有大量内置函数,用户可以创建自己的函数。在R语言中,函数是一个对象,因此R语言解释器能够将控制传递给函数,以及函数完成动作所需的参数。该函数依次执行其任务并将控制返回到解释器以及可以存储在其他对象中的任何结果。函数定义使用关键字函数创建R语言的函数。 R语言的函数定义的基本语法如下function_name <-...

2018-04-01 09:04:13 1351

转载 R语言 数据重塑

R语言中的数据重塑是关于改变数据被组织成行和列的方式。 大多数时间R语言中的数据处理是通过将输入数据作为数据帧来完成的。 很容易从数据帧的行和列中提取数据,但是在某些情况下,我们需要的数据帧格式与我们接收数据帧的格式不同。 R语言具有许多功能,在数据帧中拆分,合并和将行更改为列,反之亦然。于数据帧中加入列和行我们可以使用cbind()函数连接多个向量来创建数据帧。 此外,我们可以使用r...

2018-03-31 08:49:35 966

转载 R语言 循环

可能有一种情况,当你需要执行一段代码几次。 通常,顺序执行语句。 首先执行函数中的第一个语句,然后执行第二个语句,依此类推。编程语言提供允许更复杂的执行路径的各种控制结构。循环语句允许我们多次执行一个语句或一组语句,以下是大多数编程语言中循环语句的一般形式 -R编程语言提供以下种类的循环来处理循环需求。 单击以下链接以检查其详细信息。 Sr.No. 循环类型和描述...

2018-03-30 00:00:13 22283 1

转载 R语言 包

R语言的包是R函数,编译代码和样本数据的集合。 它们存储在R语言环境中名为“library”的目录下。 默认情况下,R语言在安装期间安装一组软件包。 随后添加更多包,当它们用于某些特定目的时。 当我们启动R语言控制台时,默认情况下只有默认包可用。 已经安装的其他软件包必须显式加载以供将要使用它们的R语言程序使用。所有可用的R语言包都列在R语言的包。 下面是用于检查,验证和使用R包的命令列表。...

2018-03-29 09:34:28 893

转载 R语言 决策

决策结构要求程序员指定要由程序评估或测试的一个或多个条件,以及如果条件被确定为真则要执行的一个或多个语句,如果条件为假则执行其他语句。以下是在大多数编程语言中的典型决策结构的一般形式 R提供以下类型的决策语句。 单击以下链接以检查其详细信息。 Sr.No. 声明和描述 1 if语句if语句由一个布尔表达式后跟一个或多个语句组成。 2 if … e...

2018-03-28 09:55:50 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除