自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 统计学基本知识(四)

一、 卡方分布对分类数据进行分析的统计方法主要是利用卡方分布,也有许多教材将其称为卡方检验。卡方检验的应用主要表现在两个方面:拟合优度和独立性检验。列联表是进行独立性检验的重要工具。卡方统计量上图是自由度分别为1、5和10时的卡方分布,可以看出,自由度越小,分布就越向左边倾斜,随着自由度的增加,卡方分布的偏斜程度趋于缓解,逐渐显露出对称性,随着自由度的继续增大,卡方分布将趋近于对称的...

2019-08-12 21:46:49 4752

原创 统计学基础知识(三)

假设检验一、假设检验的一般流程假设检验是统计推断的重要组成部分。下面从一个例子开始讲解假设检验。某公司声称他们发明了一种治疗打鼾的新药物鼾克,并断言能在两周内治愈90%的患者。某外科诊所的医生给病人开了鼾克,但她对结果感到失望。她决定自行对药物进行试验。她随机抽取了15位鼻鼾患者,实施为期两周的鼾克治疗。两周后,她请患者来诊所复诊,看他们是否不再打鼾。结果如下:从结果中可以看到,有11人被治...

2019-08-09 20:12:09 6169

原创 统计学基础知识(二)

一、中心极限定理定义这与X符合正态分布时的唯一差别是:样本的大小无所谓。所以可以总结出这样一句话来:根据中心极限定理,如果总体的样本很大,则样本均值的分布近似为正态分布。来看看均值和方差的推导过程: 使用中心极限定理(1)二项分布(2)泊松分布此时计算样本均值的概率可以说是非常容易了,因为样本均值的分布符合正态分布,所以也可以将其标准化通过查找正态分布概率表来获取相应的概率值...

2019-08-06 21:47:00 331

原创 统计学基础知识(一)

文章目录一、统计学基础知识1.总体和样本2.均值3.方差和标准差4.随机变量5.概率密度函数二、二项分布三、泊松分布四、大数定理五、正态分布1.正态分布的一些含义2.如何求解正态概率一、统计学基础知识1.总体和样本统计学上的总体值得是准备对其进行测量、研究或分析的整个群体,可以是人、得分,也可以是糖果——关键在于总体指的是所有对象。一个统计样本就是从总体中选取的一部分对象。通过选取样本,使其...

2019-08-05 21:32:59 2093

原创 LeetCode刷题———加一

题目描述:给定一个由整数组成的非空数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储一个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。示例 1:输入: [1,2,3]输出: [1,2,4]解释: 输入数组表示数字 123。示例 2:输入: [4,3,2,1]输出: [4,3,2,2]解释: 输入数组表示数字 4321。正...

2019-04-06 15:18:37 129

原创 LeetCode刷题———最后一个单词的长度

题目描述:给定一个仅包含大小写字母和空格 ’ ’ 的字符串,返回其最后一个单词的长度。如果不存在最后一个单词,请返回 0 。说明:一个单词是指由字母组成,但不包含任何空格的字符串。示例:输入: “Hello World”输出: 5错误的代码:class Solution: def lengthOfLastWord(self, s: str) -> int: ...

2019-04-05 19:04:21 77

原创 MySQL(二)

项目三创建如下所示的 courses 表 ,有: student (学生) 和 class (课程)。编写一个 SQL 查询,列出所有超过或等于5名学生的课且学生在每个课中不应被重复计算。创建表:查询结果:项目四创建一个salary表,如下所示,有m=男性和f=女性的值。要求:交换所有的f和m值(例如,将所有的f值改为m值,反之亦然)。要求使用一个更新查询,并且没有中间临时表。...

2019-04-04 21:47:12 118

原创 LeetCode刷题———搜索插入位置

题目描述:给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。你可以假设数组中无重复元素。示例 1:输入: [1,3,5,6], 5输出: 2示例 2:输入: [1,3,5,6], 2输出: 1示例 3:输入: [1,3,5,6], 7输出: 4示例 4:输入: [1,3,5,6], 0输出: 0代码...

2019-04-04 20:15:16 102

转载 MySQL(一)

1.1 MySQL 软件安装及数据库基础数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。所以,现在我们使用关系型数据库管理系统(RDBMS)来存储和管理的大数据量。所谓的关系型数据库,是建立在关系模型基础上的数据库,借...

2019-04-02 21:35:38 176

原创 LeetCode刷题———回文数

题目描述:判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文数。进阶...

2019-04-02 15:37:53 195

转载 LeetCode刷题———整数反转

题目描述:给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数,则其数值范围为 [−231, 231 − 1]。请根据这个假设,如果反转后整数溢出那么就返回 0。代码:class ...

2019-04-01 18:25:51 454

转载 leetcode刷题——两数之和

题目描述:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]代码:...

2019-03-31 18:57:57 106

转载 任务三 决策树算法梳理

1.信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度)1)熵2)联合熵与条件熵上面定义了单个随机变量的熵。现在,将定义推广到两个随机变量的情形。由于可将(X,Y)视为单个向量,所以其定义其实并无新鲜之处。3)信息增益在已知A的情况下,随机变量D的不确定性的减少程度,也就是在我们知道A的情况下获得了多少信息。如果D是数据类别的随机变量,而A是数据某个特征的随机变量,可以想见使得...

2019-03-05 19:47:13 213

转载 任务二 逻辑回归算法梳理

1、逻辑回归与线性回归的联系与区别参考博客:https://blog.csdn.net/lx_ros/article/details/812632092、逻辑回归的原理如果线性回归的结果输出是一个连续值,而值得范围是无法限定的,那我们没有办法把这个结果值映射为可以帮助我们判断的结果,如果输出结果是(0,1)的一个概率值,就可以很容易判断结果。逻辑回归正是利用了这样一个函数——sigmoid函...

2019-03-03 19:04:19 179

转载 任务一 线性回归算法梳理

1.机器学习的一些概念1)根据训练数据是否拥有标记信息,学习任务可大致划分为两大类:“监督学习”(supervised learning)和“无监督学习”(unsupervised learning),分类和回归是前者的代表,而聚类则是后者的代表。有监督学习:有监督的学习的数据具备特征(features)与预测目标(label),通过算法训练并建立模型。当有新的数据时,我们就可以使用模型进行预...

2019-03-01 20:13:01 320

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除