自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

舒晴的博客

好好学习 天天向上

  • 博客(6)
  • 收藏
  • 关注

原创 决策树及其python实现

1. 简介决策树是基于树结构来进行决策的。一颗决策树包含一个根结点、若干个内部结点和若干个叶结点,叶结点对应于决策结果,根结点包含样本全集。决策树学习的基本思想是“分而治之”。决策树的生成是一个递归过程,有三种情形会导致递归返回:(1)当前结点包含的样本全属于同一类别,无需划分;(2)当前属性集为空,无法划分;(3)当前结点包含的样本集合为空,不能划分。在第(1)种情形下,决策树只有一个根...

2019-01-31 02:35:15 871

原创 python os 模块

python 的 os 模块封装了常见的文件和目录操作。本文旨在记录实践中常用的方法,持续更新,欢迎交流!方法 说明 os.mkdir 创建目录 os.rmdir 删除目录 os.rename 重命名 os.remove 删除文件 os.getcwd 获取当前工作路径 os.walk 遍历目录 os.path.join ...

2019-08-05 14:41:35 604

原创 python 日期和时间 module

本文用于记录自己在实践过程中用到的时间和日期的相关模块的知识,会持续更新。欢迎交流!datetime获取当前日期和时间from datetime import datetime # 从 datetime 模块中导入 datetime 类dt = datetime.now() # 获取当前日期和时间获取指定日期和时间datetime(2019,8,5,12) # 用参数直接指定一...

2019-08-05 14:22:47 217

原创 python gc 模块介绍

gc 模块所涉及到的是python的内存管理问题。python 使用引用计数和垃圾回收来释放(free)内存。引用计数:指向该对象的引用总数。可用 sys.getrefcount() 查看对象的引用计数。 垃圾回收:清楚 python 中没用的对象。当对象的引用计数为0时,该对象就可以被垃圾回收。python 会在特定条件下(当 object allocation 次数和 object ...

2019-08-05 11:43:13 662

原创 正则化和交叉验证

正则化简介偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据集。方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,预测结果数据的分布越散。High Bias(高偏差)就是欠拟合,High Variance(高方差)就是过拟合。在损失函数上添加了正则化项,可以对模型中的参数进行约束,从而降低模型的过拟合程度。正则化项一般是模型复杂度的...

2019-03-05 14:46:01 977

原创 逻辑回归及梯度下降法

逻辑回归原理过程逻辑回归是一种二分类方法。找到预测函数,一般表示为h函数,用来预测输入数据的判断结果:分类边界为线性边界时,预测函数为hθ(x)h_θ(x)hθ​(x)函数的值表示结果取1的概率。找到损失函数,记为J(θ)函数,表示所有训练数据预测值和实际类别的偏差:基于最大似然估计,得到损失函数找到J(θ)函数的最小值:根据梯度下降的公式,得到迭代公式因为式中α为一常...

2019-03-02 21:27:11 2295

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除