3 君若有心

尚未进行身份认证

我要认证

即使前路漫漫,我愿抵砺前行

等级
TA的排名 28w+

【练习】-航空公司用户价值分析与挖掘

文章目录一、项目背景与目标二、分析过程1.源数据2.数据探索3.数据预处理3.1 数据清洗3.2 属性约定3.3 数据转换4.模型构建4.1 客户聚类4.2 客户价值分析4.3 模型应用三、总结四、扩展一、项目背景与目标客户关系管理是信息时代的企业核心问题。客户关系管理的关键在于客户分类用以区分无价值客户、高价值客户针对不同价值的客户制定个性化服务方案通过建立客户价值评...

2020-05-07 12:38:10

【笔记】数据方法论-9.K-Means

文章目录本篇重点一、聚类二、K-Means算法1.算法步骤2.优化目标3.K-Means算法的优点与缺点4.代码演示5.初始质心的影响三、K-Means++1.算法步骤2.代码演示四、Mini Batch K-Means1.算法步骤2.代码演示五、K-Means算法中的K值本篇重点K-Means算法原理及步骤K-Means++算法Mini Batch K-Means算法最佳K值一、...

2020-04-28 17:46:10

【笔记】数据方法论-8.决策树

文章目录本篇重点一、信息熵及概念1.概念2.计算方式3.概率分布与信息熵4.代码演示-概率与信息熵对比二、决策树训练与预测1.决策树概念2.训练决策树3.预测原理三、分类决策树1.信息增益1.1 特征选择顺序1.2 信息增益2.训练规则1.将每一个特征看成是一种分裂可能。特征可以分为离散型与连续型3.分类决策树示例四、不纯度度量标准1.信息熵2.基尼系数3.错误率4.代码演示-三种度量方式对比五、...

2020-04-27 18:31:50

【练习】线性回归与KNN回归对比

文章目录前言一、导入模块 & 数据二、KNN回归与线性回归基模型对比三、标准化特征集及效果对比四、KNN优化-网格搜索五、线性回归优化-RFECV前言本次练习,使用sklearn自带的波士顿房价数据集,主要为了对比无优化KNN回归模型与线性回归模型的效果对比;标准化特征集后的KNN效果提升,以及网格搜索优化后KNN模型及特征选择后线性回归模型的效果。一、导入模块 & 数据先...

2020-04-23 18:54:05

【笔记】数据方法论-7.朴素贝叶斯

文章目录一、概率基础1.随机事件、样本空间与概率2.联合概率3.条件概率4.独立性5.全概率公式 *6.贝叶斯公式 *6.1 公式定义6.2 核心思维6.3 练习6.4 先验概率与后验概率二、朴素贝叶斯算法1.案例2.算法原理3.平滑改进4.算法优点5.算法缺点三、常用朴素贝叶斯1.高斯朴素贝叶斯2.伯努利朴素贝叶斯3.多项式朴素贝叶斯4.鸢尾花数据集下的三种朴素贝叶斯算法测试一、概率基础1....

2020-04-23 16:20:37

【练习】 逻辑回归与KNN分类模型二分类情景下的应用与对比

文章目录一、基模型创建二、模型训练三、模型评估一、基模型创建二、模型训练三、模型评估

2020-04-22 17:04:39

【笔记】数据方法论-6.KNN

文章目录一、算法原理二、算法超参数1.K值2.距离度量方式3.权重计算方式三、算法步骤四、使用KNN实现分类1.建模预测2.超参数对模型的影响3.超参数调整五、使用KNN回归预测1.建模预测2.数据标准化3.流水线六、KD树一、算法原理KNN(K-Nearest Neighbor),即K近邻算法。K近邻就是K个最近的邻居,当一个未知样本需要预测的时候,就由与该样本最接近的K个邻居来决定。K...

2020-04-21 13:04:47

【笔记】数据方法论-5.分类模型的评估

文章目录一、混淆矩阵代码演示-混淆矩阵二、评估指标1.正确率2.精准率3.召回率4.F1调和平均值5.各指标使用注意事项6.代码演示-计算模型评估值三、ROC与AUC1.ROC曲线2.AUC3.代码演示-ROC曲线示例3.1 roc_curve函数的参数3.2 roc_curve函数的返回值3.3 绘制ROC曲线四、样本不均衡现象一、混淆矩阵混淆矩阵,用来评估模型分类的正确性。该矩阵是一个方阵...

2020-04-19 21:09:12

【笔记】数据方法论-4.逻辑回归

文章目录1. 逻辑回归模型1.1 模型简介1.2 算法的分类思想1.3 算法模型1.4 sigmoid函数1.4.1 函数原型1.4.2 代码演示-sigmoid函数图像2. 逻辑回归损失函数2.1 损失函数2.2 损失函数可视化2.3 参数求解3. 逻辑回归实现二分类3.1 模型训练与预测3.2 结果可视化3.3 计算概率值3.4 绘制决策边界4. 逻辑回归实现多分类4.1 建模与可视化4.2 ...

2020-04-16 22:59:37

【笔记】线性回归实战-AQI分析与预测

文章目录写在前面一、AQI预测与分析1 背景信息2 任务说明3 数据集描述二、数据分析基本流程1 基本流程2 理解流程三、读取数据1 导入相关库2 加载数据集四、数据清洗1 缺失值1.1 缺失值探索1.2 缺失值处理1.2.1 数据分布1.2.2 填充数据2 异常值2.1 异常值探索2.1.1 describe方法2.1.2 3σ原则2.1.3 箱线图2.2 异常值处理2.2.1 对数转换2.2....

2020-04-15 18:48:48

【笔记】数据方法论-3.线性回归

文章目录写在前面1.数据建模1.1 模型及其概念1.2 回归分析1.3 线性回归1.4 拟合2.线性回归模型2.1 简单线性回归2.2 多元线性回归3.损失函数3.1 损失函数3.2 参数求解4.回归模型评估4.1 MSE (平均平方误差)4.2 RMSE (平均平方误差平方根)4.3 MAE (平均绝对值误差)4.4 R2R^2R2 (拟合系数)5.代码演示-简单线性回归6.代码演示-多元线性回...

2020-04-09 18:04:16

【笔记】数据方法论-2.2.推断统计分析-假设检验

文章目录写在前面1.假设检验1.1 引入1.2 假设检验概念1.3 小概率事件1.4 P-Value与显著性水平2.假设检验步骤3.常用假设检验3.1 Z检验3.2 T检验4.双边检验与单边检验4.1 概念4.2 右边假设检验4.3 左边假设检验写在前面1.假设检验1.1 引入某车间用一台包装机包装糖果,袋装糖的净重是一个随机变量,服从正态分布。当机器正常时,均值为0.5KG,标准差为0...

2020-04-06 18:22:14

【笔记】数据方法论-2.1.推断统计分析-参数估计

文章目录写在前面1.推断统计分析概述1.1 总体、个体与样本1.2 推断统计概念2.点估计与区间估计2.1 点估计2.2 区间估计2.3 点估计与区间估计:3.中心极限定理3.1 定理概念3.2 代码演示4.正态分布的特性4.1 正态分布特性解析4.2 代码演示-正态分布特性验证4.3 习题解析4.4 代码演示-样本推测总体均值写在前面重点知识点估计与区间估计的概念和区别中心极限定理的...

2020-04-03 00:31:25

【笔记】数据方法论-1.描述性统计分析

文章目录写在前面1.统计基础2.描述性统计分析概述2.1 概念2.2 变量的类型3.统计量3.1 频数与频率3.1.1 频数3.1.2 频率3.1.3 代码演示3.2 集中趋势3.2.1 平均值3.2.2 中位数3.2.3 众数3.2.4 平均值、中位数与众数的关系3.2.5 代码演示-鸢尾花花萼长度(sepal_length)3.2.6 分位数3.3 离散程度3.3.1 极差3.3.2 方差3....

2020-03-31 21:53:58

八、第一阶段-Python数据处理库-Pandas

文章目录写在前面一、Pandas简介二、Pandas数据类型1.Series1.1 创建Series对象1.2 获取Series对象中的值1.3 对Series对象的切片1.4 Series对象的索引1.5 删除2.DataFrame2.1 创建DataFrame对象2.2 DataFrame对象的形状2.3 索引2.4 数据类型2.5 维度2.6DataFrame对象的信息概览2.7 DataF...

2020-03-29 20:33:06

五、第一阶段-Python异常、模块和文件操作

文章目录写在前面1.异常、捕获异常2.模块3.文件操作基础写在前面本篇重点异常及异常的处理模块的导入方式基础文件读写1.异常、捕获异常2.模块3.文件操作基础...

2020-03-24 20:20:24

四、第一阶段-Python面向对象

文章目录写在前面1.面向对象编程2.类和对象2.1 类2.2 对象2.3 类和对象之间的关系2.4 定义类和创建对象3.对象的属性和方法3.1 对象属性的添加、获取3.2 self获取对象属性3.3 init等魔法方法4.继承4.1 单继承4.2 多继承4.3 重写父类方法4.4 属性方法4.4.1 类属性和实例属性4.4.2 静态方法和类方法5.多态写在前面本篇重点Python对象的创...

2020-03-23 00:36:49

三、第一阶段-Python函数

文章目录写在前面1.函数简介2.函数的定义和调用2.1 定义函数2.2 调用函数2.3 注意点3.函数的参数3.1 位置参数3.2 默认参数3.3 可变参数3.4 命名关键字参数3.5 参数组合4.函数的返回值4.1 返回值说明4.2 带有返回值的函数4.3 保存函数的返回值4.4 返回多个返回值5.递归函数6.局部变量7.全局变量写在前面本篇重点函数的创建函数的调用函数的参数传递...

2020-03-22 18:08:53

二、第一阶段-Python数据类型

文章目录写在前面一、str-字符串1.字符串的定义2.下标和切片3.字符串常见操作二、list-列表1.列表的定义2.列表的常见操作3.列表的遍历三、tuple-元组1.元组的定义四、dict-字典1.字典的定义2.字典的常见操作五、set-集合写在前面本篇重点字符串列表元组字典集合一、str-字符串1.字符串的定义2.下标和切片3.字符串常见操作二、list-...

2020-03-22 00:25:57

一、第一阶段-Python基础知识

文章目录写在前面一、注释单行注释多行注释二、变量的定义三、关键字四、常用类型转换五、输入、输出(格式化输出)输入输出格式化输出六、运算符1.算术运算符2.赋值运算符七、判断-if1.if语句2.if...else语句3.if...elif...else八、循环-for/while1.while循环2.for循环九、break/continuebreakcontinue写在前面本篇重点输入...

2020-03-21 00:19:49
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。