学号_Y_1055-CSDN博客

原创随机森林的原理和用随机森林的方式进行特征选择

Bagging的策略：假定给定了N个样本，现在让我们去做决策树，分类器使用ID3，那么现在样本确定了，分类器确定了，这个决策树就是已经确定的。那么如果我们保证每次的数据不一样，就可以生成不同的决策树。那我们如何保证每次的样本数据不一样呢？最直接最有效的方法：首先我们有N个样本，我们给定一个从1-N的随机数，每次随机有放回的随机取一个随机数（也就是说可以重复）并且取N次，我们就得到了一个N个样本的随机数，标位DT1。我们重复前面随机取样的步骤，得到M颗决策树，这样就形成了一个森林。问题：那么如果给定N个样

2020-09-09 01:11:26 2570

原创决策树，条件熵，相对熵，互信息

决策树：决策树最大的好处就是训练速度快从n个特征中选择一个来分成若干份。如果是离散的，就分成若干份，如果是连续的，就取某一个值作为阈值分类，那么现在的问题转化成为我们要选取哪一个特征来分类。因为有不同的标准，所以有了ID3，C4.5，CART这三种决策树。假如现在有一个数据集，分别是红色的圆点和绿色的圆点，红色有70个，绿色有65个，把他们放到一起，随机抓取一个，它的颜色是红色还是绿色？我们可以算它的概率。红色概率有70/135，绿色概率为65/135。那我们可以预测是红色的，即使概率很接近百分之50

2020-07-31 13:57:56 742

m0_46519036的博客

原创随机森林的原理和用随机森林的方式进行特征选择

原创决策树，条件熵，相对熵，互信息

原创多元线性回归

原创特征缩放

原创 Logistic模型，混淆矩阵AUC

原创回归算法：线性回归，中心极限定理，似然函数，正则1正则2，梯度下降

原创逻辑回归，聚类

原创线性回归，正规方程和梯度下降，如何解决过拟合现象

原创算法k近邻和朴素贝叶斯

原创数据降维

原创机器学习概述

原创数据清洗，pca，one-hot编码，auc

原创矩阵和线性代数

原创概率与贝叶斯先验

原创机器学习与数学分析

原创球员能力图和股票K线图

原创 plt注释文字，美化及实战

原创 plt6种基本图形及基础

原创 Pandas后续

原创 pandas快速入门

原创 Pandas

原创数据科学包1

原创第八章

原创第七章

原创第六章

原创第五章

原创第四章

原创第三章

原创第二章

原创 python基础，python解释器，python开发环境，IDLE，pycharm，turtle模块绘制图像

空空如也

空空如也