自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 机器学习-贝叶斯新闻分类

贝叶斯新闻分类前期数据处理主要用到结巴分词和LDA 建模代码如下#!/usr/bin/env python# coding: utf-8# In[1]:import pandas as pdimport numpy as npimport jieba#pip install jieba# ### 数据源:http://www.sogou.com/labs/resource/ca.php #### In[2]:df_news = pd.read_table('./dat

2020-08-02 20:34:12 164

原创 机器学习-贝叶斯简介

贝叶斯简介提出问题贝叶斯公式这里主要是统计学的知识提出问题正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测贝叶斯公式...

2020-08-02 20:25:37 138

原创 机器学习-决策树泰坦尼克船员获救

决策树泰坦尼克船员获救决策测泰坦尼克船员获救数据分析,包含决策树和逻辑回归集成算法代码如下:#!/usr/bin/env python# coding: utf-8# In[3]:import pandas #ipython notebooktitanic = pandas.read_csv("titanic_train.csv")titanic.head(5)print (titanic.describe())# # 缺失值填充# In[4]:titanic["Ag

2020-08-02 20:17:14 149

原创 机器学习-决策树简介

决策树简介树模型树的组成如何切分特征(选择节点)决策树算法连续值处理剪枝策略集成算法树模型决策树:从根节点开始一步步走到叶子节点(决策),所有的数据最终都会落到叶子节点,既可以做分类也可以做回归树的组成如何切分特征(选择节点)通过熵值衡量决策树算法连续值处理剪枝策略为什么要剪枝:决策树过拟合风险很大,理论上可以完全分得开数据(想象一下,如果树足够庞大,每个叶子节点不就一个数据了嘛)剪枝策略:预剪枝,后剪枝预剪枝:边建立决策树边进行剪枝的操作(更实用)限制深度,叶子节点个数

2020-07-31 00:05:31 110

原创 机器学习-逻辑回归信用卡欺诈案例

使用 标准化 上采样 下采样 对数据预处理,使用交叉验证,正则惩罚调试训练模型,混淆矩阵分析结果

2020-07-29 17:41:27 358

原创 机器学习-梯度下降求解逻辑回归

梯度下降求解逻辑回归代码实现

2020-07-28 23:10:49 245

原创 机器学习-梯度下降简介

梯度下降定义梯度下降简介引入常规方法优化学习率梯度下降分类梯度下降简介引入当我们得到了一个目标函数后,如何进行求解?直接求解?(并不一定可解,线性回归可以当做是一个特例)常规方法机器学习的套路就是我交给机器一堆数据,然后告诉它什么样的学习方式是对的(目标函数),然后让它朝着这个方向去做优化一口吃不成个胖子,我们要静悄悄的一步步的完成迭代(每次优化一点点,累积起来就是个大成绩了)学习率梯度下降分类...

2020-07-28 21:39:23 64

原创 机器学习回归算法-逻辑回归

回归算法-逻辑回归经典的二分类算法Sigmoid 函数带入参数引入似然函数求偏导经典的二分类算法虽然叫回归但是经典的二分类算法Sigmoid 函数二分算法源于该函数带入参数引入似然函数求偏导...

2020-07-28 16:41:37 112

原创 机器学习回归算法-线性回归

回归算法-线性回归提出问题引入数学误差高斯分布两式合并似然函数最小二乘法求偏导提出问题数据:工资和年龄(2个特征)目标:预测银行会贷款给我多少钱(标签)考虑:工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢?工资年龄额度400025200008000307000050002835000引入数学X1,X2就是我们的两个特征(年龄,工资)Y是银行最终会借给我们多少钱目标:找到最合适的一条线(想象一个高维)来最好的拟合我们的数据点

2020-07-28 16:40:32 97

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除