2 岳小刀

尚未进行身份认证

暂无相关简介

等级
TA的排名 38w+

《统计学习方法》算法学习笔记五 之 逻辑斯谛回归与最大熵模型

逻辑斯谛回归与最大熵模型总述逻辑斯谛回归是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型。逻辑斯谛回归与最大熵模型都属于对数模型。逻辑斯谛回归模型...

2020-01-08 22:33:04

《统计学习方法》算法学习笔记(四)之 决策树(下)

决策树CART算法CART是在给定输入随机变量XXX条件下输出随机变量YYY的条件概率分布的学习方法。CART假设决策树是二叉树,内部节点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。CART算法由以下...

2020-01-05 09:35:34

《统计学习方法》算法学习笔记(四)之 决策树(中)

决策树3 决策树的生成3.1 ID3算法ID3算法的核心是在决策树各个节点上应用信息增益准则选择特征,递归地构建决策树。具体算法是:从根结点开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子结点;再对子结点递归调用以上方法,构建决策树,直到所有特征的信息增益均很小或没有特征可以选择为止。ID3相当于用极大似然法进行概率模型的选择。算法:...

2020-01-02 17:06:24

《统计学习方法》算法学习笔记(四)之 决策树(上)

感知机总述决策树是一种基本的分类与回归方法,本节主要讨论用于分类的决策树。决策树呈树状结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树。预测时,对新的数据,利用决策树模型进行分类。决策树通常包含3个步骤:...

2020-01-02 08:03:31

《统计学习方法》学习笔记(三)之 朴素贝叶斯法

朴素贝叶斯法总述朴素贝叶斯法是基于贝叶斯定理与特征条件独立性假设的分类方法。对于给定的训练数据集,首先基于特征独立性假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入xxx,利用贝叶斯定理求出后验概率最大的输出yyy。朴素贝叶斯法实际上学到了生成数据的机制,属于生成模型。1 朴素贝叶斯法的学习与分类1.1 基本方法设输入空间xxx包含于RnR^nRn为nnn维向量的集合,输出...

2019-12-31 10:50:25

《统计学习方法》算法学习笔记(二)之 K近邻法

K近邻法总述kkk近邻法(kkk-nearest neighbor,kkk-NN)是一种基于分类与回归的方法,本节只讨论分类问题中的kkk近邻法。kkk近邻法的输入为实例的特征向量,对应于特征空间中的点;输出为实例的类别,可以取多类。kkk近邻法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其kkk个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,kkk近邻法不...

2019-12-30 11:18:03

《统计学习方法》算法学习笔记(一)之感知机

感知机总述感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行线性化分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数极小化,求得感知机模型。感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用...

2019-12-30 08:38:53

anaconda创建虚拟环境安装不同深度学习框架

anaconda创建虚拟环境安装不同深度学习框架说在前面的话一 使用anaconda创建虚拟环境二 修改下载源三 在虚拟环境中安装cuda和cudnn四 在虚拟环境中安装TensorFlow和Keras五 在虚拟环境中安装PyTorch六 配置环境常用命令最近带一个学弟做毕设,深度学习方向,需要安装TensorFlow、PyTorch等深度学习框架。想当初自己是新手的时候可没少被配环境、安装深度...

2019-12-26 18:23:19

“ 异常检测 ” 研究方向文章

**异常检测综述性文章**https://github.com/zhuyiche/awesome-anomaly-detectionhttps://github.com/kc-ml2/journal-club/blob/ceaa45c5822f55d8060afdab907280d3e47b9288/past/2019-06-12-anomaly-detection.md...

2019-09-03 23:20:56

基于单类分类的异常检测小例子

基于单类分类的异常检测小例子主要内容代码主要是基于单类分类的方法做异常检测,采用简单的One Class SVM(单分类SVM) 和 IsolationForest(孤立森林) 两种方法进行异常检测,采用GAN的对抗训练过程提取数据的特征,将特征送入One Class SVM和IsolationForest中进行单类学习。One Class SVM和IsolationForest均使用skle...

2019-09-03 16:57:43

主成分分析(PCA)

主成分分析(PCA)内容提要内容提要本文主要是整理了几个个人觉得浅显易懂的介绍PCA原理、作用及python实现的博客,先作为笔记记下,日后将整理成一份完整的文本。https://blog.csdn.net/Reticent_Man/article/details/82633214https://blog.csdn.net/u012102306/article/details/522947...

2019-08-26 15:19:11

自动编码器重建图像及Python实现

自动编码器简介自动编码器(一下简称AE)属于生成模型的一种,目前主流的生成模型有AE及其变种和生成对抗网络(GANs)及其变种。随着深度学习的出现,AE可以通过网络层堆叠形成深度自动编码器来实现数据降维。通过编码过程减少隐藏层中的单元数量,可以以分层的方式实现降维,在更深的隐藏层中获得更高级的特征,从而在解码过程中更好的重建数据。自动编码器原理自动编码器是通过无监督学习训练的神经网络,实际上...

2019-03-14 18:54:32
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。