1 Mr_health

尚未进行身份认证

暂无相关简介

等级
TA的排名 4w+

ROC曲线和P-R曲线选择

P-R曲线P-R曲线刻画查准率和查全率之间的关系,其纵轴为查准率,横轴为查全率。查准率指的是在所有预测为正例的数据中,真正例所占的比例,公式如下:例。查全率是指预测为真正例的数据占所有正例数据的比:查准率和查全率是一对矛盾的度量,一般来说,precision高时,recall往往偏低,recall高时,precision往往偏低。可以这么理解,我们通过降低判断为TP的阈值t...

2019-07-20 16:43:28

PCA原理

向量的表示及基变换既然我们面对的数据被抽象为一组向量,那么下面有必要研究一些向量的数学性质。而这些数学性质将成为后续导出PCA的理论基础。内积与投影下面先来看一个高中就学过的向量运算:内积。两个维数相同的向量的内积被定义为:内积运算将两个向量映射为一个实数。其计算方式非常容易理解,但是其意义并不明显。下面我们分析内积的几何意义。假设A和B是两个n维向量,我们知道n维向量可以等价...

2019-07-16 13:41:14

随机森林原理

目录1.介绍2.特征选择2.1袋外错误率(ooberror)2.2特征重要性2.3特征选择3.优缺点3.1优点3.2缺点1.介绍随机森林(RandomForest,RF)是典型的bagging算法,顾名思义,森林就是由多个决策树构成的算法,其基学习器为CART决策树(换句话说,其实我们只是将使用CART决策树作为弱学习器的Bagging...

2019-07-13 15:49:42

L1和L2正则化

目录1.从梯度下降的角度理解1.1L1正则化-梯度下降理解1.2L2正则化-梯度下降理解2.从先验概率的角度理解1.1L2正则化-先验概率理解2.2L1正则化-先验概率理解3.L1和L2的稀疏性分析4.L1和L2正则化的联系与区别1.从梯度下降的角度理解1.1L1正则化-梯度下降理解在原始的代价函数后面加上一个L1正则化项,即所有权重w的绝对值...

2019-07-11 21:09:30

【深度学习】批归一化(Batch Normalization)

参考:深度学习归一化BN是由Google于2015年提出,这是一个深度神经网络训练的技巧,它不仅可以加快了模型的收敛速度,而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题,从而使得训练深层网络模型更加容易和稳定。所以目前BN已经成为几乎所有卷积神经网络的标配技巧了。我们为什么需要BN?神经网络学习过程本质就是为了学习数据分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能...

2019-07-08 10:04:49

决策树

目录1、简介2、分类决策树构建2.1.特征选择信息熵信息增益增益率基尼指数2.2.决策树生成ID3C4.52.3.剪枝3、回归决策树的构建一个简单的例子1、简介决策树分为分类决策树和回归决策树,前者可用于处理离散型数据,后者可用于处理连续型数据。分类决策树的代表方法为:ID3算法:以信息增益为准则来生成树 C4.5算法:...

2019-06-30 21:17:44

提升树(boosting tree)

转载于:GBDT原理详解统计学习方法--提升树模型(BoostingTree)与梯度提升树(GBDT)提升树算法以决策树为基函数的提升方法为提升树,对分类问题决策树是二叉分类树,回归问题就是二叉回归树。(可以看出,决策树本来就可以用预分类或者是回归)提升树模型为加法模型,采用前向分步算法训练。所谓加法模型就是强分类器可以由多个弱分类器线性相加,...

2019-06-30 17:02:22

k-mean聚类获取anchor的先验大小

方法1:欧式距离#!/usr/bin/envpython#-*-coding:utf8-*-importsysfromxml.etreeimportElementTreefromxml.etree.ElementTreeimportElement,SubElementfromlxmlimportetreeimportnumpyasnpimp...

2019-06-29 22:23:58

极大似然估计

来源:极大似然估计理解与应用极大似然估计写的太好了极大似然估计目录0.引言1.什么是极大似然估计2.极大似然原理及数学表示3.极大似然估计法(MaximumLikelihoodEstimation,MLE)4.极大似然估计法求估计值的步骤5.例题0.引言整个机器学习问题的求解其实就是在确...

2019-06-28 13:14:23

数据结构(一):树遍历顺序的求解

2019-06-27 14:51:46

集成学习(二):adaboost算法

参考AdaBoost原理详解Adaboost算法介绍(针对算法面试)手把手教你实现一个AdaBoost机器学习笔记:AdaBoost公式推导目录1.AdaBoost原理1.1训练当前迭代最优弱分类器1.2计算最优弱分类器的权重1.3根据错误率更新样本权重2.公式推导2.1α和的推导2.2权重更新公式相关面试题1.AdaBoost原理...

2019-06-27 13:53:02

集成学习(一):bagging和boosting算法及对比

转载于:bagging和boosting算法(集成学习算法)Bagging算法和Boosting区别和联系机器学习笔记-集成学习之Bagging,Boosting,随机森林三者特性对比前言集成学习定义:集成学习通过构建并结合多个学习器来完成学习任务。分类:只包含同种类型的个体学习器,这样的集成是“同质”的,例如都...

2019-06-20 21:23:19

机器学习(一):数据归一化与标准化

转载:https://www.jianshu.com/p/3761bad01053一.为什么要数据归一化和标准化对于大多数的机器学习算法和优化算法来说,将特征值缩放到相同区间可以使得获取性能更好的模型。就梯度下降算法而言,例如有两个不同的特征,第一个特征的取值范围为1-10,第二个特征的取值范围为1-10000。在梯度下降算法中,代价函数为最小平方误差函数,所以在使用梯度下降算法的时候,算...

2019-06-20 10:39:49

常见的损失函数

1.损失函数、代价函数与目标函数损失函数(LossFunction):是定义在单个样本上的,是指一个样本的误差。 代价函数(CostFunction):是定义在整个训练集上的,是所有样本误差的平均,也就是所有损失函数值的平均。 目标函数(ObjectFunction):是指最终需要优化的函数,一般来说是经验风险+结构风险,也就是(代价函数+正则化项)。从学习任务的类型出发,可以从...

2019-06-18 23:52:30

ubuntu python2.7安装gdal

直接pipinstallGDAL不行sudoapt-getupdatesudoapt-getinstallgdal-binsudoapt-get-yinstallpython-gdal

2019-06-04 10:12:24

在anaconda创建环境中安装spyder出现的相关问题解决

问题1安装spyder后创建的python环境改变(1)描述最近安装了anacon创建了python=3.5的环境,但是每次通过anacondanavigator安装spyder后,这个环境的python版本就变为最新的3.7,通过p也会出现同样的问题。但是我需要的版本是3.5。(2)解决办法原来都是通过cmd直接安装的,这次通过Anacondaprompt,输入命令:con...

2019-04-30 16:50:28

ubuntu下利用pyinstaller将tensorflow进行打包

项目中采用tensoflow进行目标检测,代码为https://github.com/yangxue0827/R-DFPN_FPN_Tensorflow因为我的ubuntu16.04原本配置有detectron,采用cuda8.0和cudnn6.0,因此在配置tensorflow并没有用1.2.0(需要cudnn5.1),而使用的是1.4.0,可以利用现有的cudnn6.0配置完毕后打包t...

2019-04-29 23:13:19

detectron voc_eval函数解析

voc_eval函数的输入defvoc_eval(detpath,annopath,imagesetfile,classname,cachedir,ovthresh=0.5,use_07_metric=False):根据...

2019-04-25 17:39:48

ubuntu16.04 python2 spyder中显示中文为\xe6\xa8\xa1\xe5\x9e\的解决

问题描述在在运行代码的过程中时常需要计算代码运行的时间,常采用的方法为importtimestart=time.time()....end=time.time()print('运行时间为:',end-start)这时候输出就为:('\xe6\xa8\xa1\xe5\x9e\x8b\xe8\xa3\x85\xe5\x9c\xa8\xe6\x97\xb6\xe9\x...

2019-04-23 11:09:32

ubuntu下安装tensorflow gpu出现错误

错误1:Cannotuninstall'html5lib'.Itisadistutilsinstalledprojectandthuswecannotaccuratelydeterminewhichfilesbelongtoitwhichwouldleadtoonlyapartialuninstall.错误的原因是tensorflow要求的...

2019-04-11 22:27:35

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。