4 xiao韩

尚未进行身份认证

暂无相关简介

等级
TA的排名 11w+

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(六)--集成学习_FM/GBDT/Xgboost

一、随机森林/FM(RandomForst)随机森林是集成学习Bagging流派中一个变体,RF在以决策树为基学习构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性选择。传统的决策树在选择划分属性时是在当前节点的属性集合中选择最优的一个;而在RF中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分。...

2019-10-03 15:16:09

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(五)--集成学习_提升方法

一、集成学习概论集成学习(Ensemblelearning)通过构建并结合多个学习器来完成学习任务,实际上,就是“三个臭皮匠顶个诸葛亮”的道理。集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化能力。这对“弱学习器(weaklearner)”尤为明显,因此集成学习的很多理论研究都是针对弱学习器进行的,而基学习器有时也被称为弱学习器。一般根据弱学习器有无依赖关系,大...

2019-09-18 09:32:25

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(四)--决策树(Decison-Tree)

一、决策树的概论决策树是一种基本的分类与回归方法,是表示基于特征对示例进行分类与回归的树形结构。决策树可以转换成一个if-then规则的集合,也可以看作是定义在特征空间划分上的类的条件概率分布。一般的,一颗决策树包含一个根结点,若干个内部节点和若干个叶结点,每个叶结点对应于决策结果,其他的每个结点则对应于一个属性测试,生成决策树的基本流程遵循‘分而治之’策略。具体算法如下:输入:训练集...

2019-08-31 13:55:45

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(三)--贝叶斯分类器(Bayes)

一、贝叶斯概论假设有N种可能的类别标记,即,是将一个真实的的样本误分类成所产生的损失。在后验概率的基础上可得到将样本x分类成的期望损失(条件风险):需要寻找到一个准则,使得所有样本对每个分类产生的条件风险最小,显然,对每个样本x能最小化条件风险即可,因此就有贝叶斯判定准则(Bayesdecisionrule):为最小化总体条件风险,只需要在每个样本上选择能使条件风险最小,即,此时则...

2019-07-22 11:09:29

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(二)--线性模型(Linear model)

一、线性回归(Linearregression)线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记,用公式表达为:,使得。那么怎么求得w,b呢?基本使用最小二乘法和梯度下降。最小二乘法:最小化均方差函数(本连载一中有相关解释)。 梯度下降:是一种迭代算法。选取适当的初值,不断迭代,更新参数值,进行目标函数的极小化,直到收敛。由于负梯度方向是使函数值下降最快的方向,在迭代的每一步...

2019-07-16 15:56:16

《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(一)--模型选择+误差评估

一、模型选择1.1模型模型就是学习的条件概率分布或者决策函数(这里只指监督学习)。条件概率的集合:,决策函数的集合:。条件概率表示的模型为概率模型,决策函数表示的模型为非概率模型。1.2模型选择模型选择基本是选择一个模型评估指标(均方差、准确率、F1等)同时考虑欠拟合(在训练集上表现不好-为将训练样本的一般性质学好)和过拟合(在训练集和测试集上表现有很大差异-将训练集上的性质学...

2019-07-11 11:01:01

安装Windows10与linux(ubuntu18.04)双系统出现的 无法将 grub-efi 软件包安装到/target/中,如果没有 GRUB 启动引导期,所安装的系统无法启动。”

先是安装好了windows10,从原先的硬盘中分出了100G的空间来安装ubuntu18.04,出现了题中的问题。看了很多帖子,找到了解决方法:1、先在原先的win10系统上,下载分区助手(https://www.disktool.cn/)如果是MBR(最多只能由4个主分区)格式,建议用分区助手将此磁盘的MBR格式转换为GPT(可以有多个主分区-有利于ubuntu系统的分区)格式(因为...

2019-07-01 17:21:26

数据结构与算法导论(C++)连载(九)--排序算法

本文代码实现了六种较为基础的排序算法(冒泡、插入、希尔、堆、归并、快速)。一、最小堆的建立(堆排序中要用到)在MinHeap.h中:#include"iostream"usingnamespacestd;#defineElenmentTypeinttypedefstructHeapStruct*MinHeap;structHeapStruct{ Ele...

2019-05-08 16:13:35

数据结构与算法导论(C++)连载(八)--图(邻接矩阵存储和链式邻接表存储)

图-表示多对多的关系,一组顶点V(一个非空有限顶点集合),一组边E(一个有限边集合),边上有权重称为网络。用邻接矩阵(稠密图)或者邻接表(稀疏图)表示一个图。一、邻接矩阵表示:在Graph_M.h中:#include"iostream"usingnamespacestd;/******************邻接矩阵表示图*************************...

2019-05-06 15:04:28

数据结构与算法导论(C++)连载(七)--最大堆和哈夫曼编码

下面主要编码实现关于树结构的两种应用-最大堆和哈夫曼编码。一、最大堆:根结点是整棵树的最大值的完全二叉树,这种结构在排序等功能中应用的比较广,类似的结构有最小堆。在MaxHeap.h:#include"iostream"#defineElementTypeintusingnamespacestd;classMaxHeap{public: MaxHeap();...

2019-04-27 14:48:17

数据结构与算法导论(C++)连载(六)--二叉搜索树

二叉搜索树-非空左子树小于根结点键值,非空右子树大于根结点键值,左右子树均为二叉搜索树。一、二叉搜索树基本实现新建一个类BinSeachTree,在BinSeachTree.h中:#include"iostream"usingnamespacestd;#defineElementTypeint#defineSearchTreeTreeNode*#defineP...

2019-04-25 10:41:46

数据结构与算法导论(C++)连载(五)--二叉树

二叉树是每个结点最多有两个子树的树结构。遍历有先序/中序/后序三种基本的方式。新建一个类BinTree。在BinTree.h中:#include"iostream"usingnamespacestd;#defineElementTypecharclassTreeNode{public: ElementTypeData; TreeNode*Left; ...

2019-04-24 10:27:11

数据结构与算法导论(C++)连载(四)--堆栈(顺序存储和链式存储)

堆栈是一种特殊的线性表,因此也可以分为顺序存储和链式存储。队列最突出的特点是先进后出。一、顺序存储新建一个类Stack,在Stack.h中:usingnamespacestd;#defineElementTypeint#defineMaxsize1024classStack{public: Stack(); ~Stack(); voidPush(...

2019-04-23 11:20:43

数据结构与算法导论(C++)连载(三)--队列(顺序存储和链式存储)

队列是一种特殊的线性表,因此也可以分为顺序存储和链式存储。队列最突出的特点是先进先出。一、顺序存储新建一个类Queue,在Queue.h中:#include"iostream"usingnamespacestd;#defineMaxSize1024#defineElementTypeint//顺序存储classQueue{public: Queue...

2019-04-22 11:13:44

数据结构与算法导论(C++)连载(二)--线性表的链表存储(结构体实现和封装类实现)

线性表存储大概有两类,一个是顺序数组存储,另一个是指针链式存储。这里主要是采用C++编程实现链表存储,优点主要是占用空间小,灵活。一、普通结构体实现在xxx.h文件中:```#include"iostream"usingnamespacestd;typedefstructLNode*List;stru...

2019-04-21 18:19:11

数据结构与算法导论(C++)连载(一)--线性表的顺序存储(结构体实现和封装类实现)

线性表存储大概有两类,一个是顺序数组存储,另一个是指针链式存储。这里主要是采用C++编程实现顺序数组存储,优点主要是简单,易懂,操作容易。一、普通结构体实现在xxx.h文件中:```#include<iostream>usingnamespacestd;#defineMAXSIZE1024...

2019-04-20 18:32:06

UltraISO刻录ubuntu(乌班图)linux系统

1.首先在https://www.ubuntu.com/download/desktop下载自己需要的乌班图系统2.下载UltraISO刻录软件,并打开选择上面下载的系统。3.从启动中选择写入硬盘。4.在便捷启动中选择写入新的硬盘引入扇区再选择Syslinux确定。5.最后开始刻录到U盘了。...

2019-03-14 15:24:26

在linux上开发嘉楠耘智K210依赖库的问题

首先放出我IDE编译时出现的问题:[INFO]/home/wenhan/k210/KendryteIDE/LocalPackage/toolchain/bin/../libexec/gcc/riscv64-unknown-elf/8.2.0/cc1:errorwhileloadingsharedlibraries:libisl.so.19:cannotopenshared...

2019-03-14 10:42:03

TensorFlow与Inception-v3

Inception-v3Inception-v3模型是由Google公司在一台配有8TeslaK40GPUs,大概价值$30,000的野兽级计算机上训练了几个星期,因此不可能在一台普通的PC上训练。我们将会下载预训练好的Inception模型,然后用它来做图像分类。数据集如果自己没有数据集,可以在www.robots.ox.ac.uk/~vgg/data/上下载。代码...

2019-01-08 20:17:17

嘉楠耘智KD233AI开发板环境搭建

嘉楠耘智的团队在2018年研发出一款7nmAI芯片K210,搭载摄像头、LCD屏等制作出KD233开发板。首先准备好硬件:一块开发板,type-c接口的USB(先上一张图)资料的下载,因为是刚出的新芯片,大多资料都是一些官方手册嘉楠耘智K210:https://kendryte.com/downloads/嘉楠耘智K210官方论坛:https://forum.kendryte....

2019-01-03 20:18:55

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。