3 fre0sty

尚未进行身份认证

暂无相关简介

等级
TA的排名 36w+

机器学习入门算法及其java实现-adaboost算法

算法原理:算法基本原理:\quad\quad就一个训练样本集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)要容易的多,提升方法就是从弱学习算法出发,反复学习,得到一系列弱分类器(又称为基本分类器),然后组合这些弱分类器,构成一个强分类器。 \quad\quadAdaBoost采取加权多数表决的方法,具体地,加大分类误差率小的弱分类器的权值,使其在表决中其较大的作用,减小误差率大

2017-10-18 16:50:09

机器学习入门算法及其java实现-Apriori(文本关联性)算法

算法原理:基本概念介绍:支持度: 对于事件A→BA\to B的支持度 support=P(AB)support=P(AB)置信度: 置信度confidence=P(B|A)=P(AB)/P(A)confidence=P(B|A)=P(AB)/P(A); 3、强关联规则: 如果存在一条关联规则,它的支持度和置信度都大于预先定义好的最小支持度与置信度,我们就称它为强关联规则。强关联规则就可以

2017-10-18 16:09:15

机器学习入门算法及其java实现-EM(Expectation Maxium)算法

EM算法

2017-10-18 15:54:26

机器学习入门算法及其java实现-ID3(决策树)算法

\quad\quadID3决策树也是决策树的一种,其作用在于根据已有数据训练决策树,并通过决策树的分支实现对新数据的分类,是一种有监督的学习。 \quad\quad在生成决策树的过程中,ID3使用的信息熵增益对子节点类别进行确定。根据信息熵越是有序的数据熵值越低,信息熵增益越大表示当前属性对于数据的分类结果越好。 信息熵计算公式:Info=−∑i=1nP(xi)∗log2P(xi)Info=-\

2017-10-18 13:08:39

机器学习入门算法及其java实现-Kmeans(K均值)算法

1、算法基本原理:对于K个类别的数据选取K个质心距离第 个质心最近的点归为 类2、算法具体步骤: - 选取K个随机点,将其标注为K个类别 - 计算样本点到这K个随机点的距离,根据距离最近的第i个点将其分类i类 - 根据分类的结果,计算新的质心,质心计算公式如下:xinew=1n∑j=1nxjx_{new}^{i}=\frac{1}{n}\sum_{j=1}^{n}x_{j} -

2017-10-18 10:46:24

机器学习入门算法及其java实现-KNN算法

1、算法基本原理:对于一个新点X0(x0,y0)X_{0}(x_{0},y_{0}),它的分类y0y_{0}由离它最近的k个点的类别决定;其中训练集为T{(x1,y1),(x2,y2),...,(xn,yn)}T\{(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{n},y_{n})\},离X0(x0,y0)X_{0}(x_{0},y_{0})最近的K个点根据分类决策规则(

2017-10-17 21:23:48

机器学习入门算法及其java实现-朴素贝叶斯

\quad\quad贝叶斯决策论是在所有相关概率都已知的理想情形下,基于这些概率和误判损失来选择最优的类别标记。 \quad\quad假设有N中可能的类别标记,即y={c1,c2,...,cN}y=\{c_{1},c_{2},...,c_{N}\} ,λij\lambda_{ij}是将一个真实标记为cjc_{j}的样本误分类为cic_{i} 的样本误分类为所产生的损失。基于后验概率p(ci|x)p

2017-10-17 20:28:49
勋章 我的勋章
    暂无奖章