自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 集成算法Ensemble Method

Adaboost是一种迭代算法,通过构造多个多个若分类器,然后把这些弱分类器集合起来构成一个更强的最终分类器。Adaboost提供的是一种框架。它可以使用各种来构造弱分类器,比如使用单决策树作为若分类器。...

2020-04-10 00:02:46 255

原创 朴素贝叶斯算法

朴素贝叶斯是一种生成式的分类算法,可通过先验概率和数据得到后验概率。而KNN、决策树、逻辑回归、支持向量机等都是判别式算法。贝叶斯公式:朴素贝叶斯分类模型:假设有m个样本,每个样本有n个特征,输出类别有k类,定义为C1、C2、、、Ck【训练集】。给定一个样本X,判断其输出类别Y属于C1、C2、、、Ck中的哪一类:其中:以上计算出对大概率对应的类别Ck即为给定样本的类别。在判...

2020-04-06 00:06:49 424

原创 决策树Decision Tree

决策树是一种有监督机器学习算法,可用于解决分类/回归问题,主要用于分类。决策树的算法主要有ID3算法、C4.5、CART三种。这些算法都是为了找到最合适的特征作为分裂属性,不断迭代直到找到整个决策树。ID3算法:信息增益最大化。用信息增益来判断当前节点应该选用哪个特征来构建决策树,信息增益越大,越适合用来分类。熵代表了事件的不确定性,熵越大,不确定性越大。随机变量X的熵表示为:表示X的...

2020-03-30 22:52:58 236

原创 K临近算法(KNN)

KNN是分类算法中最最简单的算法之一,它没有显式的学习过程,即没有训练阶段。如果要得到某一个新样本所属类别,只需要找到与它距离最近的K个点,这K个点中大多数属于哪一个类别,则这个样本也属于这个类别。以下是一个常见的例子:要判断绿色的点属于哪一类,假设K=3,找到与该点最近的三个点,这三个点中红色三角形的个数比蓝色正方形个数多,因此绿色点就与红色三角形同一类,K=5时分析同理,我们发现K不同时分类结...

2020-03-29 17:24:05 285

原创 SVM支持向量机

支持向量机是一种二分类模型。其基本模型是定义在特征空间上的间隔最大线性分类器,SVM的学习策略就是间隔最大化,可化为一个求解凸二次规划的问题。SVM解决非线性分类问题时,matlab实例:SVM使用matlab自带函数分类:SVM使用工具箱分类:SVM回归:clear;clc;format compact;%使用工具箱进行二维函数曲线拟合...

2020-03-27 21:01:24 173

原创 逻辑回归算法

逻辑回归十用于分类的算法,损失函数等参数、公式表达见:吴恩达机器学习总结from sklearn.linear_model import LogisticRegressionX_train=np.array([0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,2.75,3.00,3.25,3.5,4.00,4.25,4.50,4.75,5...

2020-03-26 13:44:15 143

原创 线性回归算法

线性回归一般用于做预测,损失函数、梯度下降等相关知识见:吴恩达机器学习总结python代码:#使用LinearRegression进行线性回归#房价预测import pandas as pdfrom io import StringIOfrom sklearn import linear_modelimport matplotlib.pyplot as plt# csv_d...

2020-03-25 11:40:06 293

原创 最大期望算法(EM)

最大期望算法是一种迭代算法,用于含有隐变量的概率参数模型的最大似然估计或极大后验概率估计。最大期望算法实现步骤:初始化分布参数;计算期望(E步,求Q函数):利用当前估计得参数值计算隐变量的后验概率(即隐变量的期望);最大化Q函数(M步):求Q函数获得极大值时的参数;新得到的参数重新用于E步,直到收敛。python实现:#EM算法用于求解含有隐变量的概率参数模型的最大似然估...

2020-03-21 17:11:04 635

原创 聚类算法

聚类方法主要分为四种:基于划分的聚类、基于层次的聚类、基于密度的聚类、基于网格的聚类。其中基于层次的聚类又分为凝聚式层次聚类和分裂式层次聚类,凝聚式层次聚类就是在初始阶段将每一个点都视为一个簇,之后每一次合并两个最接近的簇;分裂式层次聚类就是在初始阶段将所有的点视为一个簇,之后每次分裂出一个簇,直到最后剩下单个点的簇为止。常见的聚类算法有:K-means 聚类算法;Mean-Shift (均值...

2020-03-18 17:08:27 668

原创 吴恩达机器学习总结

目录一、初识机器学习一、初识机器学习机器学习应用:数据挖掘、垃圾邮件识别、自然语言处理、手写数字识别、图像识别等。机器学习的定义:计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P。通过测定P在T上的变现因E而提高。机器学习算法:监督学习(教会计算机学习);无监督学习(让计算机自己学习);强化学习;推荐系统等。回归用于预测连续值输出;分类用于预测离散值输出。...

2020-03-07 17:28:37 478

原创 Dijkstra(迪克斯特拉)最短路径算法

目录一、线性规划二、最小二乘法三、主成分分析PCA四、层次分析法AHP五、Dijkstra最短路径算法六、聚类七、神经网络一、线性规划二、最小二乘法三、主成分分析PCA四、层次分析法AHP五、Dijkstra最短路径算法六、聚类七、神经网络...

2020-03-07 17:09:18 1820 1

原创 神经网络

一、BP神经网络BP算法(即反向传播算法)是在有导师指导下,适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系:一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。其缺点为收敛速度慢,容易陷入局部最...

2020-03-07 17:07:11 1780 1

原创 图像分割(python)

1、图像自动阈值分割(skimage库)from skimage import data,filtersimport matplotlib.pyplot as pltimage=data.camera()thresh=filters.threshold_otsu(image)# print(thresh)dst=(image>=thresh)*1.0plt.figure("...

2020-03-05 21:39:10 4694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除