4 千寻千梦

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 2w+

机器学习-特征选择( Feature Selection )

特征选择

2017-07-25 08:48:36

Ubuntu 一些大数据挖掘与机器学习工具安装

UMlet UMLet是开源的UML建模工具。ubuntu下安装:sudo apt-get install umlet打开界面umlet

2017-06-26 09:35:04

Dropout

深度学习中的过拟合问题表现:在训练集上Loss和Accuracy都表现很好,而在测试集上一塌糊涂,训练模型基本上没有什么用处。 过拟合产生原因:处理的是样本量较小,而DNN超强的拟合能力,所以很容易造成过拟合的情况出现。【文献5】另外,比如在文本分类上,dropout效果提升有限,分析原因可能是Reuters-RCV1数据量足够大,过拟合并不是模型的主要问题【文献1】怎么判断是欠拟合还是过拟合?模

2017-06-02 11:26:13

离群点(孤立点、异常值)检测方法

本文介绍了离群点(孤立点)检测的常见方法,以及应用各种算法时需要注意的问题。离群点是什么?异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。孤立点是一个明显偏离与其他数据点的对象,它就像是由一个完全不同的机制生成的数据点一样。离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更

2017-06-01 09:49:45

Spark Structured Streaming、Kafak整合

欢迎使用Markdown编辑器写博客SBT 依赖包: groupId = org.apache.spark artifactId = spark-sql-kafka-0-10_2.11 version = 2.1.1在Spark2.x中,Spark Streaming获得了比较全面的升级,称为Structured Streaming,和之前的很不同,功能更强大,效率更高,跟其他的

2017-05-26 13:56:49

深度学习系列:GoogLeNet系列解读 [转发]

GoogLeNet系列解读[转发]http://blog.csdn.net/shuzfan/article/details/50738394

2017-03-16 09:30:32

OpenCV图像处理-光流法-原理分析1-calcOpticalFlowFarneback

关于光流法全面的介绍和OpenCV代码,请参考:zouxy09的专栏 http://blog.csdn.net/zouxy09/article/details/8683859 本文和后续文章仅对光流法的原理进行补充。与上述参考文章里面已经介绍的内容不会重复。OpenCV中calcOpticalFlowFarnebackcv::calcOpticalFlowFarneback(prevgray,

2016-11-28 19:32:48

OpenCV图像处理-区域分割-形态学操作应用

分割的结果中通常包含不想要的干扰,如我们感兴趣的物体被干扰了,如由于反射对分割结果造成的干扰,这时,形态学操作提供了特别有用的方法,让我们调整和描述物体的形状。       本文聚焦形态学操作的若干典型应用,不会对形态学操作的基本数学理论进行系统的阐述,也不会对OpenCV函数进行详细的介绍,因此需要您首先对形态学的基本理论有所了解。 【1】利用膨胀操作提取物体的边界 从一个彩色红苹果图像,经

2016-11-24 14:38:30

TensorFlow学习笔记

Tensor 学习完整笔记

2016-11-06 12:16:53

支持向量机学习之2:核函数

SVM核函数通俗理解

2016-10-22 22:53:54

支持向量机学习之3-SVR(回归)

支持向量机系列学习笔记包括以下几篇: Spark机器学习系列之13: 支持向量机SVM :http://blog.csdn.net/qq_34531825/article/details/52881804 支持向量机学习之2:核函数http://blog.csdn.net/qq_34531825/article/details/52895621 支持向量机学习之3:SVR(回归)http:/

2016-10-22 13:25:45

Spark机器学习系列之13: 支持向量机SVM

SVM 理论 spark scikit

2016-10-21 13:07:25

最优化问题学习笔记1-对偶理论

什么是对偶问题?       每一个线性规划问题都存在一个与其对偶的问题,在求出一个问题解的同时,也给出了另一个问题的解。 为什么研究对偶理论?       当对偶问题比原始问题有较少约束时,求解对偶规划比求解原始规划要方便得多。       一个简单的例子 在上面的例子中,g(λ,ν)g(\lambda,\nu)定义为拉格朗日对偶函数,向量向量 λ 和 ν 为对偶变量或者拉格朗日乘子

2016-10-20 16:23:13

机器学习与自然语言处理模型之一:最大熵模型

参考文献(1)http://blog.csdn.net/itplus/article/details/26550201 系列文章,系统全面 (2)http://www.fuqingchuan.com/2015/03/714.html 非常好的例子(机器翻译) (3)http://blog.csdn.net/v_july_v/article/details/40508465?utm_source

2016-10-20 11:32:09

机器学习算法(优化)之二:期望最大化(EM)算法

本文是我的一个学习笔记,错误和纰漏之处,敬请批评指正。EM算法概述      ~~~~~~(1)数学之美的作者吴军将EM算法称之为上帝的算法,EM算法也是大家公认的机器学习十大经典算法之一。EM是一种专门用于求解参数极大似然估计的迭代算法,具有良好的收敛性和每次迭代都能使似然函数值单调不减的优良性质。在统计机器学习、自然语言处理等领域应用非常广泛,许多统计学算法都是EM算法的体现,比如说隐含马尔科夫

2016-10-19 10:18:36

Mahout机器学习系列之-模糊c-均值聚类和狄利克雷过程聚类

模糊c-均值聚类(FCM)     ~~~~~模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM)。在众多模糊聚类算法中,模糊C-均值( FCM) 算法应用最广泛且较成功。      ~~~~~详细数学公式推到及迭代过程可参考http://blog.csdn.net/yueyedeai/article/details/26713015      ~~

2016-10-15 16:09:19

常用的概率分布及其相互之间的联系与区别

二项式分布二项实验:结果为0,1的集合,比如说美国大选,假设只有两名候选人的情况且不可以弃权的情况下,选特朗普为1,选希拉里为0。再比如说种子的发芽率实验,发芽为1,不发芽为0。 定义: (1)整个实验由n次相同的实验组成。 (2)结果非0即1 (3)在一次实验中成功的概率为π\pi,且在不同的单次实验中保持不变 (4)各次实验为独立实验 (5)随机变量kk是在nn次实验中观测到的成功的

2016-10-10 09:42:43

Spark2.0机器学习系列之12: 线性回归及L1、L2正则化区别与稀疏解

我的博客中参考了大量的文章或者别的作者的博客,有时候疏忽了并未一一标注,本着分享交流知识的目的,如果侵犯您的权利,这并非我的本意,如果您提出来,我会及时改正。概述      线性回归拟合一个因变量与一个自变量之间的线性关系y=f(x)y=f(x)。       Spark中实现了:       (1)普通最小二乘法       (2)岭回归(L2正规化)       (3)Lasso(L1正

2016-09-28 15:38:44

Spark2.0机器学习系列之11: 聚类(幂迭代聚类, power iteration clustering, PIC)

幂迭代聚类, power iteration clustering, PIC 原理简介 Spark 代码 参数设置

2016-09-26 22:33:46

Spark2.0机器学习系列之10: 聚类(高斯混合模型 GMM)

Spark GMM 高斯混合模型概念 参数设置 模型评估 代码

2016-09-25 18:46:55

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 分享学徒
    分享学徒
    成功上传1个资源即可获取