10 一只鸟的天空

尚未进行身份认证

一个偏执狂,一个强迫症患者..... 微博地址: http://weibo.com/1765411302 欢迎数据挖掘与机器学习从业者一起交流

等级
TA的排名 4k+

梯度下降优化算法综述

梯度下降优化算法综述  该文翻译自Anoverviewofgradientdescentoptimizationalgorithms。  总所周知,梯度下降算法是机器学习中使用非常广泛的优化算法,也是众多机器学习算法中最常用的优化方法。几乎当前每一个先进的(state-of-the-art)机器学习库或者深度学习库都会包括梯度下降算法的不同变种实现。但是,它们就像一个黑盒优化器,很难

2016-09-09 00:21:27

机器学习中常见的损失函数

机器学习中常见的损失函数  一般来说,我们在进行机器学习任务时,使用的每一个算法都有一个目标函数,算法便是对这个目标函数进行优化,特别是在分类或者回归任务中,便是使用损失函数(LossFunction)作为其目标函数,又称为代价函数(CostFunction)。  损失函数是用来评价模型的预测值Ŷ =f(X)\hat{Y}=f(X)与真实值YY的不一致程度,它是一个非负实值函数。通常使

2016-09-07 19:16:56

Distributional Vector VS. Distributed Vector

Distributional Vector VS. Distributed Vector

2016-08-15 12:03:15

Network Representation 网络节点嵌入

Network Representation最近看了几篇网络节点embedding的论文,思想很新颖,很有趣,这里分享给大家。Network Representation可以翻译为网络(节点)表征、网络(节点)向量、网络(节点)嵌入等… Aim to learn distributed vector representation for each vertex in a network.

2016-08-10 21:21:07

服务器监控(包括性能指标与web应用程序)

服务器监控性能指标监控Linux性能指标Web服务器监控

2016-05-16 14:25:27

Linux下使用Apache的Httpd+Mod_jk+Tomcat搭建Web集群服务

Linux下使用Apache的Httpd+Mod_jk+Tomcat搭建Web集群服务。使用多个tomcat服务器来对请求进行分流,防止单个服务器压力过重。

2016-05-08 01:22:54

Eclipse的插件Maven打包

Eclipse插件Maven打包

2016-04-21 10:57:12

玩转个性化推荐-前言

玩转个性化推荐-前言   推荐,即推举,举荐,指把“好”的人或事物介绍给别人或组织,希望能够被接受或任用。其本意重点指人的推荐,古今中外,大抵如此。《汉书·王莽传上》说“收赡名士,交结将相卿大夫甚众。故在位者更推荐之”。杜甫的《送魏司直充岭南掌选崔郎中判官》诗有云“才美膺推荐,君行佐纪纲”。现如今申请海外留学,尤其是美国的学校,推荐信(recommend letter)是很重要的,一封好的推荐信能...

2016-04-19 13:40:51

玩转个性化推荐-前言

玩转个性化推荐-前言   推荐,即推举,举荐,指把“好”的人或事物介绍给别人或组织,希望能够被接受或任用。其本意重点指人的推荐,古今中外,大抵如此。《汉书·王莽传上》说“收赡名士,交结将相卿大夫甚众。故在位者更推荐之”。杜甫的《送魏司直充岭南掌选崔郎中判官》诗有云“才美膺推荐,君行佐纪纲”。现如今申请海外留学,尤其是美国的学校,推荐信(recommend letter)是很重要的,一封好的推荐信能...

2016-04-19 13:35:28

机器学习模型评价(Evaluating Machine Learning Models)-主要概念与陷阱

机器学习模型评价(EvaluatingMachineLearningModels)-主要概念与陷阱  本文主要解释一些关于机器学习模型评价的主要概念,与评价中可能会遇到的一些陷阱。如训练集-验证集二划分校验(Hold-outvalidation)、交叉校验(Cross-validation)、超参数调优(hyperparametertuning)等。这三个术语都是从不同的层

2015-10-31 22:46:59

神经网络Tips 和Tricks

神经网络Tips 和Tricks

2015-10-31 22:32:24

机器学习中防止过拟合的处理方法

在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化,并且可能当前的数据量过少,不足以对整个数据集进行分布估计,因此往往需要防止模型过拟合,提高模型泛化能力。

2015-10-26 20:58:12

在分类中如何处理训练集中不平衡问题

在分类中如何处理训练集中不平衡问题,在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别不平衡问题。

2015-10-25 23:09:39

循环神经网络(RNN, Recurrent Neural Networks)介绍

循环神经网络(RNN,RecurrentNeuralNetworks)介绍  这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/,在这篇文章中,加入了一些新的内容与一些自己的理解。  循环神经网络(RecurrentNeuralN

2015-09-23 13:24:09

当今世界最NB的25位大数据科学家

在大数据技术飞速发展的今天,谁才是我们大数据科研与工业界中最有威望的科学家呢?下面我们来进行梳理,共罗列了25位当今世界,无论是在学术与工业界都产生巨大影响的数据科学家(Data Scientists)。他(她)们推动了整个领域的发展,毫无疑问,无论是在学术界还是还工业界,他(她)们都是一座座山顶式的人物。他(她)们是我们这些从事大数据产业发展的榜样。

2015-09-20 16:57:14

算法&模型

在行业设备大数据平台建设中,势必要用到大数据技术,而大数据技术中,机器学习与数据挖掘算法是重要的一环,我们通过这些算法与模型对设备的故障进行监控与预测,对设备技改需求进行预测,对设备采购需求进行预测以及创建各种模型与算法设备标签。下面我们对一些常用的算法与模型进行简要介绍。   在进行数据挖掘时,首先要进行商业理解,即我们需要达到什么目的,解决什么问题;其次需要进行数据理解,我们需要哪些数据以及需

2015-09-16 15:23:38

前向型神经网络之BPNN(附源码)

神经网络静态神经网络BP算法前向型神经网络BPNN人工神经网络误差反向传播算法BackPropagation数据挖掘机器学习

2015-09-04 20:57:10

常见的机器学习与数据挖掘知识点之常见分布

概率分布数学分布常见分布

2015-08-25 20:12:31

常见的机器学习&数据挖掘知识点之Basis

常见的机器学习&数据挖掘知识点之BasisSSE(Sum of Squared Error, 平方误差和) SSE=∑i=1n(Xi−X⎯⎯⎯)2SSE=\sum_{i=1}^{n}(X_i-\overline{X})^2SAE(Sum of Absolute Error, 绝对误差和) SAE=∑i=1n|Xi−X⎯⎯⎯|SAE=\sum_{i=1}^{n}|X_i-\overline{X

2015-08-22 02:20:25

常见的机器学习&数据挖掘知识点

机器学习数据挖掘分类聚类关联预测神经网络算法云计算

2015-08-21 20:44:44

查看更多

勋章 我的勋章
    暂无奖章