自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 GLM(广义线性模型) 与 LR(逻辑回归) 详解

本文对 GLM 广义线性模型 与 Logistic Regression 逻辑回归 相关话题进行了相对深入全面的解析,并提供大量数学证明。

2017-07-21 11:58:05 62844 7

原创 【互联网大厂推荐算法实战】读书笔记

推荐算法特征&召回&粗排&精排等环节学习记录

2024-02-21 09:29:11 1292

原创 新词发现算法

新词发现基于统计的经典算法(无监督学习):基于已有的大量语料,枚举可能所有新词(原始字的顺序组合,限制长度为 n-gram),然后计算一些统计指标(主要是 凝固度、自由度)进行过滤,尽量准确地筛选出潜在的新词。产出的新词还是需要进行人工审核确认。凝固度这是一个类似互信息 Mutual Information 的概念,衡量两个字之间的相关性,是否经常“凝固”在一块儿出现,足够组成新的词。2-...

2019-06-30 19:45:51 3916

原创 GBM 与 GBDT 与 XgBoost

Gradient Boost Decision Tree 是当前非常流行的机器学习算法(监督学习),本文将从渊源起逐层讲解 GBDT,并介绍目前流行的 XgBoost。

2017-08-20 10:04:52 9591

原创 VJ框架 与 人脸检测/物体检测 详解

本文详细阐述 Viola-Joines 人脸检测/物体检测 实时处理框架,主要参考 Robust Real-Time Face Detection 这篇论文以及本人工程实践经验。

2017-08-17 22:29:03 8417 3

原创 Adaboost 详解

Adaboost (Adaptive Boosting) 详解本文会详细介绍 Adaboost 这一 ensemble 模型(属于 boosting类别)。从基本定义,详细实现到算法原理都会展开讲解。

2017-08-17 22:10:57 5907 3

原创 概率分布详解 Bernoulli、Binomial、Beta

Bernoulli、Binomial、Beta 分布是概率统计常用的基础,本文详细介绍、分析,并给出一个应用举例

2017-07-08 15:22:02 20155 1

原创 Spark 大数据计算

Spark 是当前比较热门的大数据计算平台,本文从整体到局部细节,对 Spark 进行描述、介绍。

2017-06-07 23:19:51 1972

原创 数学期望 Expectation

机器学习中涉及到的很多概念都和 Expectation 相关联,本文对 数学期望展开进行讨论

2017-05-28 18:55:33 4697

原创 MLE (最大似然) 与 LS (最小二乘) 与 MAP (最大后验)

最大似然估计 属于机器学习中的常用的基础思想,很多具体的算法及模型都基于它建立,或者能够基于它找到解释。本文详细讨论这三者本身以及他们的关联

2017-05-06 08:56:34 10839

原创 Bayes Game

本文简单讲述一个有趣的经典的 Bayes定理 相关的小故事,展示了后验概率 posterior probability 出乎意料的威力

2016-08-31 02:33:02 719

原创 热力学与图像处理

在图像处理方面,我们从自然中汲取了大量灵感,例如射线、重力、水流等等物理学模型。其中最为常用的,似乎还是热力学模型,其抽象而简洁地描述了热传播、热均衡的过程。本文将对热力学模型展开细致讨论,不止揭露数学之美,更有自然之美。目录热力学模型

2016-07-29 18:11:03 3926 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除