13 白马负金羁

尚未进行身份认证

我要认证

专注图像处理、数据挖掘与机器学习。语言擅长C/C++、Java、Prolog、Haskell,少量Python和VB。喜欢用R进行数据挖掘与分析,用Matlab来研究图像算法。

等级
TA的排名 161

博主已出版的全部译作汇总

从纸牌、21点等博弈游戏的角度轻松阐释概率论与统计学中的重要概念;永不褪色的计算机科学经典著作,Windows编程界大师Charles Petzold传世之作,两位算法领域的传奇大师联手创作,D. E. Knuth亲自做序推荐,Sedgewick是ACM Fellow、普林斯顿大学计算机系创始人、红黑树发明者,Flajolet是法国科学院院士,渐进分析领域的拓荒者,Knuth是历史上最年轻的图灵奖得主,与Dijkstra并称为我们这个时代最伟大的两位计算机科学家

2015-08-28 20:41:40

机器学习中的数学修炼

数学是机器学习和数据科学的基础,任何期望涉足相关领域并切实领悟具体技术与方法的人都无法绕过数学这一关。机器学习中的数学修炼——为你打开一道通往机器学习世界的数学之门:笔者系统地整理并介绍了机器学习中所涉及的必备数学基础,这些都是笔者从浩如烟海的数学知识中精心萃取的,在学习和研究机器学习技术时所必须的内容...

2016-06-06 15:59:59

句向量(句嵌入)模型sent2vec的训练及应用

本文讨论NLP中的句向量模型(sent2vec),也就是将一个完整的句子映射成一个实数向量的技术。这方面已经发表的成果也是比较多的,本文中所涉及的技术主要源自NAACL 2018的一篇论文,其中提出的sent2vec模型可以理解为词嵌入技术中经典的CBOW方法的扩展,该所谓的扩展中一个重要改进就是引入了n-gram

2016-02-22 12:10:33

Python中的list(列表)、tuple(元组)、dict(字典)和set(集合)

列表(list)、元组(tuple)、字典(dict)和集合(set)是Python中内置的四种结构化数据类型。list和tuple都是有序表,但tuple中的内容是不能修改的。字典类型dict存储的内容是键-值(key-value)对。集合则具有无序、不重复的特点

2016-02-25 10:58:25

代码共享与Linux动态链接:探究PLT、GOT与ld-linux.so.2

Shared Library是现代操作系统中不可或缺的一部分,但其背后的实现机制却并不容易理解。本文将就此话题展开讨论,并试图对程序的动态链接机制一探究竟。很多现代应用都是通过动态编译链接的,当一个需要动态链接的应用被操作系统加载时,系统必须要定位,然后加载它所需要的所有动态库文件。 在Linux环境下,这项工作是由ld-linux.so.2来负责完成的,为了支持动态链接机制,还需要深入理解一下GOT和PLT

2014-12-16 22:54:15

主定理(Master theorem)与Akra–Bazzi定理

主定理是算法分析中的一个重要结论,它主要用于求解基于分治思想设计的递归算法的渐进复杂度。经典教材《算法导论》中也介绍过这个结论。尽管主定理应用起来十分方便,但并非所有的递归关系都可以用它来求得最终的渐进表示的复杂度。一个更加泛化的结论是由数学家Mohamad Akra 和 Louay Bazzi在1998年给出的后来以他们名字命名的定理——Akra-Bazzi定理

2009-07-26 16:00:00

树(或有向无环图)中根结点到所有叶子的路径

假设现在有一棵树,注意这里的树不一定是二叉树(也即可以是多叉树),我们希望枚举出从根结点到每一个叶子结点的路径,这个算法该如何实现?本文中的例子主要采用Python来实现。为了方便构建一棵树(还有后面的有向图),这里直接使用Python中NetworkX包,NetworkX是一个用Python语言开发的图论与复杂网络建模工具

2015-12-21 18:07:05

逆向工具angr的快捷教程(1):安装、排雷、CFG范例

Angr是一个基于Python开发的二进制程序分析(Binary analysis)框架,可以用于开展动态符号执行(Symbolic Execution)和多种静态分析。作为系列文章的第一篇,本文将介绍安装angr的基本步骤,尤其是其中可能遇到的各种坑。然后,我们会利用angr对程序进行静态分析,生成相应的CFG,并以此演示angr的基本用法

2016-03-18 19:47:08

在LLVM中编写Backend Pass的详细教程(2)

本质上,LLVM毕竟是围绕编译器展开的一个工具集,或者说编译器本身就是它的核心。因此,在编译原理课程上学到的很多知识在了解或研究LLVM时都能派上用场。在这篇文章中,我们就来演示如何对基本块(Basic Block)的边际加标注。我们还会调用LLVM中的函数来对每个基本块产生一个描述名

2009-12-02 21:24:00

Linux系统监控与分析工具Sysdig:安装与使用

Sysdig是一个超级有用的系统工具,运行在Linux环境上,比 strace、tcpdump、lsof 加起来还强大。Sysdig可用来捕获系统状态信息,保存数据并进行过滤和分析。本文主要介绍在Linux上安装Sysdig的基本步骤,然后以监控某个特定程序的系统调用(system call)为例来简单演示一下它的使用

2015-12-21 18:02:30

在Python中使用贝叶斯网络的实例

我们在之前的文章中已经介绍了贝叶斯网络的基本原理,以及基于贝叶斯网络进行概率推断(Exact Inference)的消去法。本文将结合一个具体的例子来演示在Python中构建贝叶斯网络和概率推断的步骤与方法,最后还会介绍一个带有图形用户界面的贝叶斯网络分析工具

2015-12-26 21:39:01

欢迎订阅我的专栏,好文章一网打尽

博主当前围绕人工智能这个主题开设了三个专栏:【机器学习之术】、【机器学习之道】、【自然语言处理】,这些文章皆为以往博客中精华内容的汇总,已经收录的文章超过70篇(日后笔者还会适时更新),总计有近160万次点阅。希望这些内容可以帮助读者解开学习过程中的一些疑惑,使得订阅者能最大程度地从中收获新知

2020-04-15 05:55:17

图像处理中的数学修炼(第2版)上市:新旧版同时在售

自《图像处理中的数学修炼》原书第一版于2017年2月上市以来,加印重印多次,在京东和当当等主流在线购书网站上已经累计有超过3200个有效购买评论,并且在这两个网站上的好评度都超过99%。结合第一版书籍读者给出的反馈,同时为了适应相关技术的快速发展,在首版发行三年之后的2020年,笔者再度与清华大学出版社合作,乘势推出全新的《图像处理中的数学修炼》(第2版),现第一、二版同时在售

2020-04-06 08:38:37

梯度提升树(GBDT)详解之三:原理推导

本文是GBDT系列文章的最后一弹,它将侧重梯度提升树的原理及其中的数学推导。梯度提升是一种用于回归和分类问题的机器学习技术,其产生的预测模型是弱预测模型的集成,如采用典型的决策树作为弱预测模型,这时则得到了所谓的梯度提升树(GBDT)。GBDT是在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一,它也是集成学习里的经典算法

2020-04-02 03:48:57

梯度提升树(GBDT)详解之二:分类举例

梯度提升是一种用于回归和分类问题的机器学习技术,其产生的预测模型是弱预测模型的集成,如采用典型的决策树作为弱预测模型,这时则得到了所谓的梯度提升树(GBDT)。GBDT是在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一,它与AdaBoost一起都是提升算法的代表,也是集成学习里的经典算法

2020-03-24 08:57:58

孪生神经网络(Siamese)比较两个句子语义相似性

深度学习在自然语言处理(NLP)领域已经被广泛应用,在传统领域过去看似复杂的挑战,也都已经取得了非常显著的进步。本文从一道Kaggle实战题目说起,并借此为例,展现深度学习技术在NLP上的一个应用。该实际问题可以被认为是语义理解或神经翻译的一个典型例子,在解决这个问题的过程中,我们将具体用到包括LSTM、Word Embedding、孪生(Siamese)神经网络

2016-01-18 17:19:54

PRAM模型与Amdahl定律

阿姆达尔定律(Amdahl’s Law)是一条用以阐释并行计算所能达到之基本极限的法则,it is formulated by 美国计算机科学家 Gene Amdahl in 1967。或者说,Amdahl’s Law是一种给定问题规模的前提下,用以预测(或估计)最大可达的加速因子(或称加速比)的方法

2010-03-11 23:56:00

深度学习之Autoencoder及其在图像去噪上的应用

自编码器(Autoencoder)是一种无监督的学习方法(更准确地用语应该是自监督),主要用于数据的降维或者特征的抽取。在作用上有点类似于PCA、字典学习,或者压缩感知。这里的数据降维,也可以理解为数据压缩,总之就是给高维的原始数据产生一个低维的表达,并要求这个低维表达最大程度地保持原始数据中的重要信息。本文基于Keras框架来演示构建Autoencoder的方法,及其在图像去噪领域的应用

2020-03-21 13:19:48

高级数据结构之R树(R-tree)

R树(R-tree)是一种将B树扩展到多维情况下得到的数据结构,它最初由Antonin Guttman于1984年提出。B树的结点中会存储一个键的集合,这些键把线分成片段,沿着那条线的点仅属于一个片段。因此,B树使得我们可以很容易地找到点。如果把沿线各处的点表示成B树结点,我们就能够确定点所属唯一子结点,在那里可以找到该点。Antonin Guttman在他提出R树的经典论文中给出的R树例子...

2020-01-22 09:42:33

2019年总结:始不垂翅,终能奋翼

2019年是忙碌的一年,也是收获的一年。上半年在加州San Diego参加第26届NDSS(系统安全国际顶级会议)。七月,在查尔斯顿(Charleston)参加国际信息处理联合会11.3工作组年度会议(IFIP WG 11.3)暨第33届DBSec国际会议,顺便拜见了一下祖师。十月,在墨西哥洛斯卡沃斯(Los Cabos)受ACM Travel Grant支持在第25届MobiCom上做o...

2020-01-08 09:13:52

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 博客之星
    博客之星
    授予通过"CSDN博客之星评选"中脱颖而出的十大博客之星称号的用户。
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。