whjxnyzh-CSDN博客

转载矩阵分解

Matrix Decompositions has a long history and generally centers around a set of known factorizations such as LU, QR, SVD and eigendecompositions. More recent factorizations have seen the light of the

2014-04-07 14:13:01 1559

转载 Vector Quantization

http://blog.pluskid.org/?p=57

2014-04-04 14:01:37 834

转载协方差的意义

在概率论中，两个随机变量 X 与 Y 之间相互关系，大致有下列3种情况：当 X, Y 的联合分布像上图那样时，我们可以看出，大致上有： X 越大 Y 也越大， X 越小 Y 也越小，这种情况，我们称为“正相关”。当X, Y 的联合分布像上图那样时，我们可以看出，大致上有：X 越大Y 反而越小，X 越小 Y 反而越大，这种情况，我们称为“负

2014-03-26 20:28:30 960

转载局部图像特征描述概述

局部图像特征描述概述樊彬中国科学院自动化研究所模式识别国家重点实验室 (CASIA NLPR) 局部图像特征描述是计算机视觉的一个基本研究问题，在寻找图像中的对应点以及物体特征描述中有着重要的作用。它是许多方法的基础，因此也是目前视觉研究中的一个热点，每年在视觉领域的顶级会议ICCV/CVPR/ECCV上都有高质量的特征描述论文发表。同时它也有着广泛的应用，举例来说

2014-03-19 22:58:16 864

转载随机抽样一致 RANSAC

Ransac是用途很广泛的算法，详细介绍请看http://en.wikipedia.org/wiki/RANSAC。下面简单介绍一下（没兴趣的可以略过不看）。我们分析世界，需要对世界建模，把世界中的现象抽象成模型。每个模型，又存在一些参数，通过调节参数，可以得到不同的实例，进行推演。我们观察现象，得到一堆数据。如何为这堆数据找一个合适的模型，再确定合适的模型参数，这是很重要的问题，是人类理

2014-03-14 10:42:47 987

转载 Writing Tips

Writing Tips“Either write something worth reading, or do something worth writing.” -- Benjamin Franklin (1706-1790)The Science of Scientific Writing, by George D. Gopen and Judith A. Swan, Ame

2014-02-19 12:06:27 1063

转载 Sparsity and Some Basics of L1 Regularization

Sparsity 是当今机器学习领域中的一个重要话题。John Lafferty 和 Larry Wasserman 在 2006 年的一篇评论中提到：Some current challenges … are high dimensional data, sparsity, semi-supervised learning, the relation between computat

2014-02-14 13:01:17 820

转载 Stanford-CV华人教授李飞飞写给她学生的一封信，如何做好研究以及写好PAPER，受益匪浅

李飞飞是斯坦福大学计算机视觉领域的牛人。 De-mystifying Good Research and Good Papers By Fei-Fei Li, 2009.03.01 Please remember this: 1000+ computer vision papers get published every year! Only 5-10 are

2014-01-20 22:55:01 1411

转载计算机视觉代码合集

http://www.yuanyong.org一、特征提取Feature Extraction：SIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affine-SIFT [3] [Project]SURF [4] [OpenSURF] [

2014-01-19 21:59:07 3524

转载机器学习周刊第三期

摘要： 1、MLSS(Machine Learning Summer School)首次在中国，在北京，在人大举行了，抓紧时间抢票啊；2、人脑认知模型是量子的？3、Python继续占据科研第一线啊，各种数据挖掘教程有木有；活动预告从“南大周志华”周老师weibo看到，这个超级赞，Speaker里面超级多大牛。2014 MLSS Machine Learning Su

2014-01-18 19:32:15 2189

转载机器学习周刊第一期：Hello World

各种新闻Facebook’s ‘Deep Learning’ Guru Reveals the Future of AI一篇讲Facebook研究院的文章，燕乐存，Yann leCun，神经网络三大牛人之一，NIPS上被Facebook收了当人工智能研究院老大了，用DNN搞，话说DNN研究院还是百度发起的说，拜余凯。Google Hires Brains that

2014-01-15 23:07:12 2304

转载机器学习周刊第二期：深度学习上了Nature

本期大牛：Geoffrey E. Hinton懂很多模型很牛么？老爷子一辈子就搞神经网络一个模型，各处刷新state-of-art。。。大神最新一篇文章，用万金油一般的波尔兹曼机搞出了Topic Model：Srivastava, N., Salakhutdinov, R. R. and Hinton, G. E. Modeling Documents with a Deep Bolt

2014-01-15 23:03:27 3569

转载 videolectures 最受欢迎的机器学习视频

26971 views, 1:00:45, Gaussian Process Basics, David MacKay, 8 comments7799 views, 3:08:32, Introduction to Machine Learning, Iain Murray16092 views, 1:28:05, Introduction to Support Vector Machines,

2014-01-06 23:13:30 1274

原创 PRML勘误表

http://research.microsoft.com/en-us/um/people/cmbishop/prml/pdf/prml-errata-1st-20110921.pdf

2014-01-06 20:02:02 3163

转载我和权威的故事-王垠

每个人小时候心里都是没有权威的，就像每个人小时候也都不相信广告一样。可是权威就像广告，你听一遍不信，听两遍不信，……，直到一千遍的时候，它忽然开始起作用了，而且这作用越来越强。消灭广告所造成的幻觉，最好的办法就是去尝试，去实地的考察它。有些虚幻的东西只要你第一次尝试就会像肥皂泡一样破灭掉。可是如果你不主动去接触它，它就会一直在你脑海里造成一种美好神圣的假象。很神奇的一个现象就是，权威对人思

2014-01-06 12:47:21 1557

原创判别模型与生成模型

关于这个网上有很多说法，其实我感觉PRML里面总结的最好最地道。看完这一段话估计就懂了比如判别模型，最熟悉的就是logistic regression。生成模型，比如naive bayes

2014-01-05 18:57:23 811

转载 Python模块导入和执行

# -*- encoding:utf-8 -*-'''module_2.py模块的内容''' print(__name__) def sum(a,b): return a+b if __name__ == "__main__": import sys print(sys.argv[0]) a = int(sys.argv[1]) b = int

2014-01-05 10:30:36 1589

转载 Python模块概念和基本使用

python是由一系列的模块组成的，每个模块就是一个py为后缀的文件，同时模块也是一个命名空间，从而避免了变量名称冲突的问题。模块我们就可以理解为lib库，如果需要使用某个模块中的函数或对象，则要导入这个模块才可以使用，除了系统默认的模块不需要导入外。导入直接使用如下语法：import 模块名称(不要.py后缀) 这样导入成功后，就可以在另外一个模块中使用被导入模块的功能

2014-01-05 10:23:44 922

转载 Python模块包和搜索路径

一个python文件就是一个模块，使用独立的命名空间，但实际使用过程中单单用模块来定义python功能显然还不够。因为一个大型的系统几千上万个模块是很正常的事情，如果都聚集在一起显然不好管理并且有命名冲突的可能，因此python中也出现了一个包的概念。一、python中的包介绍包是通过使用“点模块名称”创建Python模块命名空间的一种方法。列如，模块名称 A.B 表示

2014-01-05 10:08:40 1398 1

原创 64位windows操作系统安装scikit-learn

小白估计看到官网上的介绍会被绕晕，其实很简单，就四个步骤首先装Python 2.7.6 Windows X86-64 Installer然后装numpy-MKL-1.7.2.win-amd64-py2.7.exe然后装scipy-0.13.2.win-amd64-py2.7.exe最后装scikit-learn-0.14.1.win-amd64-py2.7.ex

2014-01-03 20:44:38 7619 7

转载经典的机器学习方面源代码库

今天给大家介绍一下经典的开源机器学习软件：编程语言：搞实验个人认为当然matlab最灵活了（但是正版很贵），但是更为前途的是python（numpy+scipy+matplotlib)和C/C++，这样组合既可搞研究，也可搞商业开发，易用性不比matlab差，功能组合更为强大，个人认为，当然R和java也不错.1.机器学习开源软件网（收录了各种机器学习的各种编程语言学术与商

2014-01-03 13:27:58 1020

转载机器学习的那些事

【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》第 8 卷第 11 期 2012 年 11 月，本文译自Communications of the ACM 2012年第10期的“A Few Useful T

2014-01-03 13:04:00 1336

原创 Sampling Importance Re-sampling Algorithm

为产生密度为的样本，可以从方便采样的密度g(x)中抽取y，通过Acceptance/Rejection方法来最终得到密度为f(x)的样本，只要保证f(x)<=cg(x)。但是有时候f(x)的形状已知，有未知常数存在（比如贝叶斯统计中的归一化因子），Acceptance/Rejection方法就不好用了。这时，我们可以使用Sampling Importance Re-sampling Algor

2014-01-02 13:16:11 1192

转载怎样做研究僧

本文的主旨是解释如何做研究。我们提供的这些建议，对于研究本身（阅读、写作和程序设计）、理解研究过程以及开始研究（方法论、选题、选导师和情感因素），都是极具价值的。1. 简介这是什么？并没有什么神丹妙药可以保证在研究中取得成功，本文只是列举了一些可能会对研究有所帮助的非正式意见。目标读者是谁？本文主要是为新入学的研究生而写。如何使用？要精读完本文，太长了一些，最好是采用

2014-01-01 12:58:30 885

原创 Markov Chain Monte Carlo

Monte Carlo方法是基于随机数模拟计算的一类计算方法。Monte Carlo方法必需有随机数源，由于计算机可以提供伪随机数，因此，此方法最适合通过计算机来实现。 Monte Carlo方法常用于不确定性问题的模拟计算。对于一些没有随机成分的问题，有时可以看成某些随机变量的相关量的计算，例如期望，通过模拟样本来估计。必需保证所选样本真实反应了模拟的总体分布，才能更有效的来估计这些量。若模

2013-12-31 14:17:56 1339 2

原创 Gibbs Sampling

这里的相关性并不一定是线性相关。至于为什么相关性大的话Gibbs采样不好用可以这样理解，比如我们就假定x1=x2，那么我们可以看到给定x2的条件下也就相当于定了x1，该链几乎不动，所以不好用。

2013-12-31 13:55:48 960

原创 Metropolis-Hastings Alogorithm

目前最流行的基于Markov链产生随机数的算法为Metropolis-Hastings算法。由Metropolis1953年提出并由Hastings1970年加以推广。(Metropolis, N et.al, (1953). Equations of state calculation by fast computing machines，Journal of Chemical Physic

2013-12-31 13:46:51 1674

转载机器学习是什么--周志华

机器学习现在是一大热门，研究的人特多，越来越多的新人涌进来。不少人其实并没有真正想过，这是不是自己喜欢搞的东西，只不过看见别人都在搞，觉着跟大伙儿走总不会吃亏吧。问题是，真有个“大伙儿”吗？就不会是“两伙儿”、“三伙儿”？如果有“几伙儿”，那到底该跟着“哪伙儿”走呢？很多人可能没有意识到，所谓的machine learning community，现在至少包含了两个有着完全不同的文化、

2013-12-30 14:19:27 882

转载图像处理和计算机视觉中的经典论文

感谢水木上同领域的同学分享，有了他的整理，让我很方便的获得了CV方面相关的经典论文，我也顺便整理一下，把pdf中的文字贴到网页上，方便其它人更直观的获取所要内容~~~ 资料的下载链接为： http://iask.sina.com.cn/u/2252291285/ish?folderid=775855 以下为该同学的整理的综述：“前言：最近由于工作

2013-12-27 16:56:06 1254

原创 Principal Component Analysis

Principal Component Analysis简称PCA，也叫Karhunen-Loeve变换。在数据降维，数据压缩，特征提取等方面得到的广泛的应用。相比大家都会用这个方法，Matlab代码貌似也就两行而已。但是它背后有坚实的数学基础，本文试图用简单的方法阐明PCA的原理。把数据从高维变到低维，不是随便乱变换的，PCA的思想是：将数据投射到子空间，在这个子空间中数据的方差最大。为什么

2013-12-27 15:43:54 1100

转载空间点过程与随机测度（二）：测度的故事

MIT大牛林达华既然这个Topic的题目是关于随机测度，那么，自然是离不开“测度”(measure)这个概念的。所以在这篇文章里，我们要说一说测度。也许，在很多朋友的眼中，“测度”是一个特别理论的概念——似乎只有研究数学的人才应该关心它。这也许和大学的课程设计有关系，因为这个概念一般是在研究生的数学课程才会开始讲授，比如“实分析”或者“现代概率理论”。而且，在大多数教科书里面，它的第一次出场就

2013-12-27 13:09:44 1782 1

转载空间点过程与随机测度（一）：从数星星说起

数星星的数学从今天开始，我打算分几篇来分享一个我认为是概率理论中一个非常漂亮的Topic：空间点过程(Point Processes)和随机测度(RandomMeasure)。小时候，在晴朗的夜里，我喜欢仰望星空，去数天上的星星——那是无忧无虑的快乐童年。长大后，当我们再度仰望苍穹，也许会思考一个不一样的问题：这点点繁星的分布是不是遵循什么数学规律呢？这个问题也许问得太不解风情

2013-12-27 13:06:59 1519

转载 Learning和Vision中的小进展和大进展

首先祝朋友们中秋节快乐！因为过去三个月的实习工作很繁忙，这么已经很长时间没有更新了。这个夏天参加了两次会议(CVPR和ECCV)，在微软完成了一个新的project，这些经历都给了我新的启发。不积跬步无以至千里很多在这个领域做research的朋友抱怨，这个领域在过去相当长的时间没有“突破性”的进展了。在过去，我也一直抱有这样的看法。不过，如果比较最近两年的paper，以及20年前的p

2013-12-26 22:07:06 768

转载在数学的海洋中飘荡

在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appeara

2013-12-26 21:42:09 1069

转载永不消逝的浪漫：Programming Languages and Haskell

MIT大牛林达华最近两周工作轻松了一些，于是闲不住，花了不少时间钻研一门新的程序设计语言——Haskell。其实，这门语言在上世纪八十年代就产生了，到现在也算有些年纪了吧，只是对我来说，是第一次学习它。从初中学习Basic，到现在，学过的语言不记得有多少了，在相当一段时间内用来干serious的事情的应该也有八九种了。我这个人在对待计算机语言方面属于“喜新不厌旧”（在现实生活中，我还是很专

2013-12-26 21:23:17 1187

转载 Research and Application

MIT大牛林达华受Alan邀请，MichaelJordan来这里访问一些日子。今天听了一个他的seminar，是关于分类的——这是我以前做的领域，内容是f-divergence,surrogate loss function，以及它们的理论上的联系。这主要是他的学生Wainwright完成的工作，在google上可以很容易搜到相关的文章。Loss function是传统的classif

2013-12-26 21:00:07 868

转载变换不变性

MIT大牛林达华变换与不变是数学里面最令人神往的一对矛盾统一。所谓“变换不变性”，以不变刻画变化，其核心深刻反映了这种对偶的关系。变换不变性贯彻于很多具体的数学领域之中，对它的全面讨论远非我力所能及。这篇文章只是讨论它的一个简单例子，希望通过一个小小的窗口管窥这个世界的奥妙。何谓旋转？这篇文章只想很初步地回答两个基本的问题1. 什么叫做旋转(Rotation)？

2013-12-26 20:51:11 2988

原创随机数产生方法

随着计算机技术的快速发展和统计方法的不断丰富，产生了广泛应用的统计计算方法，例如EM算法、Bootstrap方法、MCMC方法等。这些方法大多涉及到随机抽样，即需要产生满足某分布的随机数。通常这些随机数产生是借助计算机实现，实际上是伪随机数。(1)最简单的也是万能的随机数产生方法Inverse CDF Method设随机变量X的分布函数为F(x)，令，如果U~U(0,1)，那么的分布就为F

2013-12-26 19:09:48 3893

转载无处不在的线性分解

MIT大牛林达华深刻的思想往往蕴含在简单的数学形式之中。从小至今，对数学的学习一直不断，所学愈多，愈深感现代数学之博大，自己根基之薄弱。在自己所接触的数学之中，各种定理公式纷繁复杂，然细思之下，其核心思想却是非常简洁，但却广泛地以不同形式体现在各个分支之中。事实上，很多不同的数学分支在用自己本领域的语言阐述着一些共同的数学原理。有三个基本的思想，在我所学到的数学中被普遍的运用：分解，逼

2013-12-26 17:44:49 1517

转载概率漫谈

MIT大牛林达华博文前一段时间，随着研究课题的深入，逐步研习现代概率理论，这是一个令人耳目一新的世界。这个世界实在太博大，我自己也在不断学习之中。这篇就算起一个头吧，后面有空的时候还会陆续写一些文章和大家分享我在学习过程中的思考。概率论要解决的问题概率论是很古老的数学分支了——探讨的是不确定的问题，就是说，一件事情可能发生，也可能不发生。然后，我们要预计一下，它有多大机会会发生，这是概

2013-12-26 13:31:04 767

MIT大牛林达华的博客内容word版本，带标签

中科院自动化研究所模式识别博士讲义

opencv 入门教程

贝叶斯定理

空空如也