hexinuaa-CSDN博客

原创 95行代码实现最大熵模型训练

关于最大熵模型的介绍请看：http://www.cnblogs.com/hexinuaa/p/3353479.html下面是GIS训练算法的python实现，代码不到100行。from collections import defaultdictimport mathclass MaxEnt(object): def __ini

2014-04-29 14:05:25 2566 2

原创部分面试题整理

1. 判断一个机器是大序还是小序的bool IsBig_Endian()//如果字节序为big-endian，返回true;//反之为 little-endian，返回false{ unsignedshort test = 0x1122; i

2011-07-27 16:40:47 1307

转载海量数据面试题整理

海量数据面试题整理1. 给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url？方案1：可以估计每个文件安的大小为50G×64=320G，远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。

2011-07-27 12:24:06 1845

转载海里数据面试题整理

1. 给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url？方案1：可以估计每个文件安的大小为50G×64=320G，远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。s 遍历文件a，对

2011-07-26 15:46:09 219

原创计算直线的交点数—动态规划

计算直线的交点数Problem Description平面上有n条直线，且无三线共点，问这些直线能有多少种不同交点数。比如,如果n=2,则可能的交点数量为0(平行)或者1(不平行)。问题分析将n条直线排成一个序列，直线2和直线1最多只有一个交点，直线3和直线1，2最多有两个交点,

2011-07-26 00:02:43 4068 1

原创如何设计一个LRU Cache？

如何设计一个LRU Cache？Google和百度的面试题都出现了设计一个Cache的题目，什么是Cache，如何设计简单的Cache，通过搜集资料，本文给出个总结。通常的问题描述可以是这样：Question：[1] Design a layer in front of a s

2011-07-24 22:41:55 27582 10

原创二分查找的几点思考

二分查找的几点思考很早听说90%的程序员写不出正确的二分查找程序，对此颇为怀疑也颇为惶恐。怀疑的是，二分查找真的很难写吗？惶恐的是，怀疑的我能否在短时间内写出一个正确的二分查找程序？为了自己能成为10%中的一员，在此特别总结了二分查找算法。二分查找又称折半查找，用于在有序序列

2011-07-12 17:29:13 3862 3

转载 lamp 配置

虚拟机上安装Fedora Core并架设LAMP服务器流程　　一直以来极少在百度知道上提问，因为碰到什么问题基本只要动动鼠标就能搜出答案，鉴于此，基本也没怎么把自己日常碰到的小问题的解决方案写下来，因为觉得其他人应该也可以用同样的方法搜索到答案。不过现在想想，如果大家都不写，那可供后人参考的解决方法也就不会增长，所以还是动动手写下一点吧，人人为我，我为人人。　　最近因为工作需要，要

2011-06-10 15:44:00 113

基于LDA的Topic Model变形最近几年来，随着LDA的产生和发展，涌现出了一批搞Topic Model的牛人。我主要关注了下面这位大牛和他的学生： David M. BleiLDA的创始者，04年博士毕业。一篇关于Topic Model的博士论文充分体现其精深的数学概率功底；而其自己实现的LDA又可体现其不俗的编程能力。说人无用，有论文为证： J. Chang and D. Blei. Relational Topic Models for Document Networ

2011-01-07 16:14:00 155

转载正则表达式

项目中常用的十个正则表达式 1.是否为数字 Regex rx = new Regex(@"^[+-]?[0123456789]*[.]?[0123456789]*$"); 2.是否只包含字母与数字 Regex rx = new Regex(@"^[a-zA-Z0-9-]*$"); 3.是否是身份证 Regex rx = new Regex(@"^[0123456789]{15,18}$"); 最后一位带X

2010-11-29 21:57:00 72

转载 Topic Model

基于LDA的Topic Model变形最近几年来，随着LDA的产生和发展，涌现出了一批搞Topic Model的牛人。我主要关注了下面这位大牛和他的学生： David M. BleiLDA的创始者，04年博士毕业。一篇关于Topic Model的博士论文充分体现其精深的数学概率功底；而其自己实现的LDA又可体现其不俗的编程能力。说人无用，有论文为证： J. Chang and D. Blei. Relational Topic Models for Document Networks.

2010-11-19 11:29:00 8623 3

原创 95行代码实现最大熵模型训练

原创部分面试题整理

转载海量数据面试题整理

转载海里数据面试题整理

原创计算直线的交点数—动态规划

原创如何设计一个LRU Cache？

原创二分查找的几点思考

转载 lamp 配置

转载 Topic Model

转载正则表达式

转载 Topic Model

转载有趣的数据结构——Linux内核中的链表(Black Aureole)

原创 Author Topic Model解析

原创贝叶斯垃圾邮件过滤

最大熵模型入门—包你懂

空空如也