自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 逻辑斯蒂回归与最大熵模型

逻辑斯蒂回归是经典的分类方法,最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型。这两个模型都属于对数线性模型逻辑斯蒂回归模型:分布函数图像是一条S曲线,值域的范围在0~1,采用极大似然估计法估计模型参数,首先确定其似然函数,然后再对似然函数取对数,求该似然函数的最大值,得到w的估计值最大熵原理:最大熵原理表述为在满足约束条件下模型集合中选择熵最大的模型 H(P)= -∑P(x)lo...

2018-05-22 21:42:47 459

原创 Hadoop权威指南——HDFS笔记

HDFS:Hadoop Distributed FileSystemHDFS以流式数据访问模式来存储超大文件,运用于商用硬件集群上。HDFS不支持多次写入。数据块:首先确定一点,磁盘以数据块的大小进行数据的读/写操作,构建于磁盘之上的文件系统通过磁盘块来管理文件系统中的块,文件系统块的大小通常为磁盘块的好几倍。HDFS中也存在块的概念,默认为64MB,与其他文件系统不同的是,如果一个文件小于块的大...

2018-05-21 18:07:51 162

原创 VirtualBox+Ubuntu16.04.4+Hadoop-2.6.5搭建

搭建这个环境真的是一把辛酸泪,不说了。赶紧记一下遇到的坑,防止之后再落入。前提:搭环境之前一定要先去了解一下hadoop大致的工作原理,懂得它的一些专业名词,比如JobTracker,TaskTracker,DataNode,NameNode等等,以及他们的作用,只有这样才不会一头雾水,我就是一开始就直接搭环境,一脸懵逼,最后只只能去恶补原理。我是用完全分布的方式来搭建hadoop的环境1.环境:...

2018-05-15 15:33:57 418

原创 关于预测与放置算法

Code Craft告一段落,前前后后忙活了一个多月,最终以武长赛区27名告终。其实,事先没有想到自己可以进入复赛,因为初赛的成绩并不理想,从来没有上过80分,也不知道是不是老天爷眷顾,初赛提交成绩居然破天荒的好,所以顺利进入复赛。非常非常感谢队友浩浩,不嫌弃不放弃,带着小白我打比赛。帮我解决各种疑难杂症。这次的题目大概分为两个部分,一部分为虚拟机的预测,另一部分是虚拟机的放置,初赛以预测为主,因...

2018-05-01 20:19:25 668

原创 Python自然语言处理第五章

 用于查看不同规模的训练数据对查询标记器的影响 

2018-02-28 10:09:36 368

原创 Python自然语言处理第一章

初识NLTK方法介绍Python&NLP

2018-02-28 09:54:08 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除