自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

林君-lj的专栏

java、云计算、文本分析

  • 博客(3)
  • 收藏
  • 关注

原创 libsvm java版本使用心得

项目中要用到svm分类器,自己实现的话太费时间,于是寻找开源实现,找到了libsvm。java版本是一个jar包,引入到工程中即可使用。需要注意的是,java版本充满了c++风格(类名小写,命名使用下划线_分隔等等),使用者需要稍微适应一下。核心类是svm类,最常用的几个方法如下(都是static方法):svm.svm_load_model(String),望文生义即可知是加载已训

2014-02-13 14:27:36 3166 3

原创 hadoop StringUtils split方法的坑

今天写hadoop job时发现了一个坑。使用StringUtils类的split方法对字符串做分割,不小心引入了hadoop自身的StringUtils类,job出错,仔细debug检查后才找到问题所在。jdk版StringUtils类只把空白符作为分割符。hadoop版StringUtils类把标点符号也作为分隔符。在写job的时候小心不要引入错了。

2013-05-10 14:43:10 1097

原创 hadoop多目录输出1

第一次写博文,希望以后能一直坚持下去。本文主要分享hadoop中如何实现多文件输出。        实际hadoop job开发中,我们的输出数据可能不止一类,并且需要将不同的数据类以不同的文件名输出保存。例如典型的wordcount实现,如果既要统计单词在所有文档中的出现次数,又要统计单词在所有文档中的出现行数,将这两个次数输出到count.txt文件和line.txt文件中。类似这样的

2013-04-27 16:18:23 661

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除