10 xie--ying

尚未进行身份认证

暂无相关简介

等级
TA的排名 49w+

IKAnalyzer分词单独使用例子

IKAnalyzer分词单独使用例子 javaIKAnalyzerIKAnalyzer使用中文分词最近用了一下中文分词工具,网上说中科院研究的盘古分词比较好,找了一下没有java版本的,只有.net版本的,所以选用的IKAnalyzer分词工具.IKAnalyzer官方说有以下特点(我没有做过测试,不知是真是假): 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒

2011-11-25 12:59:49

java两字符串相似度计算算法——Levenshtein distance编辑距离算法

Levenshtein distance最先是由俄国科学家Vladimir Levenshtein在1965年发明,用他的名字命名。不会拼读,可以叫它edit distance(编辑距离)。原理很简单,就是返回将第一个字符串转换(删除、插入、替换)成第二个字符串的编辑次数。次数越少,意味着字符串相似度越高     Levenshtein distance可以用来: Sp

2011-11-24 19:59:56

java poi 读取excel各种数据

java poi 读取excel各种数据Microsoft的Office系列产品拥有大 量的用户,Word、Excel也成为办公文件的首选。在Java中,已经有很多对于Word、Excel的开源的解决方案,其中比较出色的是 Apache的Jakata项目的POI子项目。该项目的官方网站是http://jakarta.apache.org/poi/。POI 包括一系列的API,它们可以操

2011-11-24 18:22:08

jsoup 简介

更好的教程可以参看jsoup官方网站上的入门指导cookbook:http://jsoup.org/cookbook/jsoup 简介Java 程序在解析 HTML 文档时,相信大家都接触过 htmlparser 这个开源项目,我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章,分别是:从 HTML 中攫取你所需的信息和 扩展 HTMLParser 对自定义

2011-11-24 14:51:04

基于Java的HTML解析器简介

基于Java的HTML解析器    最近要做网络信息的采集,解析HTML是必不可少的,查了下这方面的工具还不少,但是不知道哪个好用,似乎HTMLParser是用的多点的,但是从06年开始就不再更新了,大概是已经满足HTML 4的解析了吧,收集了几个看起来不错的,留着备用。Java Mozilla Html Parser能够将html解析成Java Document对象。

2011-11-24 11:28:49

java初学之static

java中没有全局变量这一说法,只有static和非static变量。如果需要完成类似全局变量的功能,则可以定义static变量PI,再用类方法调用(如Math.PI)即可。——引用由此我想要好好分析下static变量的特性,先从我熟悉的C++分析起。static定义静态变量,在C++中,静态存储特性分为三种:外部链接特性、内部链接特性和无链接性。外部链接特性对应在代码块外声明的变量,内部

2011-11-12 21:50:56

java初学之运算符

1、给对象赋值往往是对引用的赋值,比如Number n1=new Number();Number n2=new Number();n1=n2;如果对n2进行操作赋值,则会导致n1与n2产生相应变化,这就是所谓的“别名现象”。若想让两个对象独立,则需要对两者的数据域进行特定赋值,如n1.i=n2.i,但是这又会导致数据访问的混乱。此处只是提醒自己会有这方面的问题,解决方法待续。2、运算符优先级:

2011-11-12 21:49:11
勋章 我的勋章
    暂无奖章