- 博客(0)
- 资源 (2)
- 收藏
- 关注
开发自己的搜索引擎源码
Eclipse工程/ch2:原书第二章Eclipse工程文件
对文档预处理的源代码
对文档建立索引的源代码
对文档检索的源代码
使用Lucene检索和使用java.lang.String内置方法进行检索的效率比较
安装:直接在Eclipse中选取“import->Existing Project”
Eclipse工程/ch7:原书第七章和第九章的Eclipse工程文件
使用PDFBox解析PDF文件
使用xpdf解析中文PDF文件
使用POI解析WORD和Excel文件
使用Jacob解析WORD文件
Google的Search API的使用
安装:直接在Eclipse中选取“import->Existing Project”
Eclipse工程/ch9:原书第十二章的工程文件
使用正则表达式解析网页文件
使用HTMLParser解析网页文件
安装:直接在Eclipse中选取“import->Existing Project”
Eclipse工程/heritrixProject:原书第十章的工程文件
在Eclipse配置完成的Heritrix源代码
自行开发的Heritrix的Extractor类:pconline
自行开发的Heritrix的FrontierScheduler类:pconline
自行开发的Heritrix的Extractor类:163mobile
自行开发的Heritrix的FrontierScheduler类:163mobile
安装:直接在Eclipse中选取“import->Existing Project”
Eclipse工程/testDWR:原书第十三章的工程文件
完整的DWR开发环境
DWR在页面调用后台Bean类的实例
DWR操纵页面对象的实例
安装:直接在Eclipse中选取“import->Existing Project”,该工程由于是Web工程,因此需要TomcatPlugin插件。
Eclipse工程/z_mysearch:原书中的搜索引擎完整实例
数据库脚本
网页索引格式
构建词库的源代码
从网页中解析并构建产品信息文件的源代码
从产品信息文件构建索引的源代码
数据库操作类的源代码
基于Spring的业务层管理
检索的业务类源代码
检索的DAO源代码
检索的分页实现源代码
检索的AJAX实现源代码
安装:直接在Eclipse中选取“import->Existing Project”,该工程由于是Web工程,因此需要TomcatPlugin插件。
2017-01-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人