文本挖掘原理
《文本挖掘原理》 全本,非2.74M的15页预览版。由于没有书可卖了,上传供学习参考!
软件项目计划
某软件公司软件过程管理系列文档:软件项目计划,用于软件过程控制,适用于CMMI3级。
软件配置管理规范
某软件公司软件过程管理系列文档:软件配置管理规范,用于软件过程控制,适用于CMMI3级。
软件风险管理规范
软件过程管理系列文档: 软件风险管理,用于软件过程控制,适用于CMMI3级。
概要设计报告编写指南
某软件公司软件过程管理系列文档: 概要设计报告编写指南,用于软件过程控制,适用于CMMI3级。
InnoDB性能调节提示
如何配置mysql的InnoDB性能调节提示
dbutils开源项目用法
Common Dbutils是操作数据库的组件,对传统操作数据库的类进行二次封装,可以把结果集转化成List。
如何通过java程序获得Nutch中网页的详细信息
如何通过java程序获得Nutch中网页的详细信息,包括:
得到Url名称、网页题名
得到检索关键词
得到网页题名及Outlink
Nutch程序运行环境配置
Nutch在windows开发中程序运行环境的配置,可用于Java环境开发
把多次用nutch_crawl获得的所有目录合并在一起
如果想把多次用nutch crawl获得的所有目录合并在一起。可以按以下步骤进行
The Lucene Search Engine
一篇英文文档,详细的叙述了如何在你的web应用中加入lucene搜索功能
Nutch的各项配置详解
Nutch各个配置项的详细说明,非常详细的说明了每一项
Nutch_的配置文件
Nutch的配置文件主要有三类:
1.Hadoop的配置文件,Hadoop-default.xml和Hadoop-site.xml。
2.Nutch的配置文件,Nutch-default.xml和Nutch-site.xml。
3.Nutch的插件的配置文件,这些插件的配置文件在加载插件的时候由插件自行加载,如filter的配置文件。