- 博客(0)
- 资源 (10)
- 收藏
- 关注
统计建模与R软件
本书以统计理论为基础,按照数理统计教材的章节顺序,在讲明统计的基本概念的同时,以R软件为辅助计算手段,介绍统计计算的方法,从而有效地解决统计中的计算问题.
书中结合数理统计问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解该软件的精髓和灵活、高效的使用技巧.此外,还介绍了在工程技术、经济管理、社会生活等各方面的丰富的统计问题及其统计建模方法,通过该软件将所建模型进行求解,使读者获得从实际问题建模入手,到利用软件进行求解,以及对计算结果进行分析的全面训练.
2014-06-17
JSP开发技术大全
很不错的JSP学习教程,JSP是全新的网络服务器端编程环境。JSP充分利用了Java的强大功能,是一种优秀的服务器端技术。
本书是JSP技术完整的参考手册,不仅适合初学者,对中高级服务器端编程人员更具参考价值。
2012-05-03
RESTful Web Services 中文版
《RESTful Web Services 中文版》是一本将REST设计理念应用于真实Web服务的书,它向你提供
了一些成功设计所需的最佳实践,以及把设计转化为代码所需的技巧。你可以利用Web的强大能力
来构建可编程应用——只要你遵从Web的理念,而不是违反它。本书向你解释了具体做法
2012-04-27
Mahout实战
Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Apache Mahout项目已经发展到了它的第三个年头,目前已经有了三个公共发行版本。Mahout包含许多实现,包括集群、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。 Mahout 的创始人 Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容,能做一些关于机器学习聚类相关的算法,运行平台是hadoop集群。
2012-04-01
Hadoop权威指南(第2版).
Hadoop是项目的总称,起源于作者儿子的一只玩具大象的名字。主要是由HDFS、MapReduce和Hbase组成。 HDFS是Google File System(GFS)的开源实现。 MapReduce是Google MapReduce的开源实现。 HBase是Google BigTable的开源实现。 这个分布式框架很有创造性,而且有极大的扩展性,使得Google在系统吞吐量上有很大的竞争力。因此Apache基金会用Java实现了一个开源版本,支持Fedora、Ubuntu等Linux平台。雅虎和硅谷风险投资公司Benchmark Capital 6月28日联合宣布,他们将联合成立一家名为Hortonworks的新公司,接管被广泛应用的数据分析软件Hadoop的开发工作。 Hadoop实现了HDFS文件系统和MapRecue。用户只要继承MapReduceBase,提供分别实现Map和Reduce的两个类,并注册Job即可自动分布式运行。 目前Release版本是0.20.203.0。还不成熟,但是已经集群规模已经可以达到4000个节点,是由Yahoo!实验室中构建的。下面是此集群的相关数据: · 4000 节点 · 2 x quad core [email protected] per 节点 · 4 x 1TB SATA Disk per 节点 · 8G RAM per 节点 · 千兆带宽 per 节点 · 每机架有40个节点 · 每个机架有4千兆以太网上行链路 · Redhat Linux AS4 ( Nahant update 5 ) · Sun Java JDK1.6.0_05 - b13 · 所以整个集群有30000多个CPU,近16PB的磁盘空间! HDFS把节点分成两类:NameNode和DataNode。NameNode是唯一的,程序与之通信,然后从DataNode上存取文件。这些操作是透明的,与普通的文件系统API没有区别。 MapReduce则是JobTracker节点为主,分配工作以及负责和用户程序通信。 HDFS和MapReduce实现是完全分离的,并不是没有HDFS就不能MapReduce运算。 Hadoop也跟其他云计算项目有共同点和目标:实现海量数据的计算。而进行海量计算需要一个稳定的,安全的数据容器,才有了Hadoop分布式文件系统(HDFS,Hadoop Distributed File System)。 HDFS通信部分使用org.apache.hadoop.ipc,可以很快使用RPC.Server.start()构造一个节点,具体业务功能还需自己实现。针对HDFS的业务则为数据流的读写,NameNode/DataNode的通信等。 MapReduce主要在org.apache.hadoop.mapred,实现提供的接口类,并完成节点通信(可以不是hadoop通信接口),就能进行MapReduce运算。 目前这个项目还在进行中,还没有到达1.0版本,和Google系统的差距也非常大,但是进步非常快,值得关注。 另外,这是云计算(Cloud Computing)的初级阶段的实现,是通向未来的桥梁。
2011-09-30
hadoop权威指南 中文完美版
本书阐述了hadoop的相关技术细节,便于你了解hadoop及相关理论知识。hadoop是由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。
2011-09-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人