bluestinger-CSDN博客

转载用Hadoop1.0.3实现KMeans算法

Data Mining,NLP,Search Engine 用Hadoop1.0.3实现KMeans算法从理论上来讲用MapReduce技术实现KMeans算法是很Natural的想法：在Mapper中逐个计算样本点离哪个中心最近，然后Emit(样本点所属的簇编号，样本点)；在Reducer中属于同一个质心的样本点在一个链表中，方便我们计算新的中心，然后Emit(质心编号，质心)。但是技

2013-10-08 15:07:59 576

转载常见MapReduce模式和算法

本文译自 Mapreduce Patterns, Algorithms, and Use Cases 在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法，并系统化的解释了这些技术的不同之处。所有描述性的文字和代码都使用了标准hadoop的MapReduce模型，包括Mappers, Reduces, Combiners, Partitioners,和 sorting。

2013-10-08 15:05:22 619

转载 hadoop面试题

面试hadoop可能被问到的问题，你能回答出几个 ? 1、hadoop运行的原理? 2、mapreduce的原理? 3、HDFS存储的机制? 4、举一个简单的例子说明mapreduce是怎么来运行的 ? 5、面试的人给你出一些问题,让你用mapreduce来实现？比如:现在有10个文件夹,每个文件夹都有1000000个url.现在让你找出top10

2013-10-08 14:59:36 924

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 用Hadoop1.0.3实现KMeans算法

转载 常见MapReduce模式和算法

转载 hadoop面试题

空空如也

空空如也

转载用Hadoop1.0.3实现KMeans算法

转载常见MapReduce模式和算法