- 博客(1)
- 收藏
- 关注
原创 Spark简介-1
Spark应用程序包含一个运行用户主函数的驱动程序,这个主函数可以在一个集群上执行多个并行操作。Spark主要包括两个重要概念:Resilient Distributed Dataset(弹性分布式数据集)和Shared variable(共享变量)。弹性分布式数据集是一种分布式内存抽象,是一个大的数据集合,将所有的数据加载到内存中。分布式是因为他可以分布在多台机器上进行计算;弹性是yi
2016-05-08 16:39:29 220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人