- 博客(2)
- 收藏
- 关注
原创 RDD编程初级实践
RDD编程初级实践 RDD编程初级实践RDD编程初级实践一、 需求描述二、 环境介绍(一)环境前期准备工作一(二)环境前期准备工作二三、数据来源及数据上传(一)数据来源(二)数据上传四、数据上传结果查看五、数据处理过程的描述(一)pyspark交互式编程(二)编写独立应用程序实现数据去重(三)编写独立应用程序实现求平均值问题六、处理结果的下载及命令行展示(一)pyspark交互式编程(二)编写独立应用程序实现数据去重(三)编写独立应用程序实现求平均值问题七、经验总结 一、 需求描述 为了满足大数据的增长需求
2021-06-09 23:40:17 409 3
原创 运用MapReduce程序对英语单词出现的频次进行统计
运用MapReduce程序对英语单词出现的频次进行统计一、 前期准备工作(一):在Windows中使用VirtualBox安装Ubuntu二、 前期准备工作(二):三、 配置java环境四、 安装hadoop五、 进行Hadoop伪分布式的相关配置六、运用MapReduce程序进行单词出现频次的的统计(一)上传到HDFS(二)Eclipse相关配置(三) 执行MapReduce的 wordcount程序进行单词统计七、总结 一、 前期准备工作(一): 在Windows中使用VirtualBox安装Ubunt
2020-12-19 01:36:08 504 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人