自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(14)
  • 收藏
  • 关注

转载 大数据应用期末总评

作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363前言:  根据之前博客搭的hadoop,对之前爬取出来的数据进行分析。操作:  1.将爬取的数据集abcde.csv展示出来:  2.去掉标题行:  3.对数据集文件进行预处理操作,并生成abcde.txt文件: ...

2019-06-20 14:56:00 85

转载 分布式文件系统HDFS 练习

作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310前言:  搭建hadoop后,利用hdfs文件系统的命令进行文件的上传,下载,操作等。目录操作:  在HDFS中为hadoop用户创建一个用户目录(hadoop用户)  在用户目录下创建一个input目录  在HD...

2019-06-04 21:43:00 115

转载 hadoop作业

作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223一、准备一个ubantu 系统二、创建hadoop用户创建设密码加入sudo权限三、安装MySQL更新软件资源库安装mysql...

2019-05-16 21:32:00 145

转载 爬虫综合大作业

作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159前言:  据课上要求,需爬取数据并生成文章,故选择爬去实习僧的招聘数据进行分析。获取数据:  分析实习僧的地址可知,实习僧的地址组成为“域名”/“类别”/“页数”,此次我们爬取互联网相关的职业,故爬取的地址为:https://www.shi...

2019-05-09 21:48:00 196

转载 爬取全部校园新闻

0.从新闻url获取点击次数,并整理成函数newsUrlnewsId(re.search())clickUrl(str.format())requests.get(clickUrl)re.search()/.split()str.lstrip(),str.rstrip()int整理成函数获取新闻发布时间及类型转换也整理成函数代码展示:...

2019-04-15 21:55:00 146

转载 理解爬虫原理

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2881一. 简单说明爬虫原理  爬虫即是从网络中爬取数据,就python为例,利用requests模块访问网址,将访问后返回的html保存下来,并利用bs4进行分析,将想要的数据保存下来。二. 理解爬虫开发过程1.简要说明浏览器工作原理  从用户...

2019-03-29 17:45:00 133

转载 中文词频统计与词云生成

作业来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822作业要求:1. 下载一长篇中文小说。下载了《粤港澳大湾区发展纲要》2. 从文件读取待分析文本。  text=open('artical.txt',encoding='utf-8').read(); e=''',,.。??!...

2019-03-25 19:40:00 172

转载 复合数据类型,英文词频统计

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753作业要求:文字作业要求言简意骇,用自己的话说明清楚。编码作业要求放上代码,加好注释,并附上运行结果截图。1.列表,元组,字典,集合分别如何增删改查及遍历。列表:增: 1 List = ['python','is'...

2019-03-22 15:01:00 70

转载 字符串操作、文件操作,英文词频统计预处理

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/26841.字符串操作解析身份证号:生日、性别、出生地等。  代码展示#身份证解析print("身份证解析")code=input("身份证号:")province=code[0:2]city=code[2:4]coun...

2019-03-08 17:21:00 91

转载 了解大数据的特点、来源与数据呈现方式

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/26391.浏览2019春节各种大数据分析报告这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993春节人口迁徙大数据报告!http://www.sohu.com/a/293854...

2019-03-04 20:29:00 219

转载 构建之法--界面化的简单四则运算

要求地址:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2213github地址:https://github.com/GVictory/MakeOutQuestionsWithInterface前言:  据课上要求,需要实现一个带页面的四则运算,并实现一定的扩展功能,本程序或许不能称之为一个程序,因为其使用j...

2018-10-24 20:06:00 151

转载 构建之法--简单四则运算

作业要求地址:http://www.cnblogs.com/xiangxuer/p/9695909.htmlgithub地址:https://github.com/GVictory/MakeOutQuestions前言:  上软件工程课中出现了一道例子,即阿超做了一个简单的四则运算用于给他儿子出题,为了练手,将在于此模仿阿超将简单的四则运算做出来,该四则运算为初步版本,仅仅包...

2018-10-10 11:12:00 261

转载 构建之法--初识Git

该作业来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2103GitHub地址:https://github.com/GVictory/softwarEengineering前言:  Git是一个开源的分布式版本控制系统,可以有效、高速的处理从很小到非常大的项目版本管理。使用Git,能够毫不费力的恢复到你...

2018-09-17 21:17:00 72

转载 构建之法---第一次作业

作业的要求来自于:https://www.cnblogs.com/greyzeng/p/9581624.html前言:    大学生需要对自己负责,如今已踏上大三之路,再过一年就要出去实习,回想之前的日子,着实有点浑浑噩噩过日子,不能说学的都不懂,而是学的不精。作为一个优秀的大学生,应当认真的听听课,并积极的参与到课堂中。正如http://www.scalerstalk.com/...

2018-09-09 20:45:00 98

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除