自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据分析实战二:爬取淘宝商品详情页进行分析

对淘宝商品信息进行数据分析项目流程:1、数据获取2、数据清洗3、数据分析与可视化数据获取(爬虫)因为淘宝数据是通过动态加载的方式显示的,所以采用selenium模拟浏览器操作爬取商品页详情信息。爬取关键词为零食打开淘宝搜索页,输入关键词后观察前后几页的网址变化,会发现一个规律url=“https://s.taobao.com/search?ie=utf8&initiati...

2019-09-27 15:37:17 2749

原创 数据分析实战

招聘网站的数据分析1、数据获取(爬取有关大数据职位的信息)2、数据清洗3、数据分析4、数据可视化流程图:数据获取mysqlhdfs和hivehive+python离线批处理,spark实时流处理数据清洗数据分析数据可视化数据获取(python爬虫)嗯。。。。。因为python语言丰富的第三方库,所以本次是利用python编写爬虫,爬取网页数据。主要代码// An highlig...

2019-08-10 18:58:35 1378

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除