- 博客(2)
- 收藏
- 关注
原创 数据分析这个职位有前途吗?--数据预处理(二)
通过前面的文章获取了要分析的取样的数据格式如下,接下来是要对每一列的数据进行分析,并对分析的数据进行数据的处理,通过pandas包对数据进行转换处理,通过matplotlib包对数据有一个直观的图形化显示 1 数据概览 通过dataframe的describe 方法对数据有一个总的印象,对每一列会显示总的数量,去重后的数据数量,数量最多的数据(名称,数量),可以对整份数据有一个总的认识,接...
2018-10-17 11:05:17 766
原创 数据分析这个职位有前途吗?--数据采集(一)
首先我们对数据进行抽样,目前招聘网站比较多,选取其中一个网站(前程无忧),并只是分析一个城市(广州)进行分析,通过scrapy爬虫的框架对招聘的职位进行数据抓取,并导出csv文件。 1. 分析招聘网站的页面数据结构 1.1 职位列表分析 通过网站输入数据分析职位并选择广州地区,跳转到一个职位列表,该列表只有5列数据显示并且是通过分页显示,5列数据不能满足后面分析维度的需要 1.2 职位详情分...
2018-10-17 11:01:07 343
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人