自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL

为了学习机器学习深度学习和文本挖掘方面的知识,需要获取一定的数据,新浪微博的大量数据可以作为此次研究历程的对象一、环境准备 python 2.7 scrapy框架的部署(可以查看上一篇博客的简要操作,传送门:点击打开链接)mysql的部署(需要的资源百度网盘链接:点击打开链接)heidiSQL数据库可视化 本人的系统环境是 win 64位的 所以以上环境都是需要兼容...

2016-08-23 21:45:53 16173 22

转载 win10 64位系统下 python2.7环境 scrapy的部署

需要用的依赖包及部署过程简介前提已经安装好python2.7背景:刚接触爬虫 需要部署scrapy框架,windows下的部署工作对我这种刚接触的菜鸟来说确实挺麻烦的。需要用的资源整合了一下可以为以后需要的同学节省不少时间。相关文件:网盘链接: http://pan.baidu.com/s/1hrL8SFq一、依赖包安装lxml-3.2.4.win32-py

2016-08-09 22:50:16 2518

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除