自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Zengsl233的博客

原创基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL

为了学习机器学习深度学习和文本挖掘方面的知识，需要获取一定的数据，新浪微博的大量数据可以作为此次研究历程的对象一、环境准备 python 2.7 scrapy框架的部署（可以查看上一篇博客的简要操作，传送门：点击打开链接）mysql的部署（需要的资源百度网盘链接：点击打开链接）heidiSQL数据库可视化本人的系统环境是 win 64位的所以以上环境都是需要兼容...

2016-08-23 21:45:53 16173 22

转载 win10 64位系统下 python2.7环境 scrapy的部署

需要用的依赖包及部署过程简介前提已经安装好python2.7背景:刚接触爬虫需要部署scrapy框架，windows下的部署工作对我这种刚接触的菜鸟来说确实挺麻烦的。需要用的资源整合了一下可以为以后需要的同学节省不少时间。相关文件：网盘链接: http://pan.baidu.com/s/1hrL8SFq一、依赖包安装lxml-3.2.4.win32-py

2016-08-09 22:50:16 2518

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Zsky_3 CSDN认证博客专家 CSDN认证企业博客

码龄8年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

1: 原创

130万+: 周排名

98万+: 总排名

1万+: 访问

: 等级

155: 积分

14: 粉丝

8: 获赞

22: 评论

26: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL
樱花的幸福: 你好，请问一下我在运行你的代码的时候，一直说cookies包无法导入，这是为什么呢
基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL
qq_36160948: 您好，我刚开始学习scrapy，想要请问您，scrapy可以实现抓取，新浪微博自定义关键词和时间的高级搜索结果么？就是每次开始新任务之前，定义关键词和时间，再将微博查询的内容采集下来
基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL
qq_36160948: 您好，我刚开始学习scrapy，想要请问您，scrapy可以实现抓取，新浪微博自定义关键词和时间的高级搜索结果么？就是每次开始新任务之前，定义关键词和时间，再将微博查询的内容采集下来。
基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL
大风大风大风: 每次输入验证码之后返回的页面是登录的那个页面是不是意思我验证码输入错误或者是账号密码错误，试了几十次都打印登录的界面
基于scrapy的分布式爬虫抓取新浪微博个人信息和微博内容存入MySQL
KeyError: 请问一下不用proxymiddleware不会被封掉IP吗？

最新文章

提示

确定要删除当前文章？

取消删除