python学习笔记-CSDN博客

原创原生爬虫

from urllib import requestfrom io import BytesIOimport gzipimport re#断点调试：F5：进入断点调试 F11：单步执行程序 F5:跳到下一个断点 F11:进入到函数内部 class Spider(): url = 'http

2020-11-16 23:07:11 114

1、豆瓣网美剧电影评分爬取from parse import parse_urlimport jsonclass DoubanSpider: def __init__(self): self.temp_url = "https://movie.douban.com/j/search_subjects?type=movie&tag=欧美&sort=recommend&page_limit=20&page_start={}" def ge

2020-11-15 21:40:28 297

原创数据提取方法

##数据提取方法##json-数据交换格式，看起来像python类型（列表、字典）的字符串-使用json之前需要导入（import json）-哪里会返回json的数据-浏览器切换成手机版-抓包app-json.loads(“json字符串”)-把json字符串转化为python类型-json.dumps-把python类型转化成json字符串-json.dumps({“a”:a})-json.dumps(ret,ensure_ascii=False,indent=2) -ensu

2020-11-15 21:36:42 291

原创 requests模块学习笔记

1、request模块的徐诶西安装：pip install requests###发送get、post请求、获取响应–response = requests.get(url) #发送get请求，请求url地址对应的响应–response = requests。post(url, data={请求的字典} ##发送post请求###response的方法-response.text-该方式往往会出现乱码，出现乱码使用response.conding=“utf-8”–response.conte

2020-11-15 21:35:34 338

原创 python爬虫基础知识与软件准备

1、什么是爬虫爬虫就是模拟客户端（浏览器）发送网络请求，获取响应，按照规则提取数据的程序模拟客户端（浏览器）发送网络请求：照着浏览器发送一模一样的请求、获取和浏览器一模一样的数据2、爬虫的书去哪儿呈现出来：展示在网页上，或者展示在app上进行分析：从数据中寻找一些规律3、需要的软件和环境python3-基础语法(字符串、列表、字典、判断和循环）-函数（函数的创建和调用）-面向对象–编辑器：pycharm–浏览器：chrome-----分析网络请求用4、浏览器的请求–url-在c

2020-11-15 21:30:39 144

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_37064025的博客

原创原生爬虫

原创 python爬虫小案例

原创数据提取方法

原创 requests模块学习笔记

原创 python爬虫基础知识与软件准备

空空如也

空空如也

原创 原生爬虫

原创 python爬虫小案例

原创 数据提取方法

原创 requests模块学习笔记

原创 python爬虫基础知识与软件准备

空空如也

空空如也

原创原生爬虫

原创数据提取方法