- 博客(5)
- 收藏
- 关注
原创 python爬虫破解验证码的两种方式(selenium和后台js破解)
第一种方法通过selenium破解登陆问题:视频教学:https://www.bilibili.com/video/av66011301/爬取网站:http://58921.com/目标爬取:‘2019年内地票房排行榜’当爬取到第三页时问题就来了:必须通过登陆才能访问到后面的数据1.pip install selenium2.百度搜索 “Chormedriver” 链接"ht...
2020-03-28 23:03:04 4555 2
原创 【无标题】
第三步:在Oracle安装目录下找到NETWORK文件夹,然后将整个NETWORK文件夹复制到D:\app\product\instantclient_11_2文件夹里,以我的为例:放在D:\app\product里,即:D:\app\product\instantclient_11_2;(以我的为例:我的NETWORK文件夹在如下目录里D:\app\product\11.2.0\dbhome_1)如果下成了64位的还是会出现同样的问题,问题并不能得到解决。
2023-05-11 15:57:06 125
原创 动态网站返回json数据乱码问题
我们有时候会爬取动态网站时候需要返回json数据例如这样的数据:但是有时候返回的数据是乱码,比如这样的:首先我们能够想到的是不是自己没有转为utf8response.enconding = 'utf8'是把数据转为utf8格式的文本response.text.encode("utf8")是把文本里的数据转为utf8两种转换又先后之分,一种是在数据返回时就转为utf8...
2020-04-01 21:59:39 473
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人