自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

吧唧吧唧吧啦吧啦

吧唧吧唧吧啦吧啦,搞点东西!

  • 博客(15)
  • 收藏
  • 关注

原创 某网站登录授权过程

本文仅用于学习参考,请勿于商用本文不呈现网站链接,仅仅是一个账号记录登录过程,含JS逆向、验证码破解登录展示:点击login,出现验证码。输入验证码,点击login,现登录信息如下。post发送四个请求,账号,密码,验证码,UA,及前三都都是加密的参数JS过程全局搜索 loginseccodeverify 参数很快找到相应加密参数来源第一个加密,AES加密第二个加密,base64第三个加密密码那里就单独多了一个md5加密。当然,还有encryptke.

2021-05-15 16:37:21 844 8

原创 某网站登录授权过程(识别计算验证码)

续上一文:下载验证码:给验证码进行编号,即每个验证码以对应验证码命名(我自己手动命名了200张,后面是一边训练,一边命名)。编写数据集:# -*- coding: utf-8 -*-# @Time : 2021/5/14 11:42# @Author : hccfm# @File : datasets.py# @Software: PyCharmimport torchimport osimport numpy as npfrom PIL import I

2021-05-15 16:26:05 241

原创 谈谈python2与python3

1. __future__:python每次更新时,引入了一些新的模块或功能,那么版本之间会可能会出现版本不兼容问题。__future__ 模块就是为了解决这个问题,它把新功能添加到了这个模块中,可以使用这个模块,进行新功能的测试与使用。例:python2在没有导入包的情况下:# -*- coding: utf-8 -*-# @Time : 2019/12/6 0:...

2019-12-07 18:44:25 4300

原创 glidedsky挑战-图片式反爬(雪碧图)

为了避免某某官方网站,本次记录同样也是 "glidedsky"网站中的反爬虫题目,只要明白,其它网站理论都差不一样。相关网站:http://glidedsky.com/level/web/crawler-sprite-image-1网站截图:打开页面是这样的页面h5参数是这样的简单看了一下页面,请求没有我们想要的数字,只有一些 xxxxsprite的元素。...

2019-10-21 17:36:42 1164

原创 glidedsky挑战-字体反爬2

为了避免某某官方网站,本次记录同样也是 "glidedsky"网站中的反爬虫题目,只要明白,其它网站理论都差不一样。相关网站:http://glidedsky.com/level/web/crawler-font-puzzle-2网站截图打开页面是这样的页面h5参数是这样的蒙蔽中。。。探究过程:这个跟我们需要的0-9个阿拉伯数字有什么关系...

2019-10-20 18:44:36 444 1

原创 glidedsky挑战-逆向JS(jsfuck反爬)

相应网站:http://glidedsky.com/level/crawler-javascript-obfuscation-1题目要求:再看看页面的分析:页面中,没有对应的数据,那么就看看它们是从那里来的。再看看请求,运气真好,一下子就找到了。再看看请求头请求url:http://glidedsky.com/api/level/web/c...

2019-09-15 23:14:50 1620

原创 glidedsky挑战-滑块验证码反爬(腾讯防水墙滑块验证码)

相应页面(http://glidedsky.com/level/web/crawler-captcha-1)题目要求:先看看页面:当我们一打开页面,就是出现滑块验证码页面,我们所要的数字参数是没有的。再看看滑动之后的页面。很明显,当滑块验证通过之后,数字就会出现。再分析滑块验证码图片,如下图,是腾讯防水墙滑块验证码。再抓包看看,如下图,...

2019-08-20 10:54:29 4246 6

原创 glidedsky挑战-CSS反爬

相应页面(http://glidedsky.com/level/crawler-css-puzzle-1):题目要求:再看看页面:分析这个页面的特点:页面显示出来的数据不同 页面中部分显示的数据可能在标签中不显示 页面中出现数字顺序是乱的,不好组合拼接,如第3个字符(346对应634) 页面中,有些字符还出现其它的数字来扰乱数字。然后我们再分析页面...

2019-08-16 17:02:27 791

原创 glidedsky挑战-字体反爬

先推荐一个爬虫工程自我检验网站。http://glidedsky.com/相应页面(http://glidedsky.com/level/crawler-font-puzzle-1):题目要求:再看看页面:很明显,当我们通过请求时,页面压根就不对,其实这里已经把数据隐藏了。说说解决思路吧:找到字体文件 通过数字,找到字体中对应的规则 拼接数字...

2019-08-16 16:05:25 752

原创 python 谈谈可变对象与不可变对象

前言:先说说本文中可能使用到的方法吧,也是常用的!id():返回变量的内存地址;type():返回变量的类型;==:变量的比较(侧重于值);is :变量的比较(侧重于内存);本文可能涉及到内存。可以去看看我的以前写的垃圾文章,或许对您有帮助。https://blog.csdn.net/fm345689/article/details/88385963...

2019-08-02 10:25:32 386

原创 python BloomFilter(布隆过滤器)

简单解释下。bloomfilter:是一个通过多哈希函数映射到一张表的数据结构,能够快速的判断一个元素在一个集合内是否存在,具有很好的空间和时间效率。(典型例子,爬虫url去重)原理:BloomFilter 会开辟一个m位的bitArray(位数组),开始所有数据全部置 0 。当一个元素过来时,能过多个哈希函数(h1,h2,h3....)计算不同的在哈希值,并通过哈希值找到对应的bit...

2019-04-19 01:27:02 4664 3

原创 python实现字符串的倒序(五种)

今天看到一个面试题,说实现一串字符串的倒序。如:“abcde" --> "edcba"使用python的特性 s = "abcde"def str_reverse1(s): return s[::-1]if __name__ == '__main__': rs = str_reverse1(s) print(rs) 使用列表 ...

2019-03-14 20:00:00 31050 1

原创 python元素内存地址分配

前几天在看numpy与pandas时,看到一些数据的存储问题,个人很好奇。然后综合以前的知识与笔记复习一下,个人觉得不错。特来分享一下。。。这里说三种数据的存储:非引用类型,引用类型,类。非引用类型:小整数,如:1,2,3,4,5,6.....在python中,小整数类型都有一个特定的空间,当一个变量赋值时,这个变量会指向它,另外一个变量赋值这个值时,同样也是指向它(这个是废话)。...

2019-03-10 23:43:53 2744

原创 分布式爬虫scrapy-redis

官方github地址: https://github.com/darkrho/scrapy-redis什么是分布式:略scrapy-redis:一个三方基于热点redis分布式的爬虫框架,与scrapy一起使用,使用爬虫具有分布式的功能。 分布式爬虫原理:分布式爬虫一般分两端,一个是服务器端(master),一个是爬虫程序端(slave),master:为爬虫程序服务者,一...

2018-12-19 12:16:12 313

原创 Python copy()与deepcopy() ---深浅复制

深浅复制: 需要导入模块 impoty copy 浅复制 xx = copy.copy(xxx) 深复制 xx = copy.deepcopy(xxx) 在普通数据类型下,深浅复制没有分别 主要区别在于引用类型的数据带有引用类型区别:浅复制只是复制的是对象,而深复制则是...

2018-11-23 22:42:55 265

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除