自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 当前反爬技术和应对方法

当前反爬技术和应对方法

2023-03-25 13:43:05 632 1

原创 python爬虫最新常见面试题

一.项目问题:1.你写爬虫的时候都遇到过什么反爬虫措施,你是怎么解决的2.用的什么框架,为什么选择这个框架(我用的是scrapy框架,所以下面的问题也是针对scrapy)二.框架问题(scrapy)可能会根据你说的框架问不同的问题,但是scrapy还是比较多的1.scrapy的基本结构(五个部分都是什么,请求发出去的整个流程)2.scrapy的去重原理 (指纹去重到底是什么原理...

2018-12-20 09:51:24 1395 1

转载 Python程序员关于爬虫的一些常见面试题

  一些经典的Python爬虫和网络编程面试题,非常实用的,给大家介绍一下!1、动态加载又对及时性要求很高怎么处理?Selenium+Phantomjs 尽量不使用 sleep 而使用 WebDriverWait2、分布式爬虫主要解决什么问题?(1)ip(2)带宽(3)cpu(4)io3、什么是 URL?URL,即统一资源定位符,也就是我们说的网址,...

2018-12-14 17:17:13 366

转载 用Python给项目写一个监控,少了不少麻烦事情

  在公司里做的一个接口系统,主要是对接第三方的系统接口,所以,这个系统里会和很多其他公司的项目交互。随之而来一个很蛋疼的问题,这么多公司的接口,不同公司接口的稳定性差别很大,访问量大的时候,有的不怎么行的接口就各种出错了。这个接口系统刚刚开发不久,整个系统中,处于比较边缘的位置,不像其他项目,有日志库,还有短信告警,一旦出问题,很多情况下都是用户反馈回来,所以,我的想法是,拿起p...

2018-12-13 10:51:13 444

转载 通过5个例子,轻松看懂机器学习中分类算法

1、分类是什么?简单来说,分类就是对事物进行区分的过程和方法。在你眼里乖巧的小明是一个好孩子,同时你也想确保他会在学校做一名“好学生”而不是“坏学生”。这里的区分“好学生”和“坏学生”就是一个分类任务,关于这点,达观研究院可以帮你回答小明的疑问。2、K最邻近 这句话通常来自家长的劝诫,但它透露着不折不扣的近邻思想。在分类算法中,K最近邻是最普通也是最好理解的算法。它的主要思...

2018-12-12 15:29:13 1093

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除