10 李宇飞(灰哥)

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 10w+

Selenium快速入门之3:10大常用模块方法梳理

一、webdriver模块在selenium中,无论是Firefox Driver、Chrome Driver,还是IE Drive,都继承至selenium\webdriver\remote\webdriver.py中的WebDriver 类。WebDriver类中的常用方法如下。(1)全局操作create_web_element 创建一个html元素close 关闭当前浏览器窗口forward/back 浏览器历史浏览上一次/下一次操作get 在当前浏览器会话页打开指定的...

2020-07-10 00:04:25

Selenium快速入门之2:ActionChains所有行为动作、常用JS操作

一、ActionChains所有行为行为操作selenium中的ActionChains使用链式模型,即可以实现简单的交互行为,例如鼠标移动,鼠标点击事件,键盘输入,以及内容菜单交互。同时也可以完成复杂的类似于鼠标悬停和拖拽等动作。当在ActionChains对象上调用行为方法时,这些行为会存储在ActionChains对象的一个队列里。调用perform()时,这些动作就以他们队列的顺序来触发。例如:ActionChains(driver).key_down(Keys.CONTROL).send

2020-07-09 13:22:08

Selenium快速入门之1:最常使用方法整理

Selenium最早是为了测试浏览器、网页的,但目前也被广泛应用于网络爬虫。本文整理Selenium最常见的使用方法。一、创建webdriver,打开特定页面#打开浏览器、百度网站driver = webdriver.Chrome()driver.get("https://baidu.com")二、设置浏览器大小、设置页面大小driver = webdriver.Chrome()driver.get("https://baidu.com")三、页面前进/后退、刷新..

2020-06-30 23:51:26

解析html:CSS Selector快速了解使用

CSS即层叠样式表,其选择器是一种用来确定HTML文档中某部分位置的语言。html文档是由一系列节点构成的数,例如:<html> <body> <div > <p>Hello world<p> <a href="/home">Click here</a> </div> </body></html>一、html文档的节点类型html文档的节点类型常

2020-06-28 20:29:13

解析html:Xpath快速了解使用

XPath是XML路径语言,它是用来确定xml文档中所部分位置的语言。xml文档(爬虫抓取下来的html也属于xml)是由一系列节点构成的数,例如:<html> <body> <div > <p>Hello world<p> <a href="/home">Click here</a> </div> </body></html>一、xml文档的节点类

2020-06-23 23:42:45

数据分析角度快速了解Python之NumPy库分类用法

对于大部分数据处理,主要集中在以下要点:(1)数据的创建(2)子集构造、过滤、转换(3)数据的整理、清洗(4)数据的统计描述、分组运算(5)数组的常用算法:排序、唯一化、集合运算(6)数据的输入输出本文从上面6个方面,分别介绍Numpy的常见用法。NumPy最重要就是其N维数组对象(ndarray),是一个快速灵活的同构数据集容器,所有元素必须是相同类型。每一个ndarray对象都有一个shape属性(表示维度大小的元组),一个dtype属性(表示数组数据类型的对象)。一

2020-06-11 18:49:28

Python的Requests库的使用实例

一、保存网站图片import requestsr = requests.get("https://img-blog.csdnimg.cn/2020022410223540.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224")with open("a.png","wb") as f: f.write(r.content)二、爬取亚马逊商品页面信息import requestsurl = "https://www

2020-06-06 10:48:41

Python的requests库基础介绍2:常用方法整理,URL参数、各种POST、响应、异常、cookies等

本文总结了requests库基础的常见用法,包括URL参数、各种POST、响应、异常、cookies等。一、传递URL参数为 URL 的查询字符串(query string)传递数据。urlparams = {'key1': 'value1', 'key2': 'value2'}r = requests.get("http://httpbin.org/get", params=urlparams)r.status_coder.request.url二、定制请求头为请求添加

2020-05-29 00:13:24

HTTP认证:基本认证、摘要认证、HTTPS+表单认证

一、HTTP认证认证就是给出一些身份证明,说明你是声称的那个人。HTTP提供了一个原生的质询/响应的框架:(1)客户端请求服务器的某一受保护的资源(2)服务器拒绝提供资源,并向客户端发起质询,询问用户名和密码(3)客户端向服务器传送用户名、密码(4)服务器检验认证成功,将资源提供给客户端二、基本认证(Basic认证)基本认证步骤:(1)客户端请求服务器某一受保护的资源(2)服务器拒绝提供资源,并对客户端进行质询,返回一条状态为401 (Unauthoriz.

2020-05-26 23:35:15

Python的requests库基础介绍1:安装、涵盖所有功能的七大方法

requests库是一个基于python的http库,相比于python标准库中提供了urllib、httplib等,requests库进行了更高级的封装,使得进行网络数据爬取时更加简单。一、requests库安装windows系统,只需要在命令行输入命令 pip install requests 即可安装linux系统下,只需要输入命令 sudo pip install requests 即可安装二、requests库的最主要的七个方法requests 的所有功能都可以通过以下

2020-05-23 00:17:25

做自媒体数据分析的一些工具

官方指数:百度指数:掌握某些关键词的百度搜索动向http://index.baidu.com/v2/index.html#/微博指数:掌握微博热点https://data.weibo.com/index微信指数:掌握某些关键词的微信变动在微信搜索栏,搜索微信指数,进入小程序微信、微博数据分析平台:数说风云:实时、维度全面的微博排行与监控工具。微博、微信运营监控,自媒体全行业分类排行榜http:/social.datastory.com.cn友盟:国内领先的第三方全域数据智能服

2020-05-20 23:48:49

Fiddler对抓包报文修改的五种方法

Fiddler是十分流行好用的抓包工具,通过Fiddler不仅可以查看数据包,还可以对数据包进行修改,进行各种测试模拟。本文介绍五种常见的修改报文数据包的方法。一、直接使用Rules菜单,修改请求伪装客户端单击菜单 Rules -- User-Agents -- iPhone6请求报文User-Agent信息已被修改浏览器显示出来的页面变成了手机版的样式二、下断点,拦截并修改请求报文全局断点:单击菜单栏中的 Rules -- Automatic Breakpoint -.

2020-05-10 13:25:54

PowerBI报告扩容:丰富一页报告内容的几种方法

在做数据分析报告时,往往由于业务太复杂,老板要求又太多,且咱们数据人做报告展示总想面面俱到,导致总觉得一页报告放的图表内涵不够丰富,而设置过多的翻页又会显得很麻烦。针对此痛点,本文介绍几种在PowerBI中,扩容一页报告的方法。一、图表下钻通过图表下钻功能,能在同一个图表中,将同一个种类但层次丰富的数据进行一并展示,大幅节省报告空间。比如要展示部门维度、性别维度、年龄维度的在职员工...

2020-04-26 23:59:49

PowerBI应用案例:杜邦分析图动态观察财务指标

一、背景杜邦分析法利用各个财务指标之间的内在联系,建立财务分析的模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。本文利用PowerBI构建杜邦分析框架图,实现手工动态调整基础收入、费用、资产等,以观察上层的所有者权限报酬率、总资产净利率等指标的变化程度。二、示例数据各项...

2020-04-25 12:17:51

数据分析商业逻辑模型简介(一):AARRR模型、漏斗模型

AARRR模型Acquisition(获取)、Activation(活跃)、Retention(留存)、Revenue(收益)、Refer(传播)1.获取用户(Acquisition)如何获取用户?线上通过网站通过SEO,SEM,app通过市场首发、ASO等方式获取。还有运营活动的H5页面,自媒体等方式。线下通过地推和传单进行获取用户。2.提高活跃度(Activation)...

2020-04-23 23:54:45

数据分析应懂的Linux两三道板斧

由于Linux系统的稳定、便捷、受攻击少等原因,很多平台环境会选择部署在Linux服务器上。在做业务数据分析、数据支撑时,如果不懂得Linux的两三道板斧,容易受到限制。本文总结数据分析相关的最常使用到的Linux操作。linux系统里一切皆文件。 既然要操作文件,那么围绕此核心组织本文,看看文件管理及其周边操作。一、man帮助命令授人以鱼不如授人以渔,先介绍如何查帮助格式:m...

2020-04-22 00:26:06

Power BI应用案例:销售帕累托分析(28法则)

一、应用背景帕累托法则往往称为二八原理,即百分之八十的问题是百分之二十的原因所造成的。帕累托图在项目管理中主要用来找出产生大多数问题的关键原因,用来解决大多数问题。本文利用Power BI进行帕累托分析销售情况,可视化直观找出明星产品。二、示例数据所有产品的销售额汇总数据,包括字段产品货号、类别、零售价、销量、销售额等。三、构建度量值(1)帕累托图需要的度量值...

2020-04-19 16:09:25

SQL开窗函数:格式、示例、PARTITION BY 子句、ORDER BY子句、常用聚合函数

一、开窗函数介绍开窗函数(使用OVER字句定义)用于为行定义一个“窗口”,并使用窗口对行集合进行聚合计算。使用开窗函数后,可以不需要使用GROUP BY子句对数据进行分组,就能够在同一行中同时返回聚合结果。二、开窗函数格式 格式:函数名(列) OVER(选项) OVER 关键字表示把函数当成开窗函数而不是聚合函数。SQL 标准允许将所有聚合函数用做开窗函数,使用 OV...

2020-04-15 13:33:52

SQL的各种SUM,示例看用group by、partition by的实现方式

一、示例数据员工信息表,包括字段有:员工姓名、省份、城市、年龄、薪水CREATE TABLE TMP_Person (PName VARCHAR2(20),PProvince VARCHAR2(20),Pcity VARCHAR2(20),PAge INT,PSalary INT)INSERT INTO TMP_Person(PName,PProvince,Pcity,PAge...

2020-04-14 21:20:27

决策树基本概念梳理及简单应用

一、应用背景当在生活上决定“今天出门要不要带伞”,当在工作上需要分析“这个用户会不会流失”等诸如此类的问题,实际上我们就是在做决策。一般决策我们会这样思考“如果条件是这样这样, 那么我就选择A; 如果条件是那样那样, 那么我就选择B”。这样的思考过程,就与决策树算法的过程相类似。二、决策树概述决策树是一种分而治之,不断分类细化的决策过程。一个困难的预测问题, 通过树的分支节点,...

2020-04-11 09:33:00

查看更多

勋章 我的勋章
  • 签到王者
    签到王者
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。