自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Ajax之xhr数据请求(基于Node.js平台)

 什么是Ajax?Ajax 即“Asynchronous Javascript And XML”(异步 JavaScript 和 XML),是指一种创建交互式网页应用的网页开发技术。Ajax = 异步 JavaScript 和 XML(标准通用标记语言的子集)。Ajax数据请求方式的特点:1.客户端可以发送数据到服务端2.客户端可以接收并解析服务端传过来的数据3.可以对...

2018-09-03 20:19:56 2744 1

原创 Node.js基础篇

 一:下载、安装及  重启电脑下载地址:https://nodejs.org/en/download/选择合适的版本下载,安装的话就是一直下一步,这里就不过多阐述了安装完成后进入终端查看是否安装成功:win+r >>> cmd >>> node -v或者:win+r >>> cmd >>> no...

2018-08-29 21:19:14 531

原创 Python中爬取网页的几种方法

爬虫是Python语言最基本的用法之一,爬虫的前提就是数据请求,数据请求方法就urlopen和requests这两种比较常用,而两种方法大同小异,具体我们通过代码来看看 urlopen方法urlopen分为两种情况:一:请求网址中没有中文from urllib.request import Request,urlopendef url_urlopen(self): ...

2018-08-23 22:38:04 1469

原创 Python之分布式爬虫

什么是分布式爬虫?通俗来讲,分布式爬虫就是多台机器多个spider对多个url的同时处理操作,分布式的方式可以极大提高程序的抓取效率 分布式爬虫一般要配合redis数据库使用,原因有3点:(1)redis数据库可以共享队列(2)重写Scheduler,让其无论是去重还是任务都去访问共享队列(3)为Scheduler定制去重规则redis数据库的安装和使用见下文 ...

2018-08-14 10:15:48 1211

原创 如何用Python发邮件

今天来教大家如何使用代码来发邮件,可以直接封装成方法,方便快捷,就以163邮箱和qq邮箱为实例  一、申请邮箱POP3/SMTP协议的授权码这里说一下为什么要申请这个东西?授权码多用于第三方登录,我们使用代码发邮件时,设置的密码不是登录密码,而是这个授权码一定要记好这个授权码,尽量保存到自己的邮箱或记事本中(1)qq邮箱进入邮箱 >>> 设置 &g...

2018-08-11 14:56:36 661

原创 MySQL的下载与安装

MySQL,一种非常实用的小型数据库,受到很多人的青睐。 MySQL下载:这里废话不多说,直接上下载链接:https://www.mysql.com/downloads/选择Community(左起第二个),然后选择MySQL  Workbench之后点下载即可 MySQL安装:1.双击打开安装包,接受协议,然后Next2.选择默认选项,然后Next这里解释...

2018-08-09 22:29:10 276

原创 Python之PhantomJS

PhantomJS简介:(1)一个基于webkit内核的无头浏览器,即没有UI界面,即它就是一个浏览器,只是其内的点击、翻页等人为相关操作需要程序设计实现。(2)提供javascript API接口,即通过编写js程序可以直接与webkit内核交互,在此之上可以结合java语言等,通过java调用js等相关操作,从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。...

2018-08-09 21:08:10 4862

原创 Python3之数据库(以SQLite为例)

今天,我们主要来学习数据库的创建和操作,在学习数据库之前,我们首先要知道为什么要使用数据库数据存储可以分为3种类型:1.把数据存储到内存中   优点:使用方便   缺点:程序关闭的时候,内存被释放,数据随之消失2.把数据写入到文件中   优点:数据是永久性的,不易丢失   缺点:需要经常打开关闭文件,操作比较麻烦3.把数据存储到数据库中   优点:永久存储,操作...

2018-08-02 20:46:04 4453 2

原创 Python之Scrapy框架的安装和使用

Scrapy框架是目前Python中最受欢迎的爬虫框架之一,那么我们今天就来具体了解一下Scrapy框架什么是Scrapy框架?     Scrapy是一个快速、高层次、轻量级的屏幕抓取和web抓取的python爬虫框架Scrapy的用途:     Scrapy用途非常广泛,主要用于抓取特定web站点的信息并从中提取特定结构的数据,除此之外,还可用于数据挖掘、监测、自动化测试、信息...

2018-08-01 22:07:31 24160 8

原创 如何在Python中创建Excel表格

之前在学习os模块中,我们知道了如何创建一个txt格式的文件(具体操作见https://mp.csdn.net/postedit/80903024) 但是当我们爬取一些小说或一些图片时,我们需要分类管理这些数据,这时候文件似乎无法直接描述出这些数据的关系,那么我们就需要创建一个Excel表格了 创建Excel表格一般有两种方法:一:通过导入xlwt库来创建,这种是最常规的方法,...

2018-07-31 21:24:56 52305 4

原创 Python之字符串操作

字符串是一门语言中最常见也是最常使用的一种变量类型,所以我们要熟练掌握字符串的各种操作 以下面这段字符串为例:strNow = '我最近运气很好,补给5发3紫 Good Luck'(1)获取某个索引位置的字符串# 找到索引为5,10,15的字符print(strNow[5]) # >>> 很print(strNow[10]) # >&g...

2018-07-30 21:11:11 631

原创 Python之自动化测试工具selenium

今天来介绍一下selinium的安装和使用 对于程序的测试一般有四种方法:手动测试,自动测试,白盒测试和黑盒测试而selenium就是一个自动化测试工具 selenium在python中的具体作用为:1.selenium可以完全模拟浏览器操作,并对动态数据进行获取2.当有些数据需要登录才能获取,那么selenium只需要得到账号密码就可以代替人工登录 selen...

2018-07-30 19:42:43 2533

原创 Python之正则表达式

正则表达式是一个特殊的字符序列,判断一个字符串是否与某种模式匹配在python中,re模块拥有全部的正则表达式功能正则表达式模式字符在正则表达式中,特定的元素代表特定的含义,这里举例一些常用的元素^ 匹配字符串的开头 $ 匹配字符串的结尾 *  匹配0个或多个字符 +  匹配1个或多个字符 ?  匹配0个或1个字符 {n,m} ...

2018-07-18 21:41:20 164

原创 Python中常见的错误类型总结

1.SyntaxError 语法错误这个错误很常见,没什么好说的,根据系统提示好好检查代码2.类型错误,常见的是字符串和数字直接拼接在一起name = '小刘'age = 17print(name + "今年"+ age)TypeError: must be str, not int字符串只能和字符串拼接3.索引错误list1=['a','b','c']print(list1[5])Ind...

2018-07-10 21:56:07 3709

原创 Python中函数的几种基本形式

函数的创建和使用是计算机语言中最常用最基本的程序,那么今天就来讲解一下python中函数的几种基本形式,所有的方法创建都会属于这几种模板函数的定义:计算机的函数,是一个固定的一个程序段,或称其为一个子程序,它在可以实现固定运算功能的同时,还带有一个入口和一个出口,所谓的入口,就是函数所带的各个参数,我们可以通过这个入口,把函数的参数值代入子程序,供计算机处理;所谓出口,就是指函数的函数值,在计...

2018-07-04 20:22:20 1131

原创 如何在Python中实现对文件的操作(以OS模块为例)

OS操作os:全称为 operation  system操作系统,os模块可以获取电脑的相关信息,有很强大的文件及文件夹操作能力操作文件夹的时候要先引入os模块,import os 一、获取当前文件和父文件路径查看参数路径中的文件是否存在注意:计算机默认的路径分隔符为\        python中的路径分隔符为/,  两者正好相反print(os.path.exi...

2018-07-03 20:51:24 345

原创 Python之时间处理

一.关于时间几种常用的处理方法(time包和datetime包)(1)引入time包,import time1.获取从1970年到现在的秒数,至于为什么从1970年开始这里就不过多阐述了(我不会告诉你其实我也不知道)timeLine = time.time()print(timeLine)输出结果:1530530746.2807066这串数字的意思是这样的:小数点前代表...

2018-07-02 21:09:01 425

原创 Python中列表、元组和字典的相关操作

一.列表列表:相当于一个容器,用来存放对象,变量或者另些列表等内容(1)创建列表的方法list1 = []list2 = list()(2)遍历列表list1 = [('今天', '天气很好'), ('123', '456'), ('abc', 'xyz')]for x in list1: print(x)输出结果:  ('今天', '天气很好')   ...

2018-06-30 10:26:38 289

原创 Python中for循环和while循环

for循环和while循环是python中仅有的两种循环,今天就来讲一下这两种循环的用法for循环(1)Python中for循环在形式上与其他语言有较大的不同,以下是C#中for循环和Python中的for循环C#的for循环:for(int i = 0;i<10;i++){}Python的for循环(for  in 结构):for i in range(0,1...

2018-06-27 19:55:10 5156

原创 Python之变量类型和if判断

Python基础1.数据类型(举几个最常用的)整数型(int),可以理解为不带小数点的数字,比如13,-456等浮点型(float) ,带小数点的数字,比如456.13,-798.13等字符串(string),用'',"",'''  '''或者"""  """包裹的任意文本,比如'132',"abc"等,                      如果输入的文本中包括''或者".

2018-06-26 21:19:16 5153

原创 如何安装Anaconda

Anaconda简介:使用PyCharm必须要安装Anaconda,以下是安装步骤:1.双击打开安装包,然后一直点击Next,第二个界面选just me,我手点快了,所以这里就不截图了,然后点到需要设置安装路径为止2.修改安装路径,尽量和PyCharm路径保持一致,为了区分PyCharm我们可以新建一个Anaconda文件夹,并把这个文件夹设置为安装路径,之后点击Next3.当进入下面这个界面时,...

2018-06-25 19:52:45 926

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除