自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

@Python爬虫、帆软报表及大屏制作

@Python爬虫、帆软报表及大屏制作

  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 MySQL数据库命令行操作(2)

– 查询– 查询所有字段– select * from 表名;select * from students;-- 查询指定字段-- select 列1,列2,... from 表名;select name, gender from students;-- 使用 as 给字段起别名-- select 字段 as 名字.... from 表名;select name as 姓名, ...

2019-01-25 15:11:13 193

原创 MySQL数据库命令行操作(1)

– 数据库的命令行操作--启动、停止、重启mysql服务器的命令--启动命令sudo service mysql start--停止服务sudo service mysql stop--重启服务sudo service mysql restart-- 命令行链接数据库-- mysql -uroot -p密码-- mysql -uroot -p-- sql语句最后需要有分号...

2019-01-25 15:10:06 183

原创 scrapy爬虫的一些命令行命令

scrapy爬虫创建项目scrapy startproject 项目名创建一个名为itcast的爬虫,并指定爬取域的范围scrapy genspider itcast “itcast.cn”scrapy crawl 项目名 -------------启动爬虫scrapy-redis分布式爬虫启动项目scrapy runspider 项目名.pyredis-cli -h window...

2019-01-25 15:06:42 1220 1

原创 用一个函数,过滤爬虫抓取数据当中所有的HTML标签

def re_html(self, data):# 替换抓取数据中的html标签try:message = str(data)re_h = re.compile(’</?\w+[^>]*>’) # html标签ret1 = re_h.sub(’’, message)return ret1except:pass...

2019-01-22 16:58:16 974

原创 scrapy爬虫-TB模拟登陆抓取数据

(我用的谷歌浏览器,在淘宝登录页面,按F12键进入检查模式,点击Network,勾选Preserve log,点击登陆,这样就记录下了登陆需要提交的所有参数)-- coding: utf-8 --import scrapyimport reimport jsonimport timefrom tao_bao_data.items import TaoBaoDataItemclass ...

2019-01-02 18:16:12 5300

原创 在服务器上部署爬虫定时运行

1、在合适的地方vim cai_piao.sh 创建并编辑文件#!/bin/shcd /home/python/Desktop/cai_piao_number # 进入到爬虫项目的路径python3 main.py # 运行爬虫项目启动的主函数2.在当前界面输入 crontab -e 点击Enter键进入编辑在每天的21点自动启动运行 /home/python/Deskt...

2019-01-02 17:59:30 1868

原创 从数据库中读取图片链接,用协程gevent将图片下载到指定目录保存

1、链接数据库from pymysql import *# 创建connection链接, 链接数据库conn = connect(host='192.168.79.136', port=3306, database='yi_heng', user='root', password='abc123@2018', charset='utf8')# 获取cursor游标对象cursor...

2018-12-05 13:37:45 195

原创 多特瑞商品信息抓取(scrapy爬虫框架)

1、spider目录下爬虫项目(duo_te_rui.py)-- coding: utf-8 --import scrapyimport refrom Duo_te_rui.items import DuoTeRuiItemclass DuoTeRuiSpider(scrapy.Spider):# 爬虫项目名name = ‘duo_te_rui’# 爬虫允许的域allowed_d...

2018-12-05 13:31:09 216

原创 python基础编程练习

1、for循环生成菱形s = '’for i in range(1, 10, 2):print((si).center(9))for i in reversed(range(1, 8, 2)):print((s*i).center(9))2、python内置函数实现两个列表组成字典a = [‘a’, ‘b’, ‘c’]b = [1, 2, 3]c = dict(zip(a, b)...

2018-12-05 13:15:29 337

淘宝模拟登陆

利用python3以及scrapy爬虫框架编写的淘宝模拟登陆抓取店铺后台数据的一个项目。其中最主要的就是解决了淘宝的模拟登陆问题,为后面数据的抓取提供了很大的方便。

2018-12-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除