自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (1)
  • 收藏
  • 关注

原创 python selenium环境安装及配置 python中selenium安装

下载完成后,解压该zip文件得到chromedriver.exe文件,将chromedriver.exe放置在python安装目录的Scripts中。修改executable_path参数值(chromedriver.exe所在路径),启动以下脚本,若浏览器自动打开并访问百度首页,说明启动成功。(2) 查看chrome浏览器版本 ( 输入网址:chrome://settings/help)安装完成后,使用如下命令查看是否安装成功(出现selenium版本等信息表示安装成功)

2024-03-27 16:12:28 356

原创 批量截掉MP3文件的固定时间的python代码(亲测贼好用哦)

有这么一个需求,就是听某个系列的讲课,每个课程前都有101秒的前奏介绍,每一次听的时候都要忍受这101秒的时间,既然学了python ,就把它解决掉。话不多说,上代码干货!关于配置AudioSegment模块,这里不多说明,请自行搜索其他相关文档。

2024-01-19 06:30:01 399

原创 用python生成二维码,想生成啥内容都可以啦(亲测好用的代码)

【代码】用python生成二维码,想生成啥内容都可以啦(亲测好用的代码)

2023-10-07 06:07:38 256 1

原创 Sublime Text3配置:在可交互环境下运行python快捷键(亲测可用!)

在已经安装了包管理器的前提下(如果没有安装可以看这里的”安装包管理器”部分),按ctrl+shift+p快捷键呼出一个输入框,输入Install Package,回车,在新出现的输入框里输入SublimeREPL,在下面的选择列表中选中回车就会开始安装,一般几秒钟就能装完。在刚刚的python文件的界面里点击上方菜单栏的tools->sublimeREPL->python->python run current file,这时候就像IDLE一样,会弹出一个新的窗口,而且是可交互的,可以输入。

2023-10-07 05:54:41 415 1

原创 python https请求报错:SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]

python爬虫,使用requests库发送https请求报错:SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]解决办法:凡是requests的参数内添加如下代码:import loggingimport requestslogging.captureWarnings(True) # 去掉建议使用SSL验证的显示header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW

2022-05-25 04:01:15 724

原创 python爬取微信中视频学术会议(m3u8->ts->mp4)

近年来,视频各行各业学术会议百花齐放,有许多会议是基于微信链接的网页的,只要用微信登录,就可以在电脑中播放。只要在电脑中能够播放,无明显加密,就可以用强大的python把视频片段按照次序下载下来,对于有价值的学术视频会议,值得下载于电脑本地,长期保存学习。比如说,有这么一个学术会,把链接转发到微信助手中,在电脑网页中打开;需要扫码的,就扫码登录。点击第一个视频:在抓包调试中找到xhr中的m3u8文件:双击下载到本地,就可以得到:把m3u8改为“txt”,然后用txt程序打开浏览是这样:

2021-11-20 22:09:03 878 1

原创 用you-get多线程批量下载视频片段ts,然后合成mp4,尤其适合会员可回放视频哦……

import osimport threadpool '''用you-get多线程批量下载视频片段ts,然后合成mp4,尤其适合会员可回放视频哦……'''def download(i): try: print('正在多线程下载:',i) # https//v.docbook.com.cn/a30acb0643f74f4086744201430f9319/45a182e637484c13aae7525138b18838-20c73b5d506ab1a81a9

2021-11-20 07:36:12 1722

原创 python多线程截取音频文件片段,输出指定比特率的mp3文件,很好用

比如,有许多mp3文件,每个文件前都有一段固定时间长度的广告,我想把讨厌的广告批量处理掉,然后在另外一个文件夹内批量的生成指定比特率的mp3文件,我该怎么办?完成后,生成转换后的文件夹。经苦心研究,得出以下程序。来,上才艺!from pydub import AudioSegmentimport osfrom multiprocessing import Pool def worker(filename):###定义工作函数 try: path = r'D:\\桌

2021-11-03 22:17:50 720

原创 知乎思维导图半爬虫(含去重、过滤非法字符功能)

知乎思维导图半爬虫(含去重、过滤非法字符功能)import requestsimport reimport osimport timeheaders = {"User-Agent":"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}def filename_filter(title): ''' windows系统中文件

2021-05-26 11:01:55 155

原创 word VBA自动产生绚丽多彩的文字(很好玩儿的功能,亲测有效)

最近在玩儿word VBA,接触一门新的脚本语言,可以让word和excel办公自动化,使办公技能如虎添翼。比如这儿有段文字:在VBA程序窗口中写入以下代码:Sub color_words()Dim n%, cht As RangeFor n = 1 To Selection.Characters.Count ActiveDocument.Characters(n).Font.Fill.ForeColor.RGB = RGB(Rnd * 255, Rnd * 255, Rnd * 255

2021-05-15 20:16:52 582

原创 you-get多线程半爬虫(可以下载视频、音频)经典好用!

什么叫“半爬虫”呢?这是我自己给这类小爬虫的命名。比如,有的网站,是动态渲染的,你只需要主页面的部分代码,不需要大动干戈的再用selenium测试一番,只需要在浏览器抓包“检查”中,把需要的代码范围的上一层复制一下,保存在本地txt(utf-8编码)中,然后用本爬虫解析就可以啦!比如,我要下载《小猪佩奇》的241-250集(http://tv.sohu.com/s2015/fhzxm/),就只用把相应范围的代码复制到本地,在用本爬虫解析就行啦!这是本地文件:需要的局部html代码为:<u

2021-04-30 18:19:25 714 1

原创 World中利用宏命令批量删除页眉和页脚(亲测好用!)

Sub 批量删除页眉页脚()'' 批量删除页眉页脚 宏''Dim myDialog As FileDialog, oDoc As Document, oSec As Section Dim oFile As Variant, myRange As Range On Error Resume Next '定义一个文件夹选取对话框 Set myDialog = Application.FileDialog(msoFileDialogFilePicker) Wit

2021-04-28 10:32:09 1234

原创 用word宏命令批量修改图片尺寸大小(亲测好用!)

wSub setpicsize() '设置图片尺寸Dim n '图片个数On Error Resume Next '忽略错误For n = 1 To ActiveDocument.InlineShapes.Count 'InlineShapes 类型 图片ActiveDocument.InlineShapes(n).Height = 27.31 * 28.35 '设置图片高度为 27.31cm'1cm等于28.35px(像素)ActiveDocument.InlineShapes(

2021-04-28 09:45:59 6377

原创 歌谱简谱网的小爬虫,用着贼爽!

歌谱简谱网的乐谱,一个一个下载感兴趣的歌谱图片费时费力,没有效率,很不痛快。干脆弄条爬虫,喜欢哪首乐谱,就把乐谱所在的网址粘贴进去,就行啦,爬虫帮你自动建立文件夹下载到本地,用着贼爽!网站地址:http://www.yidianqiuxun.com具体代码如下:import reimport osimport requests'''使用方法:代码复制到py文件中,保存,关闭,双击键入感兴趣的乐谱网址,即可下载网址主页:http://www.yidianqiuxun.com学到的技能

2021-04-21 15:54:54 276 2

原创 python中定义函数,输出元素最多的列表

有多个列表,如何定义函数,返回所含元素最多的列表(或返回长度最长的列表)。搜遍全网,没有找到现成的,绞尽脑汁,定义了一个函数,有点暴力,不过还挺好用,分享出来。# 定义函数,比较多个列表的长短,并返回最长的列表def max_list(list1,list2,list3): list_all = [list1,list2,list3] max_num = max(len(list1),len(list2),len(list3)) for listx in list_all: if len

2021-04-20 18:42:43 535

原创 python创建文件时去掉非法字符

1.函数作用windows系统中文件名不能包含 \ / : * ? " < > |想要创建必须过滤掉这些字符2.函数实现import re def filename_filter(filename): filename = re.sub('[\/:*?"<>|]','',filename) return filename

2021-04-19 19:08:42 230

原创 B站多线程爬虫,简单好用

import osimport threadpool '''bilibili 视频批量多线程下载'''def download(i): try: print('正在多线程下载:',i) os.system(r"you-get https://www.bilibili.com/video/BV1ps411F7T7?p=" + str(i)) except: print('error ' + str(i)) name_list =

2021-04-15 15:10:23 110 1

原创 公众号文章爬取(马家驹文章)

import requestsimport re'''公众号文章爬取,重要知识点:1.用re.match方法来删除无用的文段。2.不用selenium,而用element复制存为txt文件的办法,来获取临时的网址列表。'''with open('majiaju.txt','r',encoding='utf-8') as file: txt_list = file.readlines() txt_album = ''.join(txt_list) # print(txt) # ..

2021-03-12 18:49:15 175

原创 爬取新东方网的某课程答案文本,生成新的html文件

import requestsimport re'''爬取新东方网的某课程答案文本,生成新的html文件,便于在word中编辑。重要知识点:1.万能解码代码2.re.S匹配模式的使用如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始。而使用re.S参数以后,正则表达式会将这个字符串作为一个整体,在整体中进行匹配。'''url_album = 'https://nce.koolearn.com/20150409/782593.html'headers =

2021-03-11 13:07:33 306 1

原创 爬取百度百科冷僻药物,自动生成简易说明书

用utf-8编码,保存以下冷僻药物到同目录下的txt文件中,双击py文件就可以自动生成简易说明书。巴特日七味丸绿袍散茵陈五苓糖浆脑灵素胶囊槐耳颗粒小儿珠珀散黄藤素软胶囊灭菌结晶磺胺草酸艾司西酞普兰片炔雌醇环丙孕酮片阿昔莫司胶囊苹果酸氯波必利片翘栀牙痛颗粒双环醇片氟米龙滴眼液昆仙胶囊当归龙荟片硒酵母片吡哌酸片汞溴红溶液(红药水)吡诺克辛滴眼液依巴斯汀 美辛唑酮红古豆醇酯栓硫酸羟氯喹片 关节炎骨化三醇胶丸 骨质疏松茴三硫片铝镁二甲硅油片氨糖美辛肠溶片L-

2021-03-10 18:14:47 238

原创 懒人听书爬虫(爬到了音频地址,却总是失效,却不成功)

叹服人家的加密做的成功!from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.action_chains im

2021-03-10 17:51:16 866 3

原创 用Python制作的文件批量替换、重命名利器,极其好用!

比如test目录下有这几个文件,含有“test123”,如果想更换成demo,怎么办呢?如果文件有1000,10000,怎么快速解决呢?在网上搜索了好些教程,很不好用,既然学了Python,为什么不尝试编写一个呢!秉承着程序猿的懒人精神——Don`t repeat yourself!(拒绝重复!),遂编写了以下Python文件,只要将此文件拷贝到要修改的文件夹下,双击,输入要替换的字符,以及...

2019-07-27 09:26:59 345

喜马拉雅音频爬虫神器2021年最新版.py

双击py文件后,粘贴入喜马拉雅专辑网址,即可在当前目录下建立本专辑的文件夹,并按顺序编号下载音频文件。每一块代码都有详细注释,尤其适合初学者练习。经典好用!

2021-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除