- 博客(47)
- 资源 (4)
- 收藏
- 关注
原创 Current browser version is 101.0.4951.54 with binary解决
今天在使用python selenium进行爬虫时,突然报错,前2天还正常使用google浏览器自动更新了,需要将chromedriver.exe 也进行更新一下由于浏览器更新到最新版本了,chromedriver.exe没有对应版本,需要将google卸载重新回退到老版本。同时需要关掉自动更新,要不然google安装上去又自动更新了。
2024-04-19 22:13:31 261
原创 Celery使用异步、定时任务使用
Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。Celery的架构由三部分组成,消息中间件(message broker),任务执行单元(worker)和任务执行结果存储(task result store)组成。Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。
2024-04-10 22:13:40 999
原创 第三十二天-Django-ORM模型
目录1介绍2.DjangoORM配置3.类型映射4.模型创建5.模型的元数据模型的代理外键关联关系编辑复合类型6.数据库的curd新增修改删除物理删除7.结果集QuerySet1.返回单挑数据2.总记录数3.链式查询4.模型管理器5.打印sql语句6.查询条件7.多条件查询8.查询优化9.分页查询10.聚合和统计11.F()函数,保证数据一致性12.事务自动提交事务手动提交事务.同步数据库表操作步骤新增字段设置表名称方式1方式2方式3用法1用法2ListView使用
2024-04-01 22:42:06 238
原创 第三十一天-Flask-ORM-sqlalchemy
目录1.什么是ORM2.flask-sqlalchemy1安装2.配置3.数据库模型设计 编辑4.插入修改删除5.查询
2024-03-26 22:40:08 295
原创 第二十六天-统计与机器学习SciPy,Scikit-Leaen
目录1.介绍2.使用scipy1. 安装2.拟合曲线3.随机变量与概率分布4.假设检验5.参数检验3.使用Scikit-Learn1. 机器学习库,建立在numpy,scipy,matplotlib基础上2.包含功能3.安装1.官网:https://scikit-learn.org2.下载3.线性回归模型4.归一化5.标准化6.OneHot独热编码7.非监督学习-聚类算法K-Means8.监督学习-KNN算法9.监督学习-回
2024-03-19 21:03:02 665
原创 1.中医学习-总论
中医的“中”指的是“中道”“中和”的意思,道就是天地之道,就是大自然的规律。中医一直有个核心的观念,就是顺应自然,顺势而为。现在对中西医区别比较流行的说法:中医是哲学,西医是科学。中医是动态的,西医是静止不动的。中医讲的是整体,西医讲的是局部。
2024-03-17 21:53:55 1004
原创 第二十四天-数据可视化Matplotlib
1. 数据可视化相关库1. 官网:http://matplotlib.org2.中文网:http://matplotlib.org.cn。
2024-03-16 23:06:46 1072
原创 第二十三天-数据分析入门实战
**********************计算开始是否开通网络电视(Yes、No or No internetservice)******************************************************计算开始是否开通网络电影(Yes、No or No internetservice)*******************************
2024-03-14 21:43:05 900
原创 第二十二天-Pandas
1. 基于NumPy的工具,为解决数据分析任务而创建的,纳入了大量库和一些标准的数据模型,提供了高效的操作大数据集所需的工具。2.基本上能使用excel或者BI工具进行数据处理,Pandas也都能实现,而且更快3.开源社区:https://github.com/pandas-dev/pandasprint("查看统计摘要",data.describe())查看统计摘要 苹果 小米 华为。
2024-03-13 21:06:10 755
原创 第十九天-分布式爬虫scrapy-redis
1.scrapy框架程2.分布式爬虫将多个主机组合起乱来,完成一个爬虫任务,快速高效的提高爬虫效率3.scrapy-redis框架,优点:1.加快项目的运行速度2.单节点不稳定不影响整个系统的稳定性 3.断点续爬缺点:需要投入大量的硬件资源4.区别:1.在scrapy框架流程的基础上,把存储reqeust对象放到了redis的有序集合中,利用该有序集合实现了请求队列2.并且request对象生成指纹对象,也存储到统一redis中,利用request指纹避免发送重复请求;
2024-03-10 19:14:33 425
原创 第十七天-反爬与反反爬-验证码识别
1. 限制爬虫程序访问服务器资源和获取数据的行为2.限制手段:请求限制,拒绝响应,客户端身份验证,文本混淆,和动态渲染技术等3.反爬虫的分类:1. 身份识别反爬虫:验证请求头信息,验证请求参数,使用验证码等;2.爬虫行为反爬虫:对ip进行限制,使用蜜罐获取ip,假数据等;3.数据加密反爬虫:自定义字体,数据图片,编码格式等;4.爬虫与反爬虫的-攻与防。
2024-03-04 23:31:21 760
原创 第十六天-爬虫selenium库
1. selenium是一个用于web应用程序自动化测试工具,Selenium测试直接运行在浏览器中;2.像真正的用户在操作一样2,驱动浏览执行特定的动作,如点击、下来等操作;3.selenium支持浏览器4.支持的语言5.selenium在爬虫的应用。
2024-03-04 01:54:12 1484
原创 第十四天-网络爬虫基础
1.爬虫(又被称为网页蜘蛛,网络机器人),是按照一定规则,自动的抓取万维网中的程序或者脚本,是搜索引擎的重要组成;比如:百度、2.爬虫应用:1.搜索引擎,2.数据分析,3.人工智能,4.薅羊毛(抢车票)3.常见爬虫产品:神箭手、八爪鱼、造数、后裔采集器4.什么事是爬虫工程师:我们不生成数据我们是数据的搬运工5.爬虫工程师的基础1.python编程基础2.linux系统操作3.http协议4.数据库的增删改查。
2024-02-27 23:11:46 1295
原创 第十二天-邮件发送
标题-测试","html","utf-8"))message=MIMEText("标题-测试","html","utf-8")message=MIMEText("标题-测试
2024-02-25 23:57:08 850
原创 第十二天-ppt的操作
创建ppt文档安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-pptx导入: import pptx使用import pptx#创建一个空的ppt对象p=pptx.Presentation()#选择布局layout=p.slide_layouts[1]#将布局样式添加进去slide=p.slides.add_slide(layout)#保存p.save("demo.ppt")
2024-02-23 23:09:08 867
原创 第十天-自动化办公-word操作
1. 安装:2. 使用:3.使用document获取对象注意只支持.docx 格式 不支持doc#返回word对象documnet_obj=Document(word地址)4. 段落的读取#通过循环每个段落的对象,并调用text5.表格内容的读取#通过循环获取行列的内容,每个表格字段字符串#根据列读取。
2024-02-21 23:38:43 1005
原创 第八天-实战抽奖项目
当前用户:wangmingyang,已有奖品信息:['小狗玩偶', '佩奇玩偶', '电暖风', '小狗玩偶', '热水壶', '热水壶', '佩奇玩偶', '热水壶', '熊猫玩偶', '电脑', '佩奇玩偶', '佩奇玩偶', '电暖风', '小狗玩偶', '小狗玩偶']:创建时间:2024-02-01 23:49:27。恭喜你中奖了,level4中的level3的,奖品为:小狗玩偶。几天没写,是在做demo实战项目,下面进行抽奖项目的介绍;1. 通过json文件存储用户信息、奖品信息;
2024-02-03 00:07:50 310
原创 第七天-正则表达式
w 匹配字符串数字下划线以及unicode字符集: ['h', 'e', 'l', 'l', 'o', 'x', 'i', 'a', 'o', 'm', 'u', 't', 'h', 'i', 's', 'i', 's', 'a', 'g', 'o', 'o', 'd', 'd', 'a', 'y', 'n', 'o', 'w', 't', 'i', 'm', '2', '0', '2', '4', '0', '1', '2', '9', 'd', 'a', 't', 'a']
2024-01-30 00:32:08 765
原创 centos7离线部署trwebocr
1.制作trwebocr镜像,找一个已安装trwebocr的docker镜像;打包trwebocr。由于客户环境是内网,无法连接外网安装依赖,所以下面都是使用内网进行安装;4.将docker注册为service服务;注意此步骤在已有外网环境中安装。3.移到 /usr/bin;2.上传内网服务器,加载镜像。5. 启动docker。
2024-01-29 17:01:49 387
原创 第六天-进程与线程编程
send=multiprocessing.Process(target=work.send,args=("你好",))print("进程返回参数:{}".format(res.get()))print("进程返回参数:{}".format(res.get()))3.在python中定义了一个进程,只会在一个线程中执行,不会寻找有空闲的线程执行;print("执行时间:",(time.time()-nwotime))1.进程池为了避免进程创建过多,照成系统资源不足,可以设置固定数量的进程池;
2024-01-29 01:06:54 794
原创 第五天-模块与文件操作
元组序列化: b'\x80\x04\x95\x15\x00\x00\x00\x00\x00\x00\x00\x8c\x06\xe4\xbd\xa0\xe5\xa5\xbd\x94\x8c\x06\xe5\xbc\xa0\xe5\xb1\xb1\x94\x86\x94.'print("日期转字符串:now.strftime('%Y-%m-%d %H:%M:%S')",now.strftime("%Y-%m-%d %H:%M:%S"))
2024-01-28 15:29:20 844
原创 第四天-Python面向对象与异常处理机制
1. 将信息以报错的方法抛出2.如果不知道抛出那种异常可以使用 raise Exception(message)1. 继承类:Exception。
2024-01-26 16:08:57 793
原创 第三天-Python流程控制与函数
1. 集合(set)是一个无序的不重复的元素序列2.常用来对2个列表进行交并差的处理3.集合支持所有不可变的数据类型,如元组,字符串;列表支持4.使用大括号{}写法:如{"1","2",3}5.与列表的区别6.注意:通过set函数来创建集合,不能使用{}来创建空集合;7.集合无法通过索引获取元素;8.元素无法获取元素的任何方法;9.集合只是用来处理列表和元组的一种临时类型,不适合存储和传输;
2024-01-25 00:00:13 778
Delphi 版 SM3 & SM4 加密解密代码
2021-06-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人