自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lanzhen001的博客

搞搞办公自动化,小小数据分析

  • 博客(49)
  • 收藏
  • 关注

原创 使用cv2将图片改为素描图

【代码】使用cv2将图片改为素描图。

2023-09-20 21:02:29 257

原创 查找并删除指定文件夹下包含有指定的关键词的文件(GUI界面)

AI辅助生产窗口代码

2023-09-20 16:38:13 123

原创 notebook写好代码后直接生成PPT报告(html格式)

notebook生成PPT报告

2023-08-23 21:29:03 352

原创 jupyter notebook 插件nbextensions的安装

jupyter notebook nbextensions插件的安装

2023-08-23 21:26:59 2316 11

原创 PDF文件分割合并

PDF文件的分割和合并代码。

2023-08-22 09:00:10 1583

原创 python根据excel数据,基于散点图绘制棋盘图

棋盘图绘制

2023-07-17 22:08:26 502

原创 PPT文件,使用python删除链接

使用python 的pptx模块进行处理,读取文字块,然后再进行判断处理;如下图所示,将PPT文件中的链接进行删除,且不保留链接名。注:如果是批量处理,可以增加一个for循环,遍历文件即可。

2023-07-08 14:23:38 1164

原创 合并文件夹中所有文件,并输出重复的条形码值

每天会生成一个记录文件(文件名按日期yyyyMMdd格式命名),记录文件中记录有条形码的内容,需要合并最近20次的数据,并提取出有重复的条形码。2、根据条件过滤不需要的文件,然后将所有读取的文件使用pandas 的concat函数进行合并;也可以进行最近30天数据的合并,需要修改次数判断为日期判断即可。1、遍历存放记录文件的文件夹,并将获取的文件名进行排序;3、使用duplicated函数判断是否有重复;4、输出有重复的条形码值。

2023-07-06 22:05:55 191

原创 【办公自动化实例】在excel中创建目录后使用python批量生成多级文件夹

在excel中先创建目录,然后使用python批量生成多级文件夹。

2022-07-19 22:05:21 1654 1

原创 【办公自动化实例】使用python将多个excel文件中的多个sheet表合并到一个表内

例用python将多个excel文件中的多个sheet表合并到一个表内

2022-07-05 20:42:04 2584 2

原创 【办公自动化实例】批量提取ppt文件中的文本和表格信息并存入word文档中。

批量提取ppt文件中的文本和表格信息并存入word文档中

2022-03-19 12:53:51 2429

原创 【办公自动化实例】通过openpyxl模块,快速进行数据进度条不同条件的设置

文章目录一、背景二、分析三、实现方法四、代码实现一、背景在一个excel表中,希望实现excel表格中的数据进度条根据不同值的大小,分别绘制不同颜色的数据进度条,以方便快速确定进度的进展情况,如当B字段比A字段值小时,绘制红色数据进度条,反之绘制绿色数据进度条。图例:希望呈现的结果:二、分析手动方式在excel中操作,我们发现,如果想批量设置数据进度条格式,需要的要求是数据是连续相同条件下才可以设置相同的格式,非连续数据并不能快速的完成设置,所以我们需要先将相同条件的数据放置到一起,然后才

2022-02-21 21:50:05 900

原创 【办公自动化实例】需要进行参数管理的文件,使用外置参数表进行存储

文章目录一、背景二、方法:三、整体代码。一、背景手上有一份数据,因参数是不定期的动态更新,所以参数表不能写在代码中,需要一个外置的参数表进行存储。如下图:原始数据中有ABC三个零件,需要判断参数1,参数2 的合格情况。二、方法:可以外置数据库管理、json文件、xlsx文件、py文件进行存储,也方便添加,根据习惯,这里使用json文件进行保存,代码上主要是读取数据时的处理。附:json格式参数表,需要注意的是参数表信息中参数均需要带双引号,防止json解析时出错。三、整体代码。impo

2022-01-26 21:39:34 637

原创 【办公自动化实例】将原始word或excel表中的关键字段匹配上模板字段,然后将模板中相关字段的值更新为原始信息中的数据,实现信息匹配和更新

文章目录一、需求二、思路三、整体代码一、需求在csdn问答中看到这样一个题目,觉得比较有意思,作为实例进行解析和记录。原始数据为word或excel,需要将此原始数据中的产品规格1、产品规格2、产品规格3完全与模板文件一致时,将原始数据中的价格列内容替换掉模板中的价格列内容。二、思路1、读取原始数据,然后用pandas处理;2、处理时可先将原始数据与模板数据进行merge合并,取合并字段为需要匹配的字段;3、合并后,先删除因不是模板文件的数据,因为不是模板文件中的数据,在匹配字段所在列外会有

2021-12-01 23:53:17 965

原创 【办公自动化实例】将txt文件提取后分割后,按照列写入excel中

文章目录图片:

2021-09-13 22:24:54 785

原创 【办公自动化实例】批量创建文件夹,节约时间来摸鱼。

文章目录一、需求二、思路三、整体代码一、需求根据项目需求,需要创建一系列文件夹,用于对文件进行分类存放。二、思路1、在excel文件中,按照如下图示分别设置文件夹层级;2、使用pandas读取excel文件的内容;3、组合文件夹的路径;4、处理异常的数据;5、创建文件夹,并删除不需要的文件夹。生成的例子:三、整体代码import globimport shutildf = pd.read_excel('文件夹目录.xlsx')col = df.columns.tolist(

2021-09-01 22:25:32 179

原创 【办公自动化实例】海量图片处理后插入excel中,一键搞定,加班不存在的。。。

文章目录一、需求二、思路三、整体代码一、需求将文件夹内的图片处理后,添加到excel表格内,这种一般可以用来做信息展示。二、思路1 新建或者打开一个excel文件2 读取图片文件名,不排序3 切割图片(如果做其他处理,也可以继续添加功能)4 将图片按列写入excel文件5 设置单元格列宽注: 代码未作函数归类,添加其他功能时最好是函数封装后调用。三、整体代码from openpyxl import Workbookfrom openpyxl import load_workbook

2021-08-12 21:23:08 239

原创 【办公自动化实例】根据excel表格中的文件清单复制文件

文章目录一、需求二、扩展三、整体代码一、需求根据一个excel表格中的文件清单,从不同文件夹中复制相应的文件到一个新文件夹。二、扩展将shutil.copy修改为shutil.move,shutil.rename,os.remove,可实现移动,改名,删除功能三、整体代码import osimport pandas as pdimport globimport shutilif not os.path.exists('newpath'): os.mkdir('newpath')d

2021-08-02 22:24:15 582

原创 【办公自动化实例】使用python 对excel文件多sheet表进行拆分

文章目录一、需求二、分析及思路三、整体代码:四、效果截图一、需求1 遍历文件夹中的文件,如果excel文件中存在多个sheet,则将这些sheet表拆分处理,分别保存为独立的文件,并存入文件夹中,文件夹名同excel文件名;2 在文件处理过程中,原表中的格式不能改变。二、分析及思路1、遍历文件夹,筛选出文件为excel 的文件;2、由于需要带格式拆分,所以不能使用pandas的方法,由于openpyxl模块不能在不同表间使用copy_worksheet的方法,这里采取先在复制需要拆分出来的she

2021-07-19 21:43:03 2564 6

原创 【办公自动化实例】根据关键词从word文档中提取相关信息并存到excel表格中

文章目录一、需求二、分析及思路三、整体代码一、需求根据关键词,从Word文档里的表格中提取所需要的数据汇总到Excel中,并汇总到Excel中做台帐。二、分析及思路常规表格中,我们一般会通过横向填写或者竖向填写的方式来进行内容的填写,有些单元格还会有合并的情况,如下图所示,通过 python 的 docx 模块,可以完成 word 文档的信息提取:2.1 遍历文件夹中,需要提取的 docx 文件(这里最好是把将要提取的文件放在一个文件夹中)2.2 通过 docx 模块里面的 table 方法,

2021-07-13 23:06:25 3030

原创 【办公自动化】定时任务schedule自动记录程序运行次数

问题:在使用schedule定时运行程序时,需要对程序自动运行的次数进行统计,如何进行计数叠加,未找到特别合适的方法。初步解决方法:将计数部分存入txt文件,然后再读取计算,初步实现最初想法。实现代码:import scheduledef fun_counter(path): with open(path,'r') as f: n = f.read() if n=='': n=0 with open(path,'w') as f: n=int(n)+1 f.w

2021-06-06 12:19:02 539

原创 【办公自动化实例】office文件信息提取至excel及添加路径超链接

文章目录一、需求二、代码说明,写在前面:三 代码主体部分。3.1 文件信息提取.py3.2 格式调整.py一、需求提取docx、xlsx、pptx、pdf文件信息,然后做格式处理,同时设置文件路径的超链接,已方便找文件时可以直接打开文件,其他格式文件未做。二、代码说明,写在前面:2.1 代码获取的信息包括:文件路径、作者、创建日期、修改日期、各文件层级2.2 代码 ‘文件信息提取.py’可以提取文件的信息,未获取的信息留空;2.3 信息只运行一次,如果多次运行,出现重复数据,后续的格式调整代码

2021-05-29 01:15:11 642

原创 mysql和pandas实现表格内容拆分

文章目录需求一 Mysql方法:二 pandas 方法需求 将以下表格内容由1:n,拆分为1:1:原始:处理后:一 Mysql方法:注:部分信息参考博客:https://blog.csdn.net/johnricgtsd8br/article/details/97927842先贴代码: SELECT DISTINCT cid, SUBSTRING_INDEX( SUBSTRING_INDEX( t1.content, ',',b.help_topic_id + 1),',',-1)

2021-03-28 15:53:35 445 3

原创 imbox 操作邮件时遇到的问题

1 最近在使用python imbox模块进行邮件读取时,出现错误:TypeError: cannot unpack non-iterable NoneType object如下图:经过测试,发现并不是代码或者邮箱设置的问题,在获取不同的内容时(如标记邮件),有些是可以获取到信息的,初步判断原因为部分邮件有信息缺漏,也有可能是部分垃圾邮件造成的影响,由于邮件内容较多,并未做进一步测试。2 另外在获取邮件数据时,发现邮件未读信息按时间做排序,但是其他的方法并没有规律,先做记录,未深入测试,从官网上

2021-01-24 00:19:08 1592 8

转载 jupyter notebook修改样式

部分内容转载自:作者: 湫兮出处:https://www.cnblogs.com/qiuxirufeng/p/9609031.html1 安装 jupyterthemes 插件pip install -i http://pypi.douban.com/simple --trusted-host pypi.douban.com --no-dependencies jupyterthemes==0.18.22 安装 lesscpypip install -i http://pypi.douban.

2021-01-05 23:27:58 293

原创 【Matplotlib】2各种图形的绘制

文章目录折线图柱状图饼图堆叠图直方图散点图时序数据的可视化实时数据图,例:图表的多重绘制折线图1 坐标点的展示,线段的颜色宽度,点的包裹颜色plt.plot(x,y,marker='.',markersize=10, color = 'red', linewidth=4,markeredgecolor='blue')2 图示标签plt.plot(x1,y,label = '标签1')plt.plot(x2,y,label = '标签2')# 必须加入下面代码才能显示pl

2020-12-12 18:09:01 198

原创 【Matplotlib】1绘图基本功能

1 中文字体plt.rcParams['font.sans-serif'] = ['SimHei']2 基础图形plt.title('标题')plt.xlable('x轴名称')plt.ylable('y轴名称')plt.plot(x,y)plt.show()3 图形风格plt.style.availalbleplt.style.use('fast')#当图像中没有中文时,可以用动漫风格plt.xkcd()4 图片尺寸plt.figure(figsize=(9,6))

2020-12-12 17:17:12 96

原创 python三角函数与计算器三角函数结果差异

最近练习碰到一个问题,使用python计算三角函数时,结果与计算器计算结果一样,查询了资料发现差异的问题为:python math中三角函数中的数值是弧度,而计算器中的数值是角度通过以下方法可以做确认:计算器计算结果如下:...

2020-12-11 23:09:02 1231 1

原创 【封装小程序】通过关键字搜索文件或文件夹

仅做学习交流使用import osimport globdef search_file(path): n = 1 count_dir=1 count_file=1 while True: search_file = input('输入文件关键词:') for file in os.scandir(): if search_file in file.name: print(f'查找的第{count_dir}个文件夹为>>>>>>{fi

2020-11-22 17:36:33 432 3

原创 在线工具网址

1 有道智云AI:各种AI解决方案http://ai.youdao.com/2 讯飞开发平台https://www.xfyun.cn/

2020-11-12 20:51:52 81

原创 【python基础】重构函数部分解释

class MyStr(): def __init__(self,value): self.value = value# def __str__(self):# return self.value def __add__(self, other): return self.value+other.value**2class MyStr(): def __init__(self,value): self.v

2020-10-25 10:20:37 626

原创 【python基础】字符串对齐,while,for循环问题

文章目录1 字符串的对齐问题2 循环语句的问题3 continue break 在循环中的用法1 字符串的对齐问题使用format方法a = 'hello'print('{:*<11}'.format(a)) #左对齐,不足部分用*填充print('{:*>11}'.format(a)) #右对齐,不足部分用*填充print('{:*^11}'.format(a)) #居中对齐,不足部分用*填充

2020-10-11 14:53:30 1577 1

原创 【python基础】datetime模块的用法

文章目录1 datetime.date(year, month, day)日期格式中常用字符:2 datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0)3 datetime.time(hour=0, minute=0, second=0, microsecond=0, tzinfo=None, *, fold=0)4 datetime.datetime(year, m

2020-10-11 14:45:18 496 2

原创 【机器学习】机器学习收集的一些文章

1、对于英文不好的,首推:中文文档说明这个网站包括有算法说明,函数,代码和一些说明,比较详细2、英文官网:主要查询各参数的说明英文官网 API3、博客园中 唐啊唐囧囧 写的博客机器学习经典算法大全-代码整理(python)...

2020-07-04 19:14:18 111

原创 【机器学习】代码知识点汇总(线性回归)

线性回归features = data[["total_bill"]]tip = data["tip"]from sklearn import linear_modelf = linear_model.LinearRegression(fit_intercept = False)f.fit(features,tip)代码说明:f是在训练模型, fit_intercept = False,是设定y坐标为0, features要用双中括号a = np.array([100]).

2020-06-17 23:27:09 246

原创 【机器学习】代码知识点汇总(特征函数,多项式模型拟合,训练数据和验证数据,正则化,超参数)

多项式回归from sklearn.preprocessing import PolynomialFeaturespoly3 = PolynomialFeatures(degree = 3)x_x2_and_x3 = poly3.fit_transform(arbitraary_data[['x']])代码说明:指定计算所有指数不超过3的 degree =3,将数据转换为一个特征矩阵,如果是具体的数据,.fit_transform() 内可以填写具体的数据,.shape()可以查看特征矩阵

2020-06-17 23:26:43 471

原创 【机器学习】代码知识点汇总(逻辑回归)

这是扩展的,手动计算def mse_loss_single_arg(thetas): x = df["PTS"] y_obs = df["WON"] return mse_loss(thetas[0], thetas[1], x, y_obs)from scipy.optimize import minimizeminimize(mse_loss_single_arg, x0 = [0, 0])代码说明:给它单一变量的函数,它会找到这个函数的最低点逻辑回顾fr

2020-06-17 23:25:46 187

原创 【机器学习】代码知识点汇总(分类和回归)

分类from sklearn.neighbors import KNeighborsClassifiermodel = KNeighborsClassifier(n_neighbors = 5)model.fit(df[['Income','Debt']],df['Status'])代码说明:1、新建一个模型 n_neighbors是指取相邻数据的数量,调整这个数值在合理值时,相应的预测会更准确2、用‘fit’命令,告诉模型根据数据进行拟合,让模型根据Incom,Debt来预测Status,注

2020-06-17 23:24:08 216

原创 【机器学习】seaborn绘图分析

绘制散点图sns.scatterplot(data = df , x = 'Income', y = 'Debt', hue = 'Status')绘制连线图sns.lineplot(income_values, rmodel.predict(income_values.reshape(-1,1)),color = 'palevioletred')绘制带斜率的图,回归模型sns.regplot(x="total_bill", y="tip", data=data)...

2020-06-17 23:23:06 162

原创 【爬虫】爬虫问题收集【持续】

文章目录一、文件导出到本地:1.1、导出为txt1.2、导出为csv二、scrapy2.1 运行命令2.2 导入报错三、网页检查时看到数据,但是写代码时无数据四、获取内容是位数问题五、标签格式问题5.1标签取不全,级别搞错。5.2 所选标签中有乱入的六、网页查找标签时的快捷键7、requests+bs4爬虫时一些细节(整理)一、文件导出到本地:1.1、导出为txt1.1.1 导出时覆盖原有内容:w:清楚原有内容,重新写入a:追加写入1.1.2 文件乱码加入encoding = 'utf-8’

2020-06-12 19:41:13 452

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除