自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(156)
  • 收藏
  • 关注

原创 Excel找到某个指定值的最大或者最小日期/数值

如何在Excel中根据条件查找最早或最新日期?

2022-08-21 20:56:02 8826 1

原创 【python】pandas读取pdf文件

python 读取PDF及其他操作python 读取PDF及其他操作安装使用pdfplumber第三方库直接安装pip install pdfplumber一些常用的方法.extract_text() 用来提页面中的文本,将页面的所有字符对象整理为的那个字符串.extract_words() 返回的是所有的单词及其相关信息.extract_tables() 提取页面的表格.to_image() 用于可视化调试时,返回PageImage类的一个实例import pdfplumberim

2022-04-20 13:50:37 3690 1

原创 错误:PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。“+文件路径“的解决方案

错误:PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。"+文件路径"的解决方案 解决方案:不管是PIL、opencv等python库在open一张图片的时候,我们是不能进行删除操作的,就像错误提示的那样,当前文件被另一个程序使用,解决方法就是加上下面这行代码img.close() #bug修改代码总结:一、以后不管是图像文件还是txt等文本文件,当我们在进行open的时候,一定要记得close掉,甚至还可以扩展到只要使用了open函数,就.

2022-04-20 13:48:18 4393

原创 excel解决日期数据无法正常筛选

为什么日期数据无法正常筛选提问:为什么日期数据无法正常筛选?说明:筛选日期数据时,找不到按日期筛选的选项,比如按月、按周筛选等。无法正常筛选的日期数据,如下图所示。目标效果为:解决解决方案:不必手动一个个修改,借助分列工具可以批量修复,如下动图演示所示。数据-分列-统一格式更换到第三步再改...

2022-04-19 15:34:49 10861

原创 python中pandas关于合并,access、excel合并

参考网址一文搞定Pandas中的数据合并pandas实现两个dataframe数据的合并:按行和按列在实际处理数据业务需求中,我们经常会遇到这样的需求:将多个表连接起来再进行数据的处理和分析,类似SQL中的连接查询功能。pandas中也提供了几种方法来实现这个功能,表现最突出、使用最为广泛的方法是merge。注意:记得重新复制,否则数据无法保存下来,即:data = data.append(xx)...

2022-04-12 12:44:18 2282

原创 python读取文件夹的文件名

python获取当前文件夹下所有文件名【附代码】# 导入os模块import os# path定义要获取的文件名称的目录(C盘除外)path = "E:\工作表格\数据统计\网站日志\日志"# os.listdir()方法获取文件夹名字,返回数组file_name_list = os.listdir(path)# 转为转为字符串file_name = str(file_name_list)# replace替换"["、"]"、" "、"'"file_name = file_nam

2022-04-12 12:04:36 13633

原创 python安装初步内容

原生Python找到python的安装包官网下载:https://www.python.org/downloads/注意:为实现最大库兼容性,不要下载官网最上边的新版程序。推荐安装Python3.6,或3.7如:Windows x86-64 executable installer(Windows32/64位可执行版)安装时候点Install Now,一直下一步即可(add python path也可以选)。注意:安装时要选中Add Python 3.7 to PATH(将Pyth

2022-04-12 11:42:54 247

原创 wps设置默认打开方式

WPS设置为文档的默认打开方式1.右键点击文档弹出菜单,将鼠标移动到【打开方式】选项,跳转到下级菜单,选择【选择默认程序】。2.在出现的对话框中,选择WPS,并勾选【始终使用选择的程序打开此类文件】,点击确定。3.这样文档就使用WPS打开。4.当转到该文件的储存位置上,发现文件已经变成WPS默认的打开类型。...

2022-04-12 10:17:11 5103

原创 Access针对该架构进行的规范, XML验证失败。以下 XML文档行中存在错误:

使用 access 导入表时,报错:针对该架构进行的规范 XML验证失败。以下 XML 文档中存在错误:|。问题背景access以新表方式导入excel表时,在最后一步导入报错Access针对该架构进行的规范, XML验证失败。以下 XML文档行中存在错误:问题解决原因是表名中包含除了 “.xlsx” 之外的点,去掉即可解决方法: 去掉表名中多余的点即可(如下图)...

2022-04-11 16:48:54 5117

原创 Access入门之索引查询

索引和查询索引因为我们经常按特定字段查找或排序表中的记录。所以我们可以通过对字段创建索引来加快这些操作的速度。创建索引后,在表中查找数据时,Access就会在索引中搜索数据的位置,从而提高查找效率。自动创建索引为单字段创建索引无:不创建索引或删除现有索引有(有重复):创建索引,字段中的值可以重复(如销售表中的编码会重复)有(无重复):创建索引,字段中的值不可以重复为多字段创建索引如果同时按照两个或多个字段进行搜索或排序一个多字段索引最多可以包含10个字段主

2022-04-01 22:33:31 4231

原创 复习历届计算机二级EXCEL使用到的基础公式(非最简单那种)和透视表

公式vlookup纵向值对应匹配VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup]0/1/2)近似匹配最后的值不是0,是1IFERROR(value, value_if_error)如果公式的计算结果为错误,则返回您指定的值;否则将返回公式的结果。使用 IFERROR 函数来捕获和处理公式 (公式:单元格中的一系列值、单元格引用、名称或运算符的组合,可生成新的值。公式总是以等号 (=) 开始。)中的错误

2022-04-01 09:20:14 1711

原创 Access入门之基本操作和认识

创建数据库表创建成功导出选择想要的格式即可导入选择一张表-右键导入-选择相应文件-选择导入的方式追加的时候,主字段不能为空,不能重复(重复会覆盖),同时标题数量和位置要相同如果选择了以新表方式导入数据库,在向导中注意主键的选择方式让Access添加是生成新的主键自己选择则不会注意点:导入时文件名字不能带‘.’链接表链接表的作用,就像PowerQuery,当外部数据源变化时,Access中的表也会随之改变链接表无法设置字段格式,如果要更新需要在源表中操作。

2022-03-24 12:00:38 36351 3

原创 Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.

问题背景在使用机器学习线性回归的时候,用数据进行线性回归报错Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.问题解决原因是使用的数据维度有缺失x_tr.shape #(12,)使用np.array和reshape方法重设数组维度即可# 转换数组模式x_tr1 = np.array(x_tr).reshape(-1,1)x_ts1 = np.ar

2022-03-22 14:31:49 6170

原创 python机器学习之模型选择与优化

问题引入炮弹轨迹问题对于以上的炮弹问题,想分析他不用的数据模型以上三种模型对应着3种不同模型情况芯片检测问题根据芯片尺寸1、尺寸2参数识别次品以上三种情况对应着拟合的3种结果模型对数据的预测情况由于模型不合适,致使其无法对数据进行准确的预测解决过拟合和欠拟合问题通常来说,欠拟合可通过观察训练数据的预测结果发现,解决办法可以是:选用其他模型、增加模型复杂度、增加数据样本、采集新的维度数据解决过拟合问题的方法原因:Ø 使用了过于复杂的模型结构(比如高阶决

2022-03-17 21:48:51 3274 2

原创 python机器学习之异常检测与主成分分析

前言根据输入数据,对不匹配预期模式的数据进行识别检测分类监督式异常检测:提前使用带“正常”与“异常”标签的数据对模型进行训练,机器基于训练好的模型判断新数据是否为异常数据无监督式异常检测:通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常检测原理基于数据分布,寻找与其他数据最不匹配的实例,寻找发生可能性低的数据(事件)概率是一个在0到1之间的实数,是对随机事件发生可能性的度量,反映某种情况出现的可能性(likelihood)大小。在连续分布事件中,用于描

2022-03-17 11:28:47 2407

原创 Python 更换安装镜像源pip insatll

参考网址Python pip更换安装镜像源进入上面的网站随机选择一个进行复制pip install 库名 -i 复制粘贴的网址安装成功!

2022-03-11 21:10:19 1300

原创 Could not find a version that satisfies the requirement skimage

问题背景参考网址:安装skimage出错的解决方法问题解决的途径pip安装python包出错:Could not find a version that satisfies the requirement skimage (from versions: )…安装python的skimage库时出错,报错为: ERROR: Command errored out with exit status 1: command: 'c:\users\lenovo\appdata\local\

2022-03-11 15:07:38 3541 2

原创 TypeError: concatenate() got multiple values for argument ‘axis‘

问题背景使用朴素贝叶斯后,想把列值进行合并,使用numpy.concatenate方法时报错:TypeError: concatenate() got multiple values for argument ‘axis‘问题解决原因是有一列是没有列维度值的,需要使用方法添加一下,目标列的基本情况为使用reshape方法进行重置y2_test_predict.reshape(5,1)最后用合并成功!# y2_test_predict没有列维度,需要reshape重置一下test_d

2022-03-06 15:48:23 7561 1

原创 excel 除掉最后一个字

有一列数据,需要删除最后一个字符;在B1单元格输入函数“=LEFT(A1,LEN(A1)-1)”;

2022-01-28 17:32:46 1633

原创 ValueError: Cannot mask with non-boolean array containing NA / NaN values

解决:ValueError: Cannot mask with non-boolean array containing NA / NaN values这里就是说,分组这一列里面,包含了非字符串的内容,比如数字。因为 .str.contains 的使用就要求这个字段必须是字符串,不能掺杂数字的。...

2022-01-28 15:16:46 7387

原创 pandas对某一指定列或行进行修改

pandas 根据某一列的值修改某一列的值问题背景有一列数据,是在整列数据中提取出来的指定行和列的数据,想修改这列数据的值变成其他值问题解决无效写法1 对提取的列直接赋值detail_tstep_group3[detail_tstep_group3.渠道名称 == '广州A组2']['12月数据首单达标情况'] = 7执行代码后会提示使用loc方法而且没有赋值成功无效写法2 提取列之后使用loc方法赋值按照执行代码后的建议,使用loc方法,但我嵌套错了detail_tst

2022-01-26 16:39:43 9307 1

原创 python 异常处理语句 try except

python 异常处理 try except示例1try: date = i.select('.c-abstract') dict['date'].append(''.join(date[0].get_text().split()))except: print('空值') dict['date'].append(''.join('青蛙'))

2022-01-26 16:28:56 428

原创 pandas添加索引列名称

想将索引列的名称也加上,效果如下原來的数据列表结构如下添加代码# 添加索引列名称pay_rate.index.name = '出勤天数'实现效果

2022-01-26 11:08:07 3662 2

原创 python调用方法中return返回的参数

PYTHON-函数的定义与调用,返回值,和参数问题背景写了一个方法,有输出,部分代码如下,但是在使用这个方法过后,直接输出这个返回值会报错问题解决返回的值需要创建一个新的实参来接收才可以,不然无法调用order_quantity1 = order_qt_cal()order_quantity1...

2022-01-26 10:59:50 569

原创 在word中并排放置多个表格

方法1 目前这个方法有点缺点就是要自己的调整位置对齐如何在word中并排放置多个表格

2022-01-26 09:43:06 1075

原创 word 页面分栏

全文分栏word怎么设置单独一页的分栏全文分栏操作的步骤如下:步骤一:打开需要分栏的Word文档,然后选择“菜单栏”的“格式”中的“分栏”;步骤二:在弹出的“分栏”选项框中选择两栏或者三栏等,确定即可。步骤三:当然我们还可以偏左或者偏右点,都可以自己任意设置,而且可以在“宽度和间距”中设置分栏的“宽度”和“间距”,调整适应好按确定按钮即可完成操作。某段落分栏word怎么设置单独一页的分栏  步骤一:顾名思义,某段落分栏就是将文中的某一个段落进行分栏处理,起操作和全文分栏差不多。步骤二

2022-01-26 09:40:52 2630

原创 pandas修改列columns、行index的顺序或名称

Python dataframe修改列顺序(pandas学习)DataFrame修改列名,调整列顺序,调整index修改列顺序重新对整个列的名称进行调整原来数据的列是这样的直接调整,最简单的方法,但如果是多列的话就不太适用了concat_crs1[['by12_in1','by1_in1','by12_in12']]将列取出后赋值给另外一个变量,将原来列删除后,将这一列重新指定位置加进去df_id = df.iddf = df.drop('id',axis=1)df.inse

2022-01-26 09:34:57 4783

原创 pandas 表对行过滤后,在对特定列赋值

pandas df表对行过滤后,在对特定列赋值原表想把这个频数改掉concat_crs.loc[concat_crs.频数 == 0,'频数'] = '均出现'concat_crs.loc[concat_crs.频数 == 1,'频数'] = '12月出现'concat_crs.loc[concat_crs.频数 == -1,'频数'] = '1月出现'修改成功...

2022-01-25 11:54:44 281

原创 pandas读取文件中不读取第一索引列

成功解决pandas读取文件中不读取第一索引列pandas.read_csv()读取csv文件,默认第一列为index(索引)的解决办法修改为如下代码即可使index设为默认从0开始:原本是df = pd.read_csv(fpath,index_col=False )修改为df = pd.read_csv(fpath,index_col=0 )将索引项设置为第0行(从0开始数,0为第一个元素,其实就是第一行)比较详细的解答:pandas.read_csv...

2022-01-25 10:22:56 11835

原创 Excel合并两列中的文本内容

方法1是用函数Excel怎么合并两列中的文本内容方法2是用符号&=TEXT(B2,"0")&" - "&TEXT(C2,"0")

2022-01-25 09:42:26 1875

原创 Excel TEXT函数怎么把数值转换成文本

Excel TEXT函数怎么把数值转换成文本使用text()和&符号合并两个文本=TEXT(B3,"0")&" - "&TEXT(C3,"0")合并效果

2022-01-25 09:40:49 5810

原创 python Matplotlib画图之调整字体大小的示例

python Matplotlib画图之调整字体大小的示例

2022-01-24 17:37:58 3464

原创 ValueError: X has 2 features, but LogisticRegression is expecting 5 features as input.

问题背景用python的sklearn库做逻辑回归模型训练后,用一些数值去预测结果时报错,已知是多项式的逻辑回归模型用的是二阶的边界函数画出来的抛物线代码如下pay1和pay2是用来预测y结果的,函数中的关键θ(用于计算x2)也提取出来了#边界函数参数获取theta0 = LR2.intercept_theta1,theta2,theta3,theta4,theta5 = LR2.coef_[0][0],LR2.coef_[0][1],LR2.coef_[0][2],LR2.coef

2022-01-24 14:49:09 17409

原创 python机器学习之分类预测

计算机自动寻找垃圾信息共同特征在新信息中检测是否包含垃圾信息特征内容,判断其是否为垃圾邮件部分特征:发件人、是否群发、网址、元、赢、微信、免费根据数据类别与部分特征信息,自动寻找类别与特征信息的关系,判断一个新的样本属于哪种类别特征信息以列为单位,行是不同人的信息,输出数据类别(如0是正常,1是垃圾),然后去寻找关系通过股价预测任务区分回归任务与分类任务分类:非连续性判断类别模型输出:非连续型标签(明天股价预测为:上涨)回归:连续性数值预测模型输出:连续型数值(明天

2022-01-19 11:21:28 7070 1

原创 甘特图的制作

Excel 制作甘特图(多图)Excel 2013如何显示图表图例Excel如何在两分钟内制作完整的甘特图 Excel自动生成甘特图步骤

2022-01-17 22:40:47 314

原创 pandas取列值转化为列表

pandas取列值转化为列表list=df['列名'].values.tolist()

2022-01-17 17:44:37 3431

原创 pandas 数据框中显示所有列,行的名称

如何在 pandas 数据框中显示所有列名称?pandas中关于DataFrame行,列显示不完全(省略)的解决办法想将所有行和列展开(不用索引号)pd.set_option('display.max_columns', None)pd.set_option('display.max_rows', None)如果恢复的话,可以改变后面的变量pd.set_option('display.max_columns', 10)...

2022-01-14 14:45:43 1766

原创 ValueError: Found input variables with inconsistent numbers of samples

解决ValueError: Found input variables with inconsistent numbers of samples问题背景使用python的sklearn库进行线性回归时,对x,y的素材进行训练时报错:ValueError: Found input variables with inconsistent numbers of samples部分代码如下:# 自变量(天数)x = np.arange(1,len(detail_tstep_group3[detail_

2022-01-13 17:57:17 13157

原创 帕累托图的制作

二八定律的图表分析——帕累托图如何制作?最重要的部分只占20%,其他80%却是次要的,这就是二八定律。也叫做帕累托法则。

2022-01-12 14:12:26 170

原创 python中pandas获取带最大值的行

如何在Pandas中获取带最大值的行?pandas提取某字段最大值所对应的行recent_date = df['date'].max()df[df['date'] == recent_date]

2022-01-12 11:03:32 5750

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除