- 博客(8)
- 资源 (14)
- 收藏
- 关注
原创 七、基于python创建一个和已有dataframe相同columns的空白dataframe
说明:创建一个和我们已有的数据文件相同columns的dataframe。1、导入数据import pandas as pdimport numpy as npdata = pd.read_excel(filepath)#filepath为文件路径名data.head(3)#查看数据前3行显示结果:2、创建一个和data相同columns的dataframedata1 = pd.DataFrame(columns = data.columns.to_list())data1显示结
2020-09-19 20:21:50 1588
原创 SQL面试必备50题(超详细步骤讲解)
注:#比较难的题目–12,19,22,24,25,42,46(基于oracle编写),其余题目均是基于mysql。1.首先说明几个表的关系如下图所示。一共四个表student、score、course、teacher。其中student表中有字段s_id,s_name,s_birth,s_sex;score表中有字段s_id,c_id,s_score;course表中有字段c_id,c_name,t_id;teacher表中有字段t_id,t_name;各表两两相互关联。2.建立数据库与表需要的同
2020-09-03 15:27:33 727 1
原创 六、将数据写入Excel的不同sheet(基于python)
在数据分析的过程中经常会遇到需要将需要将大量excel文件处理后保存到同一个Excel的不同sheet。但大多数情况下,我们保存的sheet会覆盖上一次保存的结果,本节分享一个比较好的方法实现保存到不同的sheet。from openpyxl import load_workbookwriter = pd.ExcelWriter(file_path,engine='openpyxl')#file_path为自己需要保存到的路径book = load_workbook(writer.path)writ
2020-08-31 10:59:50 3127
原创 五、dataframe中根据某一列的值的大小排序
1.数据实例:import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":[8000,7000,12000,10000,9000]}df=pd.DataFrame(dict)df数据结果:2.按salary大小排序df.sort_values("salary",inplace=True)df排序结果:
2020-08-21 20:44:31 9127
原创 四、基于python的字符串的处理(字符串的拆分与类型转换)
本章分享一个字符串的拆分技巧,以及字符串怎么转化为整形数据用于计算。任务要求:将salary列数据转换为最大值与最小值的平均值1.数据的创建import pandas as pddict={"name":["小王","小明","小辉","小红","小李"], "education":["大专","本科","研究生","本科","本科"], "salary":["6k-10k","7k-9k","10k-15k","10k-12k","5k-8k"]}df=pd.DataFr
2020-08-21 20:22:02 663
原创 三、基于python的数据批量读取、处理与保存
1.数据的批量读取#导入需要用到的库函数import numpy as npimport pandas as pdimport os#文件路径dir_str=r"F:\车联网数据\所有车辆数据\数据" #此处填文件的路径file_name=os.listdir(dir_str)file_dir=[os.path.join(dir_str,x) for x in file_name]file_dir[:,5] #显示前5个结果如下:2.数据的批量处理与保存此处可写个循环,将数据
2020-08-14 17:29:00 2562
原创 二、python时间序列数据的相减
在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。本节主要分享时间数据的相减。1.将读取的时间序列数据转化为timestamp格式#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#将'/'替换为'-'data["时间"]=data
2020-08-02 10:44:07 3113
原创 一、python时间序列数据转为timestamp格式
**第一部分**在此记录自己学习python数据分析过程中学到的一些数据处理的小技巧。1.数据的读取#导入numpy库和pandas库import numpy as npimport pandas as pd#读取待处理的数据#file_path为文件路径名,sheet_name为需要读取的excel数据页data=pd.read_excel(file_path,sheet_name)#显示数据前5行data.head()数据读取的结果:由读取结果可以看出,时间序列数据并
2020-08-02 10:14:47 2419 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人