3 my_白白白

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 16w+

标题行列标签表格与图形的应用以及图例和保存图片

查看吸烟和不吸烟者消费账单的平均值plt.subplot(facecolor=np.random.random(size=3))tips.groupby('smoker')["total_bill"].mean().plot(kind="bar")plt.grid()plt.ytick([0,10,20],["min","middle","max"],fontsize=15,color=n...

2020-01-16 20:59:07

子画布/坐标轴界限/坐标轴标签/画布标题

子画布使用plt.grid方法可以开始网格线,使用plt面向对象的方法,创建多个子图显示不同网格线lw代表linewidth 线的粗细alpha 表示线的透明度color 表示颜色axis 显示轴向plt.grid(axis='y')axes = plt.subplot(111)axes.grid(axis='both')plt.figure(figsize=(10,...

2020-01-16 20:39:19

Matplotlib基础知识

一、Matplotlib基础知识Matplotlib中的基本图表包括的元素x轴与y轴axis 水平和垂直的轴线轴标签 axisLable 水平和垂直的轴标签x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度x轴和y轴刻度标签tick label 表示特定坐标轴的值绘图区域 axes 实际绘图的区域画布 figure 呈现所有的坐标系1. 绘制有正弦曲x = ...

2020-01-16 20:18:42

Scipy文件输入/输出

Scipy文件输入/输出import scipy.io as io 随机生成数组,使用scipy中的io.savemat()保存文件格式是.mat,标准的二进制文件io.savemat('data', mdict={ "data":data})image = io.loadmat('data.mat')读写图片使用scipy中misc.imread()/imsave()mi...

2020-01-16 19:49:10

处理文件夹中全部图片

def gray_for_images(path): all_image_type = ["jfif","bmp","jpg","png","tif","gif","pcx","tga","exif","fpx","svg","psd","cdr","pcd","dxf","ufo","eps","ai","raw","WMF","webp"] for path,dir_name,...

2020-01-16 19:44:15

数值积分,求解圆周率

数值积分,求解圆周率f = lambda x:(1-x**2)**0.5a = -1b = 1from scipy.integrate import quadarea, err = quad(f, a, b)area*2

2020-01-16 19:43:12

图片消噪与灰度处理

图片消噪scipy.fftpack模块用来计算快速傅里叶变换速度比传统傅里叶变换更快,是对之前算法的改进图片是二维数据,注意使用fftpack的二维转变方法moon = plt.imread('moonlanding.png')plt.figure(figsize=(12,8))plt.imshow(moon, cmap=plt.cm.gray) # 'gray'加载图片# ...

2020-01-16 19:39:00

散布图(散点图)

散布图(散点图)通常是连续值与连续值之间的对应关系也可能是连续值和离散值之间的对应关系离散值之间一般不需要表达散点图的关系# 查看消费随着账单变化的对应关系# x表示作为横轴展示列标签名字# y表示作为纵轴展示列标签的名字# 连续值与连续值的对应关系# 作为散点图的列,必须是数值类型# 可以使用map函数对不是数值的列进行数值映射tips.plot(kind="scatter"...

2020-01-16 19:29:03

直方图

直方图data = Series(data=np.random.randn(1000))data.plot(kind='hist')直方图:统计的是每个数据区间,数据出现的次数normed:把次数转换成可能出现的概率核密度估计,把每个数据区间可能出现的概率进行统计data.plot(kind='hist', bins=5, normed=True)data.plot(kind='...

2020-01-16 19:15:36

pandas中的绘图函数(柱状图)

pandas中的绘图函数(柱状图)Series柱形图示例kind = ‘bar’/‘barh’s = Series(data=np.random.randint(60,98, size=5),index=list("ABCDE"))s.plot(kind='bar')DataFrame柱状图示例df = DataFrame(data=np.random.randint(0,100,...

2020-01-16 19:02:58

pandas中的绘图函数(线型图)

pandas中的绘图函数线型图now = pd.datetime.now()#periods 时间节点的个数index = pd.data_range(start=now,periods=20,freq="M")s = Series(data=np.random.randint(100,120,size=20), name="weight", index=index)# kind='l...

2020-01-16 18:01:34

数据分类/组处理

数据分类/组处理groupby() 分组函数分组之后必聚合,只对数字的列聚合单列进行分组data.groupby(“attack_range”).mean()[“hp_max”]使用列表进行多条件分组data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”]对不同列求不同的聚合指标gp = data.groupby([“a...

2020-01-09 19:43:03

排序

排序numpy sort partitionseries sort_values sort_indexDataFrame sort_values(by)np.random.permutation(10) 随机索引随机排序使用take()函数排序take()函数接受一个索引列表,用数字表示eg:df.take(【1,2,3,5】)随机排序 take + permutation...

2020-01-09 19:26:32

数据异常值检测和过滤

数据异常值检测和过滤查看数据信息infoheaddescribe使用describe()函数查看每一列的描述性统计量空值处理:isnull()判空 fillna()填充 dropna()删除重复值处理:duplicated()查看重复行 drop_duplicates() 删除重复行异常值处理:(整列数据像转换成标准的正态分布) 数值 > 3*std离群点结合业务...

2020-01-09 19:03:13

rename()函数

rename()函数可以直接通过columns 去传入对应列的名字,去改变列名这种效率比rename的效率要高的多score.columns = ["python","java","ps", "js"]rename()函数的参数:mapper=None,axis=Nonemapper中以字典形式去更改列字段名称axis 指定替换行还是列index=None, 替换行索引col...

2020-01-09 17:57:23

map()函数

map()函数使用:map()可以使用字典映射新一列数据map()可以使用lambd表达式map()中可以使用方法,可以是自定义方法注意:map()中不能使用sum函数之类的,for循环map(字典)字典的键要足以匹配所有的数据,否则会出现NaNtransform()函数transform() 与 map()函数类似读取表单数据以键值对读取练习: 新增两列,分别为...

2020-01-09 17:50:40

映射

映射映射的含义:创建一个映射关系的列表,把values元素和一个特定的标签或者字符串绑定映射操作:replace()函数:替换元素(DataFrame\Series的函数)最重要:map()函数:新建一列(Series的函数)rename()函数:替换索引(DataFrame函数)例子:df = DataFrame({ "name":["lucy","lmery","lucy...

2020-01-09 17:36:39

pandas数据处理

pandas数据处理1、删除重复元素合并只处理列不处理行重复元素只检测行,不检测列使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每一个元素对应一行,如果该行不是第一次出现,则元素为Truedfduplicated()函数的参数:subset=None, keep=‘first’subset 指定列标签列表,列表内的标签是用于检测重复数据的字...

2020-01-09 17:17:04

pandas的汇总操作

pandas的汇总操作pandas的拼接分为两种:级联:pd.concat,pd.append合并:pd.merge,pd.join级联的业务应用场景:业务表结构相同或相似numpy的级联numpy级联必须保证在级联的方向上,数据个数一致如果数据个数不一致,无法级联pd.concat((df1,df2))默认是纵向方向级联,两张表的标签顺序可以不一致以标签为基准axi...

2020-01-08 21:04:51

聚合操作

聚合操作pandas的聚合默认是列方向的聚合pandas的聚合默认忽略空值注意:需要制定axis和unstack()相反,聚合的时候。axis等于哪一个,哪一个就保留axis=0 列axis =1 行所谓的聚合操作:平均数,方差,最大值,最小值……...

2020-01-08 19:24:45

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。