自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 mysql语句执行顺序

sql执行顺序:(1)from(2)join(3)on(4)where(5)group by (开始使用select中的别名,后面的语句都可以使用)(6)avg,sum……(7)having(8)select(9)distinct(10)order by(11)limit另外,窗口函数只允许在select语句与order by语句中使,并且是在where、group by、having执行得到结果之后,在select distinct、order by、lim

2020-08-02 22:52:01 200

原创 python数据预处理之异常值、缺失值处理方法

数据预处理是明确分析目标与思路之后进行数据分析的第一步,也是整个项目中最基础、花费时间较长的工作。除了互联网埋点的数据或企业内部的业务数据之外,往往我们拿到的,比如说网上采集的数据并不是那样规整,这类数据经常出现错误值、缺失值和异常值。一、异常值 异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称离群点,异常值的分析也称为离群点的分析。 ...

2020-05-03 20:23:27 23306 3

原创 数据分析笔试经典sql题解

前言:sql是数据分析师笔试必考的考点之一,常考的题型有行列转换、联表查询,这些都比较简单,一般考的最难的就是hivesql窗口函数联表查询,普通的聚合函数每组(Group by)只返回一个值,而窗口函数则可为窗口中的每行都返回一个值。下面分享几道数据分析笔试中常考的经典sql题。(本文默认大家了解窗口函数语法)1、行列转换(京东数据分析笔试题)表salesyear m1 ...

2020-03-05 19:57:34 4220 8

原创 解决Anaconda环境中中文显示问题(windows)

在Anaconda中使用matplotlib设置中文时会出现很多小方框,不想每次都写代码设置中文字体,查了很多资料找到了解决方法:修改matplotlib的配置文件matplotlibrc。1.下载.ttf格式的中文字体simhei.ttf2.将下载的中文字体保存到matplotlib的字体库,并右键安装,我的路径如下:D:\Anaconda\Lib\site-packages\...

2019-07-18 14:36:06 13164 8

原创 pd.pivot_table数据透视表与pd.crosstab交叉表

在数据分析中,常常需要用到数据透视表和交叉表,下面介绍pandas.DataFrame.pivot_table数据透视表和pandas.DataFrame.crosstab交叉表的用法和区别。一、数据透视表数据透视表用来做数据透视,可以通过一个或多个键分组聚合DataFrame中的数据,通过aggfunc参数决定聚合类型,是groupby的高级功能。pd.pivot_table参数如下...

2019-03-05 21:12:50 4238 3

原创 Python入门与词频分析初步

一.python与其他语言的区别1.python作为一门解释性语言,与java、C等语言相比,Python不用编译,可以直接运行

2018-06-16 18:39:31 8438 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除