自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (4)
  • 收藏
  • 关注

原创 hive学习笔记4:sort by 、order by

1.order by 子句 在order by子句中有一些限制。在strict模式(hive.mapred.mode=strict)下,order by子句后面必须有limit子句。如果设置hive.mapred.mode=nonstrict,limit子句不一定需要。原因是为了对所有结果进行整体的排序,必须使用一个reducer来对最后的结果进行排序。如果结果的总行数太大,单个reducer可

2018-01-25 21:54:51 11306

原创 hive学习笔记3:group by子句

hive group by

2018-01-24 15:01:15 2531

原创 hive学习笔记2:select 查询

hive select

2018-01-23 21:56:12 1017 1

原创 hive学习笔记1:hive使用基本命令

退出命令:quit 或  exit查询配置的变量:set -v配置变量:set =添加files,jars等:add file[s] | jar[s]列出已添加的资源:list file[s] | jar[s]执行在CLI中的Hive查询语句: source FILE

2018-01-23 17:27:35 329

原创 python3引入自定义模块

python

2017-12-25 13:53:25 3377

原创 KNN 图像分类python实现

KNN 算法 python

2017-12-22 23:01:32 9906 4

原创 PCA python实现

PCA python

2017-12-18 20:08:05 1372

原创 python通过某个字段将记录分组

python3-cookbook groupby defaultdict

2017-10-30 11:16:28 4653

原创 pyplot画散点图

python matplot plot scatter

2017-09-12 16:44:41 14545 1

原创 pyspark中like的用法

pyspark 通配符 like使用

2017-09-07 20:16:37 5952

原创 python之datetime

python datetime strftime

2017-07-19 16:50:08 394

原创 使用matplot画柱状图

matplot csv bar

2017-07-19 09:10:45 1408

原创 使用seaborn画堆积柱状图

csv pandas seaborn pyspark.sql

2017-07-18 20:47:07 27691

原创 Presto初步认识

presto

2017-06-27 18:01:47 427

原创 YARN常用的3种调度器

yarn 调度 FIFO Scheduler Capacity Scheduler Fair Scheduler

2017-06-27 17:30:41 1165

原创 spark sql加载parquet格式和json格式数据

parquet orc json spark sql

2017-06-23 15:15:51 6574

原创 anaconda3 安装python包

anaconda3 python3.6

2017-06-18 12:12:53 19555

原创 spark sql 之join等函数用法

spark sql join cast row_number()

2017-06-15 16:22:05 39416

原创 Hive的数据存储

hive hdfs 数据存储

2017-05-25 10:28:25 916

原创 Hive的复杂数据类型之Array

hive array

2017-05-24 09:21:50 9244

原创 hive管理之命令行方式CLI

hive HQL CLI

2017-05-23 20:32:39 2319

原创 python之函数

python函数

2017-05-17 00:24:53 661

原创 python之list复制

python之list复制

2017-05-16 23:37:26 908 1

原创 python中对于“+”符号,不同的数据类型表现的不同的行为

python中的“+”

2017-05-16 23:12:02 829

原创 数据开发岗找实习心得

数据开发实习心得

2017-05-11 00:16:59 2744

原创 IntelliJ IDEA安装scala插件并创建scala示例

参考博客: 1.http://blog.csdn.net/a2011480169/article/details/52712421 2.http://blog.csdn.net/stark_summer/article/details/42460527 3.https://www.jetbrains.com/help/idea/2017.1/creating-and-running-your-

2017-05-10 23:16:10 30336 2

plot画图数据

用于matplotlib作图,这些数据很方便用来画散点图,也可以用来画其他的图形。本人在使用此数据时,主要使用了scatter()函数和plot()函数。

2017-09-11

柱状图数据cid3

画柱状图的数据

2017-07-18

原始数据part-00000.csv

使用matplot和seaborn作图

2017-07-18

trans-part-csv

对part-00000.csv改写后的数据

2017-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除