自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 [SparkSQL] 列转行lateral view explode函数和FlatMap算子两种方式实现炸裂

SparkSQL通过FlatMap算子实现列转行(炸裂)我用了两种方法实现列转行,说一下我平时使用SparkSQL的习惯,我通常1)是先读取HDFS中的文件,包括txt、parquet等格式2)然后通过createOrReplaceTempView 方法创建临时表格3)之后写sql直接处理相关代码可以参考我写的另一篇文章:一、开发环境spark-2.1.0-bin-hadoop2.6...

2019-08-10 11:25:29 4447

原创 [SparkSQL] regexp_replace函数使用 去除特殊隐藏字符\n\t\r

REGEXP_REPLACE(inputString, regexString, replacementString)第一个参数:表中字段第二个参数:正则表达式第三个参数:要替换称为的字符函数使用起来比较简单,但是也有坑,当要匹配特殊的隐藏字符\n \r \t ,等回车符、制表符时,需要通过使用四个 \ 进行转译。如果不去出这些隐藏字符,在我们导出数据写入文件时会产生异常,在中间进...

2019-08-09 19:49:37 15579 2

原创 [SparkSQL] Rdd转化DataFrame 通过StructType为字段添加Schema

SparkSQL-Rdd转化DataFrame-通过StructType为字段添加Schema开发环境Rdd转换成DataFrame,为字段添加列信息特别注意开发环境spark-2.1.0-bin-hadoop2.6Rdd转换成DataFrame,为字段添加列信息参数 nullable 说明:Indicates if values of this field can be null val...

2019-08-09 19:30:07 1876

原创 获取Redis连接池实例报错及解决方案( Could not get a resource from the pool)

描述:这个错误产生的前提是这样的,将数据存入redis(新安装的)中,在通过连接池获取jedis实例时,产生如下错误( Could not get a resource from the pool)。分析:由于是新安装的redis,配置文件没有更改,低级的错误浪费不少时间,写一篇文章,让同样犯这种错误的朋友别再浪费时间。解决:更改配置文件 redis.conf 中两处1.将 bind ...

2019-03-24 21:33:01 7946 1

原创 Scala基础知识入门——集合的创建、处理细节

Scala基础知识入门——集合一、scala集合基本介绍Scala同时支持不可变集合和可变集合两个主要的包:不可变集合:scala.collection.immutable可变集合: scala.collection.mutableScala默认采用不可变集合,对于几乎所有的集合类,Scala都同时提供了可变(mutable)和不可变(immutable)的版本Scala的集合有...

2019-03-05 23:24:17 1151

原创 Hive Shell指令——数据导入方法、数据导出方法详解

Hive数据导入方法、数据导出方法总结一、Hive数据导入方法 ——六条1. 使用 load data 导入2.使用 Insert into / overwrite 导入3. 使用 As select 导入4. 使用Location导入5. 使用Import导入6. 使用Sqoop导入二、Hive数据导出方法——五条1. 使用 Insert overwrite 导出2. 使用 Hadoop 命令导...

2019-02-26 00:03:59 2653

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除