自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 hive SQL 移位、运算符、REGEXP正则等常用函数

orderflag & shiftleft(1,14)= shiftleft(1,14)SQL中使用的运算符号详解_sql中各种符号-CSDN博客Hive函数_hive shift-CSDN博客

2024-03-21 14:22:33 511 1

原创 named_struct

【代码】named_struct。

2024-01-25 19:11:31 364

原创 时间转换时时间戳、百分比

【代码】时间转换时时间戳、百分比。

2024-01-18 14:50:19 362

原创 Hive 算两时间差

2022-10-12 10:58:54 1806 1

原创 【HIVE】从URL中提取需要的部分字符串

【HIVE】从URL中提取需要的部分字符串

2022-10-10 17:43:23 505

原创 如何利用经纬度计算直线距离 SQL

如何利用经纬度计算直线距离 SQLSource: https://blog.csdn.net/weixin_42382211/article/details/80852786SELECT c.province_name, c.city_name, c.address, d.station_name, d.train_station , CAST(d.distance AS BIGINT)FROM ( SELECT DISTINCT a.station_name, b.station_n

2022-03-29 08:47:31 306

原创 计算top榜单内元素的连续上榜天数 2021-08-27

01 制作每日(eventtime,下单日)topN数据集02 对每日(eventtime)topN数据集,按照元素(供应商)分组,对统计日(eventtime)降序;标识某元素eventtime日期序号A03 curday与eventtime比较,计算两者差值B04 过滤 A = B的数据行05 获取持续上榜天数with base0 as( select substr(create_at, 1, 10) as create_date , vendor_name , sum(

2021-08-27 14:54:17 110

原创 SQL计算周岁

方法:select name, birth as birthday, if(datediff(CURRENT_DATE, CONCAT(substr(CURRENT_DATE, 0, 4), substr(birth, 5, 7))) >= 0, substr(CURRENT_DATE, 0, 4) - substr(birth, 0, 4), substr(CURRENT_DATE, 0, 4) - substr(birth, 0, 4) - 1) as age fro

2021-04-25 11:36:45 655

转载 apache hive解析结构体(structs)、数组(arrays)和字典(map)

数据仓库工具hive提供了复合数据类型:结构体(struct): 基于对象的数据结构形式,struct内部的数据可以通过(.)来存取,例如,表中一列user的类型为STRUCT{name string; age int},我们可以通过user.name来访问域name 数组(array):基于数据(列表)的数据结构形式,array中的数据为相同类型,例如,假如array中元素['a','b','c'],则array[1]的值为'b' 字典(map):基于key-value的数据结构形式,map访问指

2021-04-07 14:35:08 1765

原创 HIVE 求解时间差 & 日期格式转换

1 将时间转换成时间戳2 将时间戳相减3 注意单位(分钟、毫秒)E.x. CAST((unix_timestamp(rt.refund_ticket_time) - unix_timestamp(rt.create_time)) / 60 AS int)<=30

2021-03-18 14:01:39 837

原创 闰年同比 HQL;利用add_months实现同比(闭坑闰年)

议题:闰年2月日同比办法:代码块02阅读:https://www.cnblogs.com/huaxiaoyao/p/4364141.htmlselectadd_months('2020-03-31',-1),add_months('2019-02-28',-1),add_months('2021-03-01',-12),add_months('2021-02-28',-12),add_months('2021-02-27',-12),add_months('2020-02.

2021-03-03 14:00:51 754

原创 字符串拆分;列转行;2020-08-17

```sqlselect distinct station_id,station_name ,city_name,province_name,ticket_return,ticket_change,ticket_child,ticket_take_child,ticket_voucher,service_fee,date_site,x.y as site,dfrom dw_busdb.tbl_dc_station_new alateral view explode(spli.

2021-02-09 15:21:49 206

原创 字符提取函数 get_json_object 、regexp_replace、add_months ;表字段update

1.Json 的支付提取SELECT *,get_json_object(label_value_text,’.BUS′)asaFROMshareindi.edwdidnauserlabel1084wheregetjsonobject(labelvaluetext,′.BUS') as aFROM sharein_di.edw_di_dna_user_label_1084where get_json_object(label_value_text,'.BUS′)asaFROMshareind​i..

2021-02-09 15:16:15 171

原创 SQL:两表关联取舍时, is null 判断只能单独存在

SQL:量表关联取舍时, is null 判断只能单独存在,不能与其他判断同时进行。错误的写法:select a.user_id,a.uid,a.page_type,a.dfrom( select o.user_id ,f.uid ,f.page_type ,f.d from dw_busdb.for_flow_con...

2019-08-07 16:28:04 955

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除