自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Flink 知识体系(二)Flink 部署及启动

Flink 支持多种安装模式:local(本地)——单机模式,一般不使用;standalone——独立模式,Flink 自带集群,开发测试环境使用;yarn——计算资源统一由 Hadoop YARN 管理,生产环境使用。 Flink 集群的安装不属于本文档的范畴,如安装 Flink,可自行搜索资料进行安 装。本节重点在 Flink 的 Yarn 部署模式。在一个企业中,为了最大化的利用集群资源,一般都会在一个集群中同时运行多 种类型的 Workload,可以使用 YARN 来管理所有计算资源。

2021-12-09 19:30:18 2369 1

原创 Flink知识体系 (一)flink简介

1. Flink 发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、 Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内 存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或 多或少的掩盖了其他分布式计算的系统身影。就像 Flink,也就在这个时候默默 的发展着。在国外一些社区,有很多人将大数据的计算引擎分成了 4 代,当然,也有很多 人不会认同。我们先姑且这么认为和讨论。首先第一代的计算引擎,无疑就是 Had

2021-12-09 19:05:42 1188

原创 HiveSQL 开发指南

目录第一部分:…3Hive 查询语句… 5 本文整体分为两部分,第一部分是简写,如果能看懂会用,就直接从此部分查,方 便快捷,如果不是很理解此 SQL 的用法,则查看第二部分,是详细说明,当然第二 部分语句也会更全一些! 第一部分: hive 模糊搜索表:show tables like ‘name’;查看表结构信息:desc table_name;查看分区信息:show partitions table_name;加载本地文件:load data local inpath

2021-11-30 16:07:35 2615

原创 数据模型架构原则

数据模型架构原则1 数仓分层原则 1 数据源层:ODS(Operational Data Store) 2数据仓库层:DW(Data Warehouse) 1) 数据明细层:DWD (Data Warehouse Detail) 2) 数据中间层: DWM (DataWareHouse Middle) 3) 数据服务层: DWS (Data WareHouse Servce) 3 数据应用层:APP (Application)

2021-11-29 16:56:24 3043

原创 指标体系(一)

指标体系(一)本标准规定了指标标准的主要内容,包括指标项及其相关属性、公共维度、公共计算规则及名词术语。本标准按指标分类对指标项进行了规范化定义和管理,以满足公司业务管理、统计分析、系统建设、数据交换,及对外报送的需求。一.指标及指标体系定义1.度量,对公司业务的规模、程度、比例或结构等的衡量方式。根据度量个数可分为单一度量和组合度量。示例1:金额是单一度量、数量是单一度量。示例2:业务量是组合度量,含笔数和金额两个度量。2.维度 ,对公司在业务经营过程中所涉及对象的属性进行划分的方式。常用维度

2021-02-23 19:59:01 4652 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除