自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(73)
  • 资源 (2)
  • 收藏
  • 关注

原创 【博学谷学习记录】超强总结,用心分享| Hudi核心概念

(2)Action,操作,具体做了什么操作,COMMIT(提交,COW)、DELTA_COMMIT(提交,MOR)、CLEAN(清理)、COMPACTION(压缩)Hudi表 -> partition(分区)-> FileGroup(文件组)->FileSlice(文件片)->1或1个log+1个parquet文件组成。(3)State,这一个操作具体到哪个步骤了(REQUESTED(请求发起)、INFLIGHT(请求进行中)、COMPLETED(请求完成))Data Format数据格式。

2023-05-28 22:00:40 658 1

原创 【博学谷学习记录】超强总结,用心分享| FlinkSQL

【代码】FlinkSQL【博学谷学习记录】

2023-05-21 22:24:40 160

原创 【博学谷学习记录】超强总结,用心分享| Checkpoint机制

Checkpoint,就是流式程序中用来做容错的机制。它是通过JobManager的检查点协调器(checkpoint coordinator)来协调工作的。

2023-05-14 22:28:54 415

原创 【博学谷学习记录】超强总结,用心分享| Flink的窗口机制

无限制的流式计算,比如:wordcount案例,它没有任何外部的限制条件,这种情况不多。对于第二种情况来说,我们需要加上额外的限制条件。最常用的限制条件就是。特点:上一个窗口的结束就是下一个窗口的开始,数据不重复、也不丢失。有限制的流式计算,比如:统计早高峰时间内经过某个道路的车辆数。滚动窗口 :窗口大小 = 滚动距离(时间间隔)这个时间段,在程序中,就用一个窗口来表示。这就是为什么要学窗口的原因了。渐进式窗口(cumulate)聚合窗口(over)

2023-05-07 21:06:52 505

原创 【博学谷学习记录】超强总结,用心分享| Flink StreamExecutionEnvironment

flink

2023-05-01 00:00:35 394

原创 【博学谷学习记录】超强总结,用心分享| DataStream

flink

2023-04-23 23:50:19 59

原创 【博学谷学习记录】超强总结,用心分享| Flink Watermark

生活中有种场景:车辆进入隧道,信号不好,出了隧道后,信号就正常了。正常情况下,车辆进入隧道后,如果车辆正常,没有事故,会正常驶出隧道。在正常的隧道行驶过程中,可能会因为信号的原因,导致数据没有像信号正常的时候那么快到达。也就是说,这种情况下,数据出现了延迟。我们把这种延迟数据称之为迟到数据。生活中,这种场景非常多,比如:车辆进入地下车库,手机欠费,网络抖动等。这都属于生活的正常情况。无法避免。程序中,一般不会允许数据丢失。所以,我们程序会推出一些机制来保证迟到数据被正常处理。

2023-04-16 22:52:22 288

原创 【博学谷学习记录】超强总结,用心分享| Flink的Transform

【代码】Flink的Transform【博学谷学习记录】

2023-04-09 23:31:42 43

原创 【博学谷学习记录】超强总结,用心分享| Flink读取数据

flink读取数据

2023-04-03 00:07:26 105

原创 【博学谷学习记录】超强总结,用心分享| Flink基础

Flink

2023-03-27 00:07:59 108

原创 【博学谷学习记录】超强总结,用心分享| Spark SQL函数定义

sparksql

2023-03-19 20:24:46 304

原创 【博学谷学习记录】超强总结,用心分享| SparkSQL的DataFrame详解

dataframe

2023-03-12 20:18:03 456

原创 【博学谷学习记录】超强总结,用心分享| Spark SQL

spark sql

2023-03-05 13:10:01 951

原创 【博学谷学习记录】超强总结,用心分享| RDD的内核调度

spark

2023-02-26 17:18:57 338

原创 【博学谷学习记录】超强总结,用心分享| RDD的持久化

rdd的缓存

2023-02-18 00:02:30 380

原创 【博学谷学习记录】超强总结,用心分享| RDD的转换算子

spark

2023-02-12 23:37:04 247

原创 【博学谷学习记录】超强总结,用心分享| RDD的基本知识

spark

2023-02-05 22:56:57 279

原创 【博学谷学习记录】超强总结,用心分享| SparkBase核心

spark

2023-01-29 22:01:02 439

原创 【博学谷学习记录】超强总结,用心分享| 从HDFS上读取文件并实现排序

spark基础

2023-01-22 18:33:45 283

原创 【博学谷学习记录】超强总结,用心分享| Spark基础

spark

2023-01-15 21:59:03 107

原创 【博学谷学习记录】超强总结,用心分享| python基础语法

ptyhon

2023-01-08 21:47:04 272

原创 【博学谷学习记录】超强总结,用心分享| python基础

python

2023-01-01 21:11:20 249

原创 【博学谷学习记录】超强总结,用心分享| HBase相关操作

hbase

2022-12-25 18:45:18 142

原创 【博学谷学习记录】超强总结,用心分享| HBase基本介绍

hbase

2022-12-18 19:18:06 653

原创 【博学谷学习记录】超强总结,用心分享| kafka底层原理

kafka

2022-12-11 20:26:28 421

原创 【博学谷学习记录】超强总结,用心分享| kafka的基本介绍

kafka

2022-12-04 19:22:55 629

原创 【博学谷学习记录】超强总结,用心分享| presto框架

presto

2022-11-27 19:11:01 850

原创 【博学谷学习记录】超强总结,用心分享| 拉链表

拉链表

2022-11-20 18:55:32 197

原创 【博学谷学习记录】超强总结,用心分享| 数据仓库

数仓

2022-11-13 18:27:36 324

原创 【博学谷学习记录】超强总结,用心分享| ETL基本介绍

ETL

2022-11-06 19:02:31 1256

原创 【博学谷学习记录】超强总结,用心分享| Hive的优化

hive

2022-10-30 17:32:23 247

原创 【博学谷学习记录】超强总结,用心分享| Hive表的查询

hive

2022-10-23 20:03:02 643

原创 【博学谷学习记录】超强总结,用心分享| Hive的表操作

hive

2022-10-16 16:33:41 490

原创 【博学谷学习记录】超强总结,用心分享| 数仓的基本知识

数仓基本知识

2022-10-09 15:05:44 840

原创 【博学谷学习记录】超强总结,用心分享| Yarn的基础学习

Yarn的基础学习

2022-10-02 17:30:04 431

原创 【博学谷学习记录】超强总结,用心分享| MapReduce基础学习

MapReduce学习

2022-09-25 12:55:15 877

原创 【博学谷学习记录】超强总结,用心分享| HDFS的Arichive机制

HDFS并不擅长存储小文件,因为每个文件最少一个block,每个block的元数据都会在NameNode占用内存,如果存在大量的小文件,它们会吃掉NameNode节点的大量内存。Hadoop Archives可以有效的处理以上问题,它可以把多个文件归档成为一个文件,归档成一个文件后还可以透明的访问每一个文件。

2022-09-18 19:55:59 663

原创 【博学谷学习记录】超强总结,用心分享| hadoop上传和下载文件过程

hadoop上传和下载文件过程

2022-09-11 22:53:46 2613

原创 【博学谷学习记录】超强总结,用心分享| ZooKeeper基础学习

ZooKeeper基础知识

2022-09-04 22:42:55 144

原创 【博学谷学习记录】超强总结,用心分享| linux基本知识总结和shell的使用

linux基础知识和shell基本使用

2022-08-27 22:00:45 877 1

微信公众号SDK

亲测可用的微信公众号SDK,开发者基本配置中服务器地址:路径+server.php Token:weixin

2016-07-15

用php写的mysql的类

php中对mysql进行编写的类。对书写与数据库有关的代码,可以带来很大的方便。

2014-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除