自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lmalds的专栏

倚南窗以寄傲,审容膝之易安。

  • 博客(61)
  • 收藏
  • 关注

原创 Flink+doris实现实时OLAP数据分析

Flink+doris实现实时数据分析Apache Doris 在京东搜索实时 OLAP 中的应用实践

2020-12-09 09:30:58 2475 9

原创 数据分析的新形式--自然语言搜索:NL2SQL2Graph

数据分析的新形式--自然语言搜索:NL2SQL2Graph背景定位分析能力模型调研实现背景自然语言转SQL,再将SQL结果集转图形,在NLP领域是个非常不错的研究方向,这样做的好处在我看来,主要有以下点:1、数据分析人员无需写Code(SQL)实现取数,搜索数据,灵活方便,支持快速多变的adhoc查询2、相对于报表和BI系统,数据分析人员主动探索数据,而不是被动接收相对固定的报表3、搜...

2019-03-18 11:50:22 3954 5

原创 分享一个实时数仓系统--SnappyData的博客与中文社区

分享一个实时OLAP系统–SnappyData的博客与中文社区SnappyData中文博客 SnappyData中文社区

2018-04-23 15:29:40 6381 3

原创 SnappyData企业版中off-heap功能及与on-heap功能的对比

目录:1、SnappyData OSS的功能介绍2、SnappyData企业版的额外功能3、企业版off-heap功能的对比与测试4、结论5、参考1、SnappyData OSS的功能介绍OSS是Open Source SnappyData Community Edition的简称,其是一个基于Apache 2.0的开源的分布式数据库产品,包含了如下的功能...

2018-03-05 15:04:09 1171

原创 SnappyData-一个构建在Spark上的支持实时HTAP场景的解决方案

1、设计目标1、实时的OLTP+OLAP型的操作2、数据规模在50TB-100TB以下:太大规模的数据(PB规模),还要求实时出结果的场景,并不是SnappyData的设计目标。3、微批的流失写入:实时数据的写入最好按批次写入。例如列表上的频繁的基于点的update,效率并不是很高。2、数据流    上图介绍了流数据的注入以及

2018-01-26 16:41:52 3383 3

原创 SnappyData--一个统一OLTP+OLAP+流式写入的内存分布式数据库

一、背景:    阔别个人博客有大半年了,这大半年来我从一个all in flink的角色转变到了一个兼顾实时流式处理与实时OLAP处理的角色。    最近由于工作需要,在关注实时的OLTP+OLAP的HTAP场景的数据处理,优先保证低延迟的OLAP查询。说到这里,很容易让人想到Google的F1、Spanner,开源领域的代表TiDB。TiDB是个分布式的MySQL,对OLTP的支持很好

2018-01-19 18:50:50 6664 14

原创 Flinkspector--Flink单元测试的开源框架

Flink unit tests

2017-07-21 18:08:14 2488 2

原创 Flink流计算编程--Flink扩容、程序升级前后的思考

Flink扩容

2017-06-23 18:00:20 6186 4

翻译 A Year of Blink at Alibaba: Apache Flink in Large Scale Production--翻译

Flink

2017-05-19 17:11:18 1300

原创 Flink Table & SQL API--动态表与Redo和Undo

flinkSQL

2017-05-03 15:01:45 4057

原创 Flink源码--CLI提交Job

Flink

2017-04-14 17:56:09 7902

原创 Flink流计算编程--看看别人怎么用Session Window

FlinkSession windowearly trigger

2017-04-05 18:44:54 7429 4

翻译 精通Apache Flink读书笔记--5

Flink CEP

2017-03-17 14:03:32 3609 2

原创 Apache Flink SQL示例

FlinkSQL

2017-03-09 14:02:17 16580 1

翻译 精通Apache Flink读书笔记--3、4

Flink

2017-03-09 13:43:55 13349 2

翻译 精通Apache Flink读书笔记--1、2

FlinkMaster Apache Flink

2017-03-06 14:01:45 19651 4

原创 精通Apache Flink读书笔记

Mastering Apache Flink

2017-03-06 11:33:05 4665 1

原创 Flink流计算编程--Flink中allowedLateness详细介绍及思考

FlinkallowedLateness

2017-02-17 11:06:39 10557 3

原创 解读Flink中轻量级的异步快照机制--Flink 1.2 源码

FlinkABSBarrier

2017-02-09 16:17:43 3255 1

原创 解读Flink中轻量级的异步快照机制--论文

FlinkSnapshotABS

2017-02-08 13:55:21 6678 2

原创 Zookeeper学习总结

zookeeper

2017-01-25 11:11:07 667

原创 回顾2016--Apache Flink流处理在生产中的实践

Flink

2017-01-12 18:15:05 5859 6

原创 Apache Beam正式成为Apache的顶级项目

Apache BeamApache Flink

2017-01-11 18:24:12 2255

原创 通过Time、Window与Trigger比较Google Cloud DataFlow与Apache Flink的区别

FlinkDataFlow

2017-01-10 18:16:21 3054

原创 Gobblin部署--mapreduce模式

Gobblinkafka

2017-01-05 14:56:01 3192 3

原创 Gobblin部署--standalone模式

Gobblin standalonekafka

2017-01-03 13:52:53 2675

原创 Gobblin--一个用于Hadoop的统一"数据抽取框架"

数据整合HDFSKafka

2016-12-30 14:13:58 11894 2

原创 Flink on Yarn(HA配置)

Flink Yarn HA

2016-12-21 17:47:03 9136 2

原创 Flink Configuration简介

Flink configuration

2016-12-19 14:37:38 15917

转载 Flink on Yarn模式启动流程分析(Flink 1.1)

Flink yarn

2016-12-15 13:44:06 1935 1

转载 Hadoop Yarn详解

Yarn简介

2016-12-15 11:03:37 671

原创 Zookeeper学习笔记--Java API

zookeeper

2016-12-06 11:41:06 589

原创 Zookeeper学习笔记

zookeeper

2016-12-05 16:12:39 686

原创 Flink源码解读--FlinkKafkaProducer09

Flink kafka producer

2016-12-01 16:58:25 4133

原创 Flink流计算与时序数据库Influxdb+grafana

flink influxdbgrafana

2016-11-30 11:30:18 7752

原创 Flink源码解读--FlinkKafkaConsumer09

Flink kafka consumer

2016-11-23 16:12:21 7493

原创 Flink Jobmanager HA配置(standalone)

Flink standalone HA

2016-10-31 12:03:14 7895 2

原创 Flink流计算编程--watermark(水位线)简介

1、watermark的概念watermark是一种衡量Event Time进展的机制,它是数据本身的一个隐藏属性。通常基于Event Time的数据,自身都包含一个timestamp,例如1472693399700(2016-09-01 09:29:59.700),而这条数据的watermark时间则可能是:watermark(1472693399700) = 1472693396700(2016

2016-09-30 12:20:44 62851 46

原创 Flink流计算编程--Session Window实战

FlinkSession Window

2016-09-28 18:56:11 7867 2

原创 Scala读取文件存为多个value的HashMap

scala HashMap MultiMap

2016-09-21 17:58:37 4182 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除