自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

chbxw

努力是会上瘾的,尤其尝到了甜头

  • 博客(1089)
  • 资源 (10)
  • 收藏
  • 关注

原创 数据仓库思维导图

一、数据仓库 1.1、什么是数据仓库   1.1.1、简介   1.1.2、四个特性    1.1.2.1、面向主题    1.1.2.2、集成化的    1.1.2.3、稳定性    1.1.2.4、随着时间变化的  1.2、数据仓库发展 1.3、数据库与数据仓库的区别 1.4、数据仓库架构分层 1.5、元数据介绍 1.6、数据仓库建模  1.6.1、事实表 与 维度表  1.6.2、雪花模型  1.6.3、星型模型  1.6.4、星座模型 1.7、 1.x、  1.

2021-08-25 21:16:15 1372 5

原创 面试系列文章

面试系列一 之 面试说明面试系列二 之 项目架构

2021-06-17 08:30:30 303

原创 实时数仓

1、实时数仓(一)

2021-02-04 08:41:48 353

原创 impala目录导图

一、Impala介绍二、Impala架构及组件三、安装(这个忽略,使用的CDH,傻瓜式安装v3.1.0-cdh6.1.1)四、Impala-shell五、SQL语法

2020-12-29 06:53:53 282

原创 kudu导图目录

一、kudu介绍1.1、背景1.2、kudu组件二、操作kudu2.1、使用javaAPIc操作苦读

2020-12-27 15:07:39 311

原创 Flume入门及进阶教程

一、Flume介绍二、Flume入门三、Flume的高级特性

2020-08-08 11:09:26 764

原创 Flink目录导读

一、Flink是什么二、Flink快速入门三、Flink的安装与部署。。。

2020-05-31 11:13:08 2258 4

原创 机器学习(Macheine Learning)面试知识点

Spark MLlib 机器学习算法及实践

2020-05-07 09:44:08 924

原创 kafka目录导读(入门到进阶)

一、部署1.1、安装部署二、概念及理论2.1、2.2、kafka文件存储三、整合3.1、kafka+flume3.2、flume+kafka+stormflume之kafkaSinkstrom之KafkaSpout测试问题

2020-05-06 15:48:58 458

原创 大数据开发 岗位需要的知识

一、大数据的三个发展方向平台搭建/优化/运维/监控大数据开发/设计/架构数据分析/挖掘。二、大数据的4V特征:数据量大,TB->PB数据类型繁多,结构化、非结构化文本、日志、视频、图片、地理位置等;商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来;处理时效性高,海量数据的处理需求不再局限在离线计算当中。  现如今,正式为了应对大数据...

2020-04-22 17:54:33 787

原创 深度学习入门、进阶教程

一、框架1.1、TensorFlow1.2、PaddlePaddle1.3、Pytorch

2019-12-05 08:45:42 614

原创 算法与数据结构面试知识点

Algorithm

2019-10-07 14:41:55 792

原创 Redis目录

一、安装1.1、安装二、Redis的基础数据类型三、Redis的高级特性

2019-06-20 22:56:20 765

原创 python导图目录

python导图目录

2019-04-23 22:57:53 364

原创 ES入门与进阶

ES 类比 MySqlMySqlESdatabase(数据库)index(索引库)table(表)type(类型)row(行)document(文档)column(列)field(字段)

2019-02-07 14:22:48 1192 1

原创 Linux导图目录

一、命令1.1、shell时间格式转化

2018-08-20 13:53:13 405

原创 Hive目录导图

一、hive基础篇1.1、介绍1.2、安装1.3、命令1.4、数据模型1.5、表结构1.6、函数1.7、hive的jdbc模式

2018-08-06 09:46:38 827 2

原创 java 接口服务

一、发布htttp服务器1.1、通过tomcat发布服务1.2、通过socket获取http信息

2018-07-10 13:30:15 1634 1

原创 spark目录导图

一、介绍1.1、RDD介绍二、安装三、算子四、简单案例五、整合六、问题七、总结

2018-06-26 08:41:49 913 3

原创 hadoop目录导图

MapReduce原理 mapper, reducer,shuffle hadoop实现join方法

2018-06-24 23:10:25 408 1

原创 hbase目录导图

一、介绍 1.1、hbase简介hbase数据模型hbase体系架构1.2、基本命令

2018-06-20 13:44:18 1000 1

原创 Storm目录导图

Strom样例代码

2018-06-20 13:44:01 988

原创 【SQL】Spark SQL 比较上下两条数据,多个字段多个条件,赋值一个结果字段成一个array,

比较上下两条数据,多个字段多个条件,赋值一个结果字段成一个array,

2023-10-10 10:03:51 281

原创 nvcc not found

报错:nvcc fatal : Value ‘compute_30’ is not defined for option ‘gpu-architecture’检查cuda 安装成功。cuda 目录下没有。

2023-08-14 21:41:36 545

原创 Stable Diffusion + EbSynth + ControlNet 解决生成视频闪烁

解压,配置环境变量检查是否安装成功。

2023-07-18 21:31:48 5023 5

原创 Stable Diffusion Webui 之 ControlNet使用

Stable Diffusion ControlNet

2023-07-14 21:14:51 3576

原创 stable-diffusion-webui 安装

找到提示目录下前缀为“~”的文件夹,删除掉。

2023-06-09 09:07:48 1241

原创 docker 部署 hadoop

参考:

2023-05-18 13:52:52 116

原创 连续登录问题

【代码】连续登录问题。

2023-05-15 18:10:17 108

原创 [docker] Error response from daemon: reference does not exist

docker 删除镜像报错

2023-05-14 21:29:28 3638

原创 SQL Lateral View EXPLODE

sql lateral view

2023-05-10 15:52:28 320

原创 SQL必须熟练之 间隙与岛的问题(骑行与驻车连续问题切割)

【代码】SQL必须熟练之 间隙与刀的问题。

2023-04-27 09:12:59 109

原创 UTC时间、GMT时间、CST时间(北京时间)、时间戳

Greenwich Mean Time,格林尼治平时,又称格林尼治平均时间或格林尼治标准时间。是指位于英国伦敦郊区的皇家格林尼治天文台的标准时间。GMT存在较大误差,因此现在已不再被作为标准时间使用。现在的标准时间,是由原子钟报时的协调世界时(UTC):Universal Time Coordinated,中文名称:世界标准时间或世界协调时。UTC时间可以理解为。它实际上反映了一种约定,即为全世界所认可的一个统一时间,而不是某特定地区的时间。中国人常用的。

2023-04-22 12:25:19 19085

原创 Hudi基本概念-表类型与查询类型

【代码】Hudi基本概念-表类型与查询类型。

2023-04-22 11:45:25 90

原创 Hudi Compaction

默认情况下,Hudi 压缩是异步执行的。分2步执行。

2023-04-16 08:41:50 140

原创 Hudi集成Flink-写入方式

参考: https://chbxw.blog.csdn.net/article/details/119841434。CDC(change data capture) 保证了完整数据变更,目前主要有两种方式。1、kafak 作为 源表,flinksql 消费kafka。1、使用 mysql-cdc 监听 binlog。3、将 kafka 中数据 写入 hudi。2、kafka 作为 sink表。接下来我们主要介绍 第二种方式。2、创建hudi目标表。3、写入sink 表。

2023-04-14 00:08:25 1546

原创 Mysql 开启 binlog

1、检查是否开启 binlog。2、修改my.cnf。

2023-04-13 23:21:45 215 1

原创 hudi 与 Flink 整合

只编译 packaging/hudi-flink-bundle 及其依赖的模块。修改pom.xml 中 flink 的版本。

2023-04-09 15:09:31 433

原创 Iceberg编译 及 与 Spark、Flink整合

一、准备工作。

2023-04-08 13:10:55 1045 1

原创 spark 读取 tar.gz 文件

一个json文件 压缩 成 tar.gzt.json生成 tar 包将 tar 包 在压缩为 gz。

2023-04-05 17:20:40 907

企业级360用户画像的配置数据 tags.zip

企业级360用户画像的配置数据

2021-06-25

mdnice_1_0_7.crx

将CSDN中文章同步到微信公众号

2021-06-15

360用户画像标签及源数据

360用户画像标签及源数据

2021-05-28

企业级360用户画像.pdf

360用户画像

2021-05-26

Hive实战之视频网站的测试数据

Hive实战之视频网站 测试数据 https://chbxw.blog.csdn.net/article/details/107738550

2020-08-02

第4讲 .pdf

概率论 频率与概率

2019-08-25

搭建本地yum源

搭建本地yum源

2019-02-01

hadoop2.5.2学习13-MR之新浪微博

hadoop2.5.2学习13-MR之新浪微博TF-IDF算法简介

2017-03-19

天猫推荐测试数据

hadoop2.5.2学习14--MR之协同过滤天猫推荐算法实现01

2017-03-04

java程序员必知的8大排序

8大排序

2016-07-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除