自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 2020-09-09

三范式的定义 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。 ...

2020-09-09 09:33:48 65

原创 数据库设计与数据仓库设计区别

数据库设计与数据仓库设计区别 针对数据库设计一般用的是三范式。因为数据库的数据会用于频繁的增删改查,因此出于减少系统压力考虑,会尽量减少冗余,从而提升系统频繁读写数据的效率。而星型、雪花型则是数据仓库的设计模式。与数据库的使用目的不同,数据仓库更多的是存储历史数据,不会有频繁的读写。其主要是用于从历史数据中进行分析,进而获取指导性的生产指引,生成报表等等。而这时数据库设计中的范式拆表以提升效率的方法这时却会适得其反(因为历史数据的量相当庞大,而往往数据分析、BI等又需要从多个表中检索数据来进行,这时大表

2020-09-09 09:32:32 581

原创 python实现随机生成json格式的日志数据

要生成的日志格式为: “”" #事件 “action”: “1”, #动作:开始加载=1,加载成功=2,加载失败=3 “loading_time”: “2020-06-10 10:11:10”, #加载时间 “loading_way”:“1”, #加载类型:1-读取缓存,2-从接口拉新数据 “extend1”:"", #扩展字段 Extend1 “extend2”:"", #扩展字段 Extend2 “type”:“1”, #加载类型:自动加载=1,用户下拽加

2020-06-10 13:59:24 798

原创 hive的order by ,sort by ,distribute by 和 cluster by

order by : 全局排序,一个reduce中完成 sort by : 分区排序,多个reduce中分别完成 distribute by : 将相同字段的map输出分发到一个reduce节点上做处理 cluster by :合并sort by 和distribute by 功能。

2020-05-21 14:36:59 95

原创 SDK和API的区别

SDK可以想象成一个虚拟的程序包,在这个程序包中有一份做好的软件功能,这份程序包几乎是全封闭的,只有一个小小接口可以联通外界,这个接口就是API。

2020-05-21 10:57:50 159

转载 Windows下PATH,CLASSPATH等环境变量详解

Windows下PATH,CLASSPATH等环境变量详解 转载自:https://blog.csdn.net/wf131410000/article/details/72618752

2020-05-21 10:47:59 120

【批量下载】04. 代码等.zip

学习用的资料;

2020-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除