故事写在心里--CSDN博客

原创 Hive 四种排序（亲手实战 + 理解，烦请您过目）

文章目录:1、全局排序（order by）① 使用order by排序的子句在select 结尾处。降序：desc升序：asc 不需要指定，默认是升序②案例实操：结果：2、区内排序（sort by ）分区字段 (distribute by)设置reduces 个数:set mapreduce.job.reduces = 3;distribute by 分区字段 store by 排序字段联合使用②案例实操：不是全局排序，其在数据进入reducer前完成排序。因此，如果用sort by进行排序，并且

2020-05-26 18:39:43 7561 59

原创 Presto 概念及架构

文章目录:一、概念：1.1 Presto概念1.2 Presto应用场景1.3 Presto的架构组成部分：1.4 Presto 优点：Presto 缺点：二、Presto优化2.1数据存储2.2 查询SQL优化2.3 无缝替换Hive表2.4 建表格式的选择搭建部分不写了就。官网查看。【转载注明出处，还望尊重原创】【作者水平有限，如有错误欢迎指正 .】一、概念：Presto 是一个开源的分布式SQL查询引擎，数据量支持GB到PB字节，主要用来处理秒级查询的场景。1.1 Presto概念P

2020-05-18 19:19:20 4378 66

原创数据库面试题实战解答

目录：1、触发器的作用？2、什么是存储过程？用什么来调用？3、存储过程的优缺点4、索引的作用？和它的优点缺点是什么？5、什么是内存泄漏？6、维护数据库的完整性和一致性，你喜欢用触发器还是自写业务逻辑？为什么？7、什么是事务？什么是锁？8、什么叫视图？游标是什么？9、 where和Having区别：10、on和in的区别:11、union和union ALL 的区别:12、数据库的备份类型：13、...

2020-04-19 14:27:25 4237 49

原创面试常问：Hive分区与分桶的区别

分区表与分桶表的区别：创建表时可以同时为表创建一个或者多个分区，我们在加载数据时为期指定具体的分区，查询数据时可以指定具体的分区从而提高效率。分区表是把分区当成目录的，分区实际上是将表文件分成多个有标记的小文件以方便查询。桶表：1.分区表是将大的表文件划分成多个小文件以利于查询，但是如果数据分布不均衡，也会影响查询效率。2.桶表可以对数据进行哈希取模，目的是让数据能够均匀的分布在...

2020-03-14 09:21:26 4942 37

原创 Cloudera Manager大数据平台

一、CDH概述前言：Cloudera 提供了 Hadoop 的商业发行版 CDH ，能够十分方便地对 Hadoop 集群进行安装、部署里面不仅包含了 loudera 的商业版 Hadoop ，同时 DH 中也包含了各类常用的开源数据处理与存储框架，如 Spark Hive HBas 等。CDH和Hadoop对比Hadoop 大致分为 Apach Hadoop 和第三方发行版 Ha...

2020-03-10 19:03:43 768 17

原创 MySQL 数据库索引与复制表结构方式

一、数据库索引作用：提高查询速度确保数据的唯一性可以加速表和表之间的连接，实现表与表之间的参照完整性使用分组和排序子句进行数据检索时，可以显著减少分组和排序的时间全文检索字段进行搜索优化二、索引分类主键索引（PRIMARY KEY）唯一索引（UNIQUE）常规索引（INDEX）全文索引（FULLTEXT）主键：某一个属性组能唯一标识一条记录如：学生表（学号，姓名，班级，...

2020-02-27 14:17:13 1044 19

原创 Oracle窗口函数和分析函数

一、分析函数带有一个开窗函数over()，包含三个分析子句:分组(partition by), 排序(order by), 窗口(rows) ，他们的使用形式如下：分析函数名(参数) over (partition by 子句 order by 子句 rows/range… 子句)(注：若窗口函数内和sql语句末尾共存在两个order bya) order by 字段两者一致：即sql语句中的...

2020-01-15 11:57:23 2433 39

原创 SQL语言概述

SQL 全称是结构化查询语言，英文译作 Structured Query Language，它是一种在关系型数据库中定义和操纵数据的标准语言一、SQL语言的特点：集合性SQL 可以在高层的数据结构上进行工作，工作时不是单条地处理记录，而对数据进行成组的处理。所有 SQL 语句都接受集合作为输入，并且返回集合作为输出，SQL 的集合特性允许一条 SQL 语句的结果作为另一条 SQL...

2020-01-14 17:36:16 692 19

原创 Oracle 数据库的基本概念及搭建

概述：Oracle是著名的Oracle(甲骨文)公司的数据库产品。Oracle是世界上第一个商品化的关系型数据库管理系统。Oracle采用标准SQL（结构化查询语言），支持多种数据类型，提供面向对象的数据支持，具有第四代语言开发工具，支持UNIX、WINDOWS、OS/2等多种平台。Oracle公司的产品丰富，包括Oracle服务器、Oracle开发工具和Oracle应用软件。其中最著名的就是O...

2020-01-10 16:03:38 3208 20

原创工作中常用的Lambda表达式

【代码】工作中常用的Lambda表达式。

2023-04-02 11:47:37 178 1

原创 MybatisPlus 中的 SQL 使用函数

数据库自己去建一张表对应的。

2022-11-12 16:17:21 1043

原创电脑上卸载流氓软件—UniAccessAgent

https://blog.csdn.net/xioayu96/article/details/108335469

2022-08-20 18:54:11 1689

原创 ES 面试题总结 ----＞第六章节

系统中的数据，随着业务的发展，时间的推移，将会非常多，而业务中往往采用模糊查询进行数据的搜索，而模糊查询会导致查询引擎放弃索引，导致系统查询数据时都是全表扫描,在百万级别的数据库中，查询效率是非常低下的，而我们使用ES做一个全文索引，将经常查询的系统功能的某些字段，比如说电商系统的商品表中商品名，描述、价格还有id这些字段我们放入ES索引库里，可以提高查询速度。如果你要在更快的CPUs和更多的核心之间选择，选择更多的核心更好。master节点的职责主要包括集群、节点和索引的管理，不负责文档级别的管理;...

2022-07-15 22:20:54 464

原创针对 JavaAPI ElasticSearch 操作 ----＞第五章节

代码】针对JavaAPIElasticSearch操作----＞第五章节。

2022-07-15 15:06:14 237

原创 ElasticSearch【乐观并发控制】----＞第四章节

Elasticsearch乐观并发控制文章案例学习：http://t.zoukankan.com/huangying2124-p-11986897.html

2022-07-10 15:36:48 304

原创 ElasticSearch 【增删改查之动态、静态映射】操作---＞第三章节

1.1、创建索引:格式: PUT /索引名称举例: PUT /db_index1.2、查询索引:格式: GET /索引名称举例: GET /db_index方式二：可以在浏览器进行查询方式三：也可以在APIPOst进行测试。1.3、删除索引:格式: Delete /索引名称举例: Delete /db_index1.4 添加文档:格式:PUT /索引名称/类型/id举例:遇到的问题:1.4.1 在执行下面的时候,报错类型不支持。解决办法:_doc 改为这个类型可以插入成功！要添

2022-07-09 23:05:32 249

原创 Linux 环境搭建 kibana ----＞第二章节，踩坑集

1、细心点找上面的配置地方2、替换自己的。3、访问的时候没有后缀的，注意下。4、后台运行的方法:1）启动参考报错：https://blog.csdn.net/weixin_45495060/article/details/1251833412）授权思路：http://t.zoukankan.com/xiaomaomao-p-15573991.htmlhttps://blog.csdn.net/chenxb1986/article/details/84262331...

2022-07-09 18:15:59 123

原创 ElasticSearch Linux 环境搭建----＞第二章节，踩坑集

http://t.zoukankan.com/it-deepinmind-p-14275872.html我这里安装的ES 是8.X版本的，JDK 替换成了17的。总结：之前7.X 版本需要改名，可能需要，但是我安装的是8.X版本不需要改名了。因为安全问题，ES 不允许root 用户直接运行，所以要创建新用户，在root用户中创建新用户。esuser soft nofile 65536esuser hard nofile 65536/opt/software/es/elasticsearch-8.3.2

2022-07-09 15:16:10 292

原创 ElasticSearch 开篇----＞第一章节

Elasticsearch是一个分布式、RESTful风格的搜索和数据分析引擎，能够解决不断涌现出的各种用例.作为Elastic Stack的核心，它集中存储您的数据，帮助您发现意料之中以及意料之外的情况。The Elastic Stack，包括 Elasticsearch、Kibana、Beats和 Logstash(也称为ELK Stack)。能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。Elaticsearch,简称为ES，ES是一个开源的高扩展的分布式全文搜索

2022-07-08 14:38:21 155

转载 Yarn的基础介绍以及job的提交流程

YARN 是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。ResourceManager：ResoueceMananer是基于应用程序对集群资源的需求进行调度的yarn集群的主控制节点，负责协调和管理整个集群，相应用户提交的不同的类型的应用程序，解析、调度、监控等工作。ResourceManager会为每一个application启动一个MRappmaster，并且MRappmaster分散在各个n

2022-07-06 14:48:48 363

原创事务注解学习: @Transactional(rollbackFor=Exception.class)

在项目中，@Transactional(rollbackFor=Exception.class)，如果类加了这个注解，那么这个类里面的方法抛出异常，就会回滚，数据库里面的数据也会回滚。也就是带 SQL 事务代码得时候才使用。

2022-06-06 13:16:15 929 1

原创 SpringBoot内置工具类应有尽有，真香香香

文章目录:断言对象、数组、集合StringUtils ：CollectionUtilsFileCopyUtils (文件、资源、IO 流)ResourceUtils (从资源路径获取文件) ：StreamUtils：ReflectionUtils(反射、AOP)：AopUtils：断言1.断言是一个逻辑判断，用于检查不应该发生的情况2. Assert 关键字在 JDK1.4 中引入，可通过 JVM 参数-enableassertions开启3. SpringBoot 中提供了 Assert 断言工

2022-05-18 11:22:08 178

原创 Redis 连接超时：io.netty.channel.ConnectTimeoutException: connection timed out:

这个大坑问题，找了一天一夜的问题，睡觉都在想，为啥会本地连接超时呢，首先我连接的时Redis 哨兵集群:关键信息：最后有篇文件说让关闭了6379 端口：因为我的是基于服务器，所以我就试着关闭了下，真的就可以连接上了。奇葩的问题1. 在yml 中配置如下：2. pom文件配置如下： <dependency> <groupId>org.springframework.boot</groupId> <artifactId

2022-05-04 15:39:22 4224

原创 Redis 主从搭建_ (及遇到的坑)

文章目录:前言：开始搭建Redis 主从集群:1.上传下载好的 linux 版本的Redis 的服务器：2.集群规划：3. 我们创建三个文件夹，名字分别叫7001、7002、7003：4.拷贝配置文件到每个实例目录5.修改每个实例的端口、工作目录6.修改每个实例的声明IP逐一执行7.启动8.启动完成之后报错信息:自言自语中:敲黑板：开始测试查看状态主从集群永久生效和临时生效两种：9.总结：前言：今天是五一劳动节的第二天，心血来潮，买来一台服务器，搭建redis集，解决下本地java 中的另外一个问题

2022-05-02 23:22:13 749

原创 fastJson序列化和反序化（记录一下）

@Testvoid testuser(){ User user = new User(); user.setNickName("nick"); user.setPhone("13653602974"); user.setId(1L); String resultJson = JSON.toJSONString(user); // 转json stringRedisTemplate.opsForValue().set("Person:",resultJson); String person

2022-04-23 15:49:53 398

原创关于MySQL自定义排序（Java & MySQL 版本）

前言：首先需要这个自定义排序的字段需求是，在本地项目的点赞功能时比如你有两个id ，需要对先点赞的用户id 这个字段先显示后面的，现在点赞的用户显示在前面时，用到。1、数据库字段sql 实现当字段的值比较多时，首先想到的肯定时in 这个字段。然后查询：id 1 在前，5在后，我需要 5 在前1 在后这个样子才合了我的口味。2、Mybatis 中怎们实现这个自定义排序功能1、在Mapper 文件中我试了下暂时还没想出来，后面研究。2、根据老师的写法如下：重点：3、但是这样写是有问题：在

2022-04-17 17:19:50 1417 1

原创 Error getting generated key or setting result to parameter object. Cause: org.apache.ibatis.executor

报错信息:Error getting generated key or setting result to parameter object. Cause: org.apache.ibatis.executor.ExecutorException: Could not determine which parameter to assign generated keys to. Note that when there are multiple parameters, ‘keyProperty’ must

2022-04-15 16:25:50 5926 5

转载 IDEA 本地如何一次性启动多个服务项目

在IDEA中一个项目启动多次有两种方式，现在和大家分享一下。第一种、第一步、选择“Edit Configurations”第二步、勾选“Allow parallel run”以上操作完成后就OK啦。不过重复运行项目前，记得要先更改项目的端口号哈，不然端口号被占用启动不起来哦。第二种、使用“-Dserver.port=8080”使用 -Dserver.port设置要使用的端口号就可以了...

2022-04-09 00:08:57 4687

原创 Failed to deserialize java.time.LocalDateTime:

在本地post 请求数据时解析时间时报错：思路：1.后端属性是：private LocalDateTime date;2.前端提交的参数：不是json或者格式 2020-11-19解决：1.加上注解@JsonFormat(shape = JsonFormat.Shape.STRING, pattern=“yyyy-MM-dd HH:mm:ss”)private LocalDateTime date;2.提交的时间格式：yyyy-MM-dd HH:mm:ss /**

2022-04-07 17:57:08 7204

原创使用 APIPost 本地测试报错401状态解决办法：org.springframework.http.converter.HttpMessageNotReadableException: JSON

前言：实现需求就是先从redis 查询缓冲，缓存与数据库双写一致性需要，如果管理段更新了数据，那么数据库和redis 中的数据都是一致的才对。还原报错控制台异常日志：2022-04-04 22:38:36.214 ERROR 14084 — [nio-8081-exec-1] com.hmdp.config.WebExceptionAdvice : org.springframework.http.converter.HttpMessageNotReadableException: JSO

2022-04-05 14:57:54 3639

原创 Yarn 的基本思想

YARN的基本思想是将资源管理和调度及监控功能从MapReduce分离出来，用独立的后台进程实现。这个想法需要有一个全局的资源管理器（ResourceManager），每个应用还要有一个应用主管（ApplicationMaster）。应用可以是一个单独MapReduce作业，或者是一个作业的有向无环图（DAG）。资源管理器和节点管理器（NodeManager）构成了分布式数据计算框架。资源管理器是系统中所有应用资源分配的最终仲裁者。节点管理器是框架中每个工作节点的代理，监控节点CPU、内存、磁盘、网.

2022-03-26 21:23:49 1844

原创 ArrayList 和 LinkedList 的区别，ArrayList 为什么查询快（为什么用数组就快）

2022-03-23 15:07:52 412

原创 JavaSE 基础知识面试题大总结

文章目录:1.什么是B/S架构？什么是C/S架构2.你所知道网络协议有那些？3.Java都有那些开发平台？4.什么是JVM？java虚拟机包括什么？5.Java是否需要开发人员回收内存垃圾吗？6.什么是JDK？什么是JRE?7.什么是数据结构？8.Java的数据结构有那些？9.什么是OOP?10.什么是面向对象？11.类与对象的关系?12.Java中有几种数据类型13.什么是隐式转换，什么是显式转换14.Char类型能不能转成int类型？能不能转化成string类型，能不能转成double类型15.什么是拆

2022-03-22 21:38:54 150

Spark算子.pdf

空空如也