自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(150)
  • 收藏
  • 关注

原创 ES ik分词器踩坑--startOffset must be non-negative

1.建了一个索引,字段text,分词器选的ik_max_word,写入的时候报下面一个错。3.把索引删了重建,用ik_smark分词。

2023-09-06 19:44:57 880

原创 java读文件判断编码格式

是 Mozilla 开发的一个 Java 库,用于自动检测字符集的编码格式。首先,需要将需要检测编码的字符串转换为。来判断字符串的编码格式。Java 中可以使用。

2023-08-25 19:02:43 1453

原创 Hive字符串数组json类型取某字段再列转行

hive 数组 json 列转行

2023-08-23 15:58:06 1220

原创 ES mapping映射属性_source、_all、store和index

这个说的比较清楚。

2023-07-28 09:55:53 234

原创 Excel VLOOKUP使用详解

vlookup

2023-07-12 17:26:47 983

原创 sql自动解析sqlexprparser

分析Druid 连接池中SQL语法树的基本原理 - 知乎

2023-06-20 18:44:25 110

原创 es索引分片重新分配cluster.routing.allocation

【代码】es索引分片重新分配cluster.routing.allocation。

2023-06-14 19:05:27 1740

原创 ES节点磁盘水位线cluster.routing.allocation.disk.watermark

es磁盘水位线

2023-06-14 18:54:25 2284

原创 shell脚本切换用户执行命令

shell脚本切换用户执行命令

2023-05-24 11:54:46 3091

转载 sas基础知识

Ⅱ组, 如: 1-EXP(N/(N-1));求概率P=∑mj=0 CjnPj(1-P)n-j,函数的格式是:PROBBNML(p,n,m),当p=0.5、n=10、m=4时,WHITE(白) BLACK(黑) GREEN(绿) MAGENTA(洋红) RED(红) YELLOW(黄) CYSAN(青兰)C=INTCK('DAY', A, B);③在DATA语句中使用DROP=或KEEP=选择项,如: DATA B(KEEP X Y) C(KEEP Y);

2023-05-19 18:43:51 565

原创 java计算md5

java md5

2023-05-15 19:20:58 418

原创 mysql索引失效场景

15个必知的Mysql索引失效场景,别再踩坑了 - 腾讯云开发者社区-腾讯云

2023-04-26 18:59:31 80

原创 java文件流

【代码】java文件流。

2023-04-26 00:12:12 1171

原创 springboot启动后立即调方法

https://www.cnblogs.com/leigq/p/13406546.html

2023-04-20 20:42:52 56

原创 Linux对比文件diff、md5sum

linux常用命令

2023-04-06 20:22:43 803

原创 es重启临时关闭自动分片

es集群重启

2022-08-31 02:22:58 2952

原创 Elasticsearch慢查询分析

es慢查询

2022-08-18 18:54:09 2452

原创 hbase写入报错: Hbase RegionTooBusyException:over memstore limit =512M

hbase 写入报错:over memstore limit=512m

2022-06-24 17:34:26 3036

原创 hive hash hmod哈希取模用法

hash取模

2022-06-15 22:40:15 3851

原创 nginx配置详解

Nginx 配置详解 | 菜鸟教程

2022-05-09 21:02:34 553

原创 elasticsearch常用命令

es常用命令

2022-05-04 19:29:57 1272

原创 mysql update where 子查询写法

经常遇到要更新一张表,where条件来自另外一张表,直接下面这种写法肯定错的:update table_a set name='aa' where b_id in (select id from table_b)又不想先查出来,再一条一条更新,实在有点慢,如何一条语句搞定,可以用下面的写法:update table_a a,(select id from table_b where name in ('aa')) b set a.name='bb' where a.b_id=b.id and

2022-04-25 15:12:06 9037

原创 git免密

参考:git config --global credential.helper storeGit使用小技巧之免密登录 - 代码无止境 - 博客园

2022-04-06 20:12:54 205

原创 flink内存模型介绍及优化

看这个:配置 Flink 进程的内存 | Apache Flink

2022-02-11 16:22:48 503

原创 常用工具使用技巧

1.excel中怎样设置隔行隔列显示不同颜色-百度经验 https://jingyan.baidu.com/article/ed2a5d1f9e637209f6be1797.html

2021-12-23 12:07:57 85

原创 curl命令详解

post发送带认证的post请求curl -H “Content - type: application/json” --user name:password -X POST -d ‘’ “http://11.1.1.1:1111/aaa”

2021-11-30 11:48:50 357

原创 flink从kafka读数据demo(java)

1.结构flink-demo--src --main --java --com.bob.demo --App --DemoRichSink --FlinkDemo --resources --consumer.properties --start.sh --pom.xml2.具体代码2.1 pom.xml<?xml version="1.0" encoding="UTF-8

2021-11-22 20:29:21 1253

原创 kafka踩坑:kafka内网地址nat后,consumer无法消费问题,及解决方案

一、项目背景二、问题描述三、解决方案四、实施五、总结

2021-11-20 16:34:55 5873 3

原创 flink并行度

【17】Flink 之 并行度(Parallel)及设置_努力学习的大小宝-CSDN博客_flink设置并行度

2021-11-12 18:43:45 1261

原创 kafka消费者offset相关说明

1.kafka中的offset概念Last Committed Offset:consumer group 最新一次 commit 的 offset,表示这个 group 已经把 Last Committed Offset 之前的数据都消费成功了。 Current Position:consumer group 当前消费数据的 offset,也就是说,Last Committed Offset 到 Current Position 之间的数据已经拉取成功,可能正在处理,但是还未 commi.

2021-11-05 19:43:25 2937

原创 flink web页面中文乱码解决

flink on yarn运行,web页面task managers logs和stdout中文显示均乱码(全都问号),解决办法如下:修改flink-1.11.0/conf/flink-conf.yaml增加一行: env.java.opts: "-Dfile.encoding=UTF-8"重启flink程序即可

2021-10-29 16:17:51 2461 2

原创 web判断hdfs节点状态

hdfs做数据迁移的时候,需要清楚主节点是哪个,可以通过get请求方式:http://ip:9870/jmx?qry=Hadoop:service=NameNode,name=FSNamesystem这是cdh集群的,如果是hdp集群,将端口号改为50070根据返回的key tag.HAState判断 active:主节点 standby:从节点举例:...

2021-10-12 14:43:57 433

原创 elasticsearch基础

参考:https://blog.csdn.net/weixin_44318830/article/details/113801281

2021-05-12 20:37:09 98

原创 Flink1.11.2 on YARN滚动日志配置

Flink1.11 on Yarn默认日志是log4j MainAppender非滚动的。如果是流式任务,任务就会常驻,这样日志文件会越来越大(尤其是Task Managers日志),不加处理磁盘空间就会越占越大,页面日志加载响应也会卡顿。所以可以对Flink的日志做一个滚动配置,这样就可以控制日志文件大小。flink on yarn用的log配置默认是flink/conf/log4j.properties配置文件,可修改为:# 滚动日志的配置# This affects logging fo.

2021-04-14 20:29:41 1647

原创 Flink on YARN应用启动全流程

https://baijiahao.baidu.com/s?id=1645634162871796956&wfr=spider&for=pc

2021-04-13 20:59:44 336

原创 hive表分区修复msck

问题hdfs分区路径已经存在,但是hive表中查不出来,元数据缺失导致的解决:MSCK REPAIR TABLE tablename

2021-04-07 14:27:54 230

原创 springboot项目apollo加载顺序调整

问题:项目做配置分离,apollo配置kafka参数,传到logback,启动时拉不到这个参数。原因:apollo配置加载顺序问题,logback初始化时apollo配置还没有注入到spring容器解决办法:调整apollo加载优先级,添加参数:# 启用Apollo配置开关 在应用启动阶段是否向Spring容器注入被托管的properties文件配置信息。apollo.bootstrap.enabled=true# 将Apollo配置加载提到初始化日志系统之前。apollo.

2021-03-24 10:40:44 2091

转载 Typora常用快捷键

常用的快捷键总结一. 字体编辑相关(1) 大小:大小:ctr + 数字 或 ctr + 加减号 或 ###(2) 加粗加粗:ctr + b(3) 倾斜倾斜:ctr + i(4)下划线下划线:ctr + u(5) 删除线删除线:alt + shift + 5着重关键字:ctr + shift + `二 .创建列表相关(1)有序列表:数字 + . + 空格(2)无序列表: - 或者*+ 空格三: 插入相关(1)插入代码块: Ctrl+ S...

2021-03-23 10:21:58 762

原创 Java限制方法访问的并发数-Semaphore

Semaphore也是一个线程同步的辅助类,可以维护当前访问自身的线程个数,并提供了同步机制。使用Semaphore可以控制同时访问资源的线程个数,例如,实现一个文件允许的并发访问数。Semaphore的主要方法摘要:  void acquire():从此信号量获取一个许可,在提供一个许可前一直将线程阻塞,否则线程被中断。  void release():释放一个许可,将其返回给信号量。  int availablePermits():返回此信号量中当前可用的许可数。  boolean

2021-03-19 11:56:47 597

原创 Java连接hdfs指定用户

1.权限问题Permission denied: user=Administrator, access=READ_EXECUTE, inode="/user/test/":test:hdfs:drwx------2.解决办法一: 在系统环境变量或者JVM变量中添加HADOOP_USER_NAME二:代码中设置环境变量(推荐)Configuration conf = new Configuration();// 设定Java客户端访问HDFS的身份System.setProp.

2021-03-09 17:40:16 1853

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除