自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 idea本地编译Spark源码报错

之前不知道在哪里听说的,程序员不需要关注WARNING日志😭。将Maven版本升级到3.8.7后问题解决。2、升级Maven版本详细步骤。仔细看日志其实说的比较清楚了。

2023-11-03 16:53:17 82

原创 Spark SQL源码阅读flag

并且想从阅读SparkSQL源码开始,学习Spark源码的设计理念思路,学习里面的设计模式、SQL解析方案、SQL优化能力等,深入了解之后,争取能在开源社区领取几个issue解决,也做一次Apache contributer。一直使用SparkSQL,总是看别人关于Spark SQL的源码解读文章,觉得自己对Spark比较了解深入,但是真正在做一些更深层次的追究时,还是不够的。今天立下此flag,每天争取抽1到两个小时学习时间,完成对Spark SQL和Hive源码的阅读、标记。

2023-10-26 20:44:03 90

原创 Spark job预估还有多久运行完

有时Spark job启动之后想看看还有多久才能运行完成,可以通过上下不stage的write和read数量来粗略的判断。也就是还剩下 14219 - 12770 = 1449条数据没有处理。下一个stage 10。

2023-04-21 17:41:53 139

原创 Process exited with an error: 240 (Exit value: 240)

并且有堆溢出[ERROR] error: java.lang.StackOverflowError。idea本地运行项目没有问题,打包的时候如上错误。

2023-03-28 17:15:14 312

原创 JSONArray排序

JSONArray中封装的是JSONObject,根据JSONObject中的属性排序。JSONObject格式如下:[ { "status" : "COMPLETE", "stageId" : 16, "attemptId" : 0, "numTasks" : 1, "numActiveTasks" : 0, "numCompleteTasks" : 1, "numFailedTasks" : 0, "numKilledTasks" : 0, "numComplete

2021-11-17 14:43:02 3460

原创 2021-11-02T12:23:23.222GMT转换

2021-11-02T12:23:23.222GMTSpark History Service RestFul Api返回的时间格式是如上,不能使用SimpleDateFormat sdf = new SimpleDateFormat(“yyyy-MM-dd’T’HH:mm:ss.SSS’GMT’”);来转换,虽然可以解析成时间戳,但是不会默认转成东八区时间。要使用如下方式来转换:SimpleDateFormat sdf = new SimpleDateFormat(“yyyy-MM-dd’T’HH

2021-11-02 19:07:36 914

原创 字符串拼接:String +=、StringBuilder.append()性能对比测试

都说在大量字符串拼接时尽量使用StringBuilder.append()来代替String += 来提高效率,但是出于好奇想看一下究竟效率差多少。写个程序测试一下:public class Test { private static final Logger logger = LoggerFactory.getLogger(Test.class); public static void main(String[] args) { Integer num = 100;

2021-08-17 15:29:29 935

原创 对Map中按值进行排序

1.问题描述某些场景需要对map按value进行排序,我的一个开发场景就是如此。取出差值倒叙排序,分析前80%。2.上代码不多说,直接上代码public class Test { private static final Logger logger = LoggerFactory.getLogger(Test.class); public static void main(String[] args) { HashMap<String, Double>

2021-08-10 15:09:34 544

原创 Spark SQL 写入Hive ORC格式表报错问题

Spark SQL 写入Hive ORC格式表报错问题报错信息问题定位我的解决办法报错信息21/07/20 18:31:25 [task-result-getter-1] WARN TaskSetManager: Lost task 491.1 in stage 10.0 (TID 5637, BJLFRZ-10k-210-143.hadoop.jd.local, executor 94): org.apache.spark.SparkException: Task failed while writi

2021-07-29 11:31:44 1837

原创 MySQL修改my.cnf配置不生效的解决方法

MySQL修改my.cnf配置不生效的解决方法我这边my.cnf配置比较多,将新增的配置写在了配置的最后,而没有写在mysqld后面,导致配置不生效找了好久的原因。希望帮助到遇到同样问题的道友

2021-06-21 14:03:26 543

原创 Kafka代码连不上:Recovery is suppressed by NoRestartBackoffTimeStrategy

Kafka代码连不上:Recovery is suppressed by NoRestartBackoffTimeStrategy问题描述:Kafka客户端可以连接,远程通过代码就连接不上。是一个参数没有配置,而且这个ip必须写实际ip不能是localhost

2021-03-25 17:51:04 13915 12

原创 String与List判空,记住一点,先判null,再判“”

在java编程中会经常遇到String与list判断为空的情况,下面做一些记录。String:String有null,和 “” 两种情况,如果都需要去除掉可以直接使用StringUtils.isEmpty()方法进行判断。StringUtils.isEmpty()中执行的代码是:这里需要注意两个判断的先后,如果先判断string.length==0,在string为null的情况就会报错空指针异常。ArrayList:在ArrayList判断为空的情况时:同理也要先判断null,再使用list

2020-11-13 10:55:15 635

原创 想要shell脚本在全局可以使用

需要将xxx.sh命令放到 /usr/local/bin/ 目录下一般情况下,我会建立对应的一个软链接到bin下ln xxx.sh /usr/local/bin

2020-11-10 18:07:41 1139

原创 Permission denied: user=administrator, access=WRITE, inode=“/“:root:supergroup:drwxr-xr-x

Permission denied: user=administrator, access=WRITE, inode="/":root:supergroup:drwxr-xr-x收藏中有网上的解决方法,更改系统环境变量我没有生效。我的解决方法:object HiveSupport { def main(args: Array[String]): Unit = { System.setProperty("HADOOP_USER_NAME","hadoop") val spark: S

2020-09-23 11:27:14 229

原创 Maven打包时抛出should not point at files within the project directory …异常

1.问题:打包的时候报错,在网上找了很多但是都没有解决我这个现象最后一个个依赖添加,找出原因。希望能够帮助其他人。如果你得到解决请告诉我一声,让我知道记录错误有意义。2.现象3.原因和解决引入了外部依赖,但是没有加入version标签。加入version后再次打包成功。...

2020-06-18 15:42:43 1056

原创 没有那个文件或目录

执行shell脚本的时候,存在的目录确报错:没有那个文件或目录描述解决描述为了方便编写shell脚本,是在window下使用notpad++ 编辑的之后上传。出现这样的情况是因为win和Linux文件格式的不同;解决vim filename然后查看当前文件格式命令:set ff会显示window下的格式是dos,我们需要改为unix格式:set ff=unix再次执行不会报...

2020-03-11 10:43:07 719

原创 冒泡排序最优代码

冒泡排序最优代码原理:比较两个相邻的元素,将值大的元素交换至右端优点:每进行一趟排序,就会少比较一次,因为每进行一趟排序都会找出一个较大值。public class BubbleSort { public static void main(String[] args) { int[] arr = {6,3,7,9,2,1,4,5}; System.ou...

2019-10-14 15:07:12 201

原创 Kettle遇到的坑

![使用Kettle加载mysql数据到hive中,遇到的坑导入hive后的数据映射始终为null, 各种找错误原因. 最终因为分隔符’,'的中英文原因.真是哭晕在厕所,这么无意义的问题找了近一个小时. ????立贴为见](https://img-blog.csdnimg.cn/20191014085937430.png?x-oss-process=image/watermark,type_Z...

2019-10-14 09:16:35 398

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除