自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

csa121的博客

记录打杂生活

  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 StarRocks列转行函数unnest

在使用StarRocks引擎做数据开发时,会遇到一些列转行的场景,可以使用unnest函数

2023-03-09 18:05:04 1409

原创 flink checkpoint超时问题排查方法

一般来讲,checkpoint配置10s-60s都是合理的,默认的超时时间是600s,在业务逻辑不复杂的情况下,极少会出现超时的情况如果发生了超时。就需要先定位到具体的机器和进程。然后再根据业务场景排查具体是什么问题引起的超时。flink集群和上下游组件正常运行的情况下,由于业务逻辑处理或者数据问题导致超时的概率应该在99%以上,所以在排除系统问题的情况下,直接从业务逻辑定位问题是正确的方向。排查思路分3步:1. 先找到超时的subtask序号如果超时正在发生,可以直接在这里看到超时的那一条

2021-08-05 15:07:12 2589

原创 jvm学习笔记6--HotSpot的算法细节实现

前面学习了怎么判别要回收的对象,以及垃圾回收的一些方式、标记-清除算法、标记-复制算法、标记-整理算法。现在看看我们每天使用的HotSpot虚拟机中算法的细节实现。根节点枚举前面已经学习到可作为GC Roots的一些变量或者属性,但是实际上在查找过程中要做到高效也是很困难的,要逐个检查以这里为起源的引用肯定要消耗不少时间。而且迄今为止,所有收集器在枚举根节点这步骤的时候都是需要暂停所有的用户线程的,这时就会面临和前面整理内存碎片算法中”Stop The World“同样的问题。目前主流的jvm使用的

2020-07-26 19:00:44 217

原创 jvm学习笔记5--垃圾回收算法

垃圾回收算法可分为2类:* 引用计数式垃圾收集(直接垃圾收集)* 追踪式垃圾收集(间接垃圾收集)java主流的虚拟机都是采用追踪式垃圾收集的方式,我们主要学习这个。分代收集弱分代假说:绝大部分对象都是朝生夕灭的强分代假说:熬过越多次垃圾收集过程的对象就越难消亡跨代引用假说:相对于同代引用只占极少数第3条是根据前2条假说逻辑得出的隐含推论:存在相互引用的2个对象,是应该同时生存或者消亡的。举个例子,如果某个新生代对象存在跨代引用,由于老年代难以消亡,该引用会使得新生代对象在回收时同样存活,

2020-06-04 00:35:39 158

原创 jvm学习笔记4--堆区和方法区的对象回收判别

复习前面有提到jvm的内存模型,我们知道,程序计数器、虚拟机栈和本地方法栈是和线程同生共死的,每个栈帧的大小在类结构确定下来之后就都是已知的。因此这几个区域的内存分配和回收都是有确定性的。然而,java堆和方法区却有着显著的不确定性。只有程序在运行期间,我们才知道具体要创建哪些对象,创建多少对象,分配多少内存。这部分的内存分配和回收都是动态的。所以垃圾回收器所关心的就是这部分内存的管理。复习完之前的内容,我们就知道了垃圾回收器的关心重点在于堆内存的对象管理和方法区管理。在垃圾回收器回收内存之前,要做

2020-06-03 00:59:17 159

原创 jvm学习笔记3--对象的内存布局

今天是520,不管有没有对象,都要学习呀在我们经常使用的HotSpot虚拟机中,对象在堆内存中的布局可以分为3个部分:对象头实例数据对齐填充对象头对象的对象头包含2类信息:用于存储对象自身的运行时数据如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程的id、偏向时间戳等。这些数据的长度在32位和64位虚拟机中,分别占用32bit和64bit,官方称之为"Mark Word"mark word如图所示:类型指针即对象指向它的类型元数据的指针,jvm通过这个指针确认该对象是哪

2020-05-20 23:51:04 182

原创 jvm学习笔记2--对象的产生

提出问题在java的世界中,我们频繁的会使用对象。创建一个对象对我们而言,就是一行代码: User user = new User("hello world");在这行代码的背后,jvm都做了哪些工作呢?学习总结下。对象创建过程当jvm在执行字节码指令的时候,遇到一条字节码new指令的时候,做以如图所示的以下工作:检查常量池先去检查下这个指定的参数在常量池中是否可以定位到一个类的符号引用,并且要去检查这个符号引用所代表的类是否已经被加载、解析和初始化过。有的话,就直接引用;没有的话就要执行

2020-05-15 00:23:50 117

原创 jvm学习笔记1--内存模型

Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而一直存在,有些区域则是依赖用户线程的启动和结束而建立和销毁。如下图所示:...

2020-05-13 23:46:54 169

原创 快速使用django搭建web服务

django是一个python语言开发的web框架,2008年正式发布,目前最新版本是2.1.2。主要的组件以及特点强大的数据库功能自带后台管理功能优雅的网址模板系统缓存系统国际化1 搭建项目安装python2.7或者python3均可,安装pip(默认都有啦)1.1 安装django默认安装最新版(sudo) pip install django指定版本安装(su...

2018-10-25 21:09:49 510

原创 google的tensor2tensor的学习和使用

前言tensor2tensor(t2t)是google基于tensorflow新开源的深度学习库,该库将深度学习所需要的元素(数据集、模型、学习率、超参数等)封装成标准化的统一接口,在使用其做模型训练时可以更加的灵活。当前环境mac 10.13.3tensorflow 1.6.0tensor2tensor 1.5.5安装模块源码下载:https://git...

2018-03-18 21:59:07 21211 31

原创 flume1.8在线上业务中的使用和总结

什么是flume?flume是一个日志采集、聚合和传输的系统 作用是什么?作用就是将业务集群上各个机器上的日志收集起来,对数据做集中处理。部署文档最新版的flume1.8,请参官网 http://flume.apache.org/FlumeUserGuide.html 的使用说明,真的很详细。网上也有flume1.7的搭建教程,Google一下就可以,搭建过程...

2018-02-27 20:37:05 1763

原创 python数据清洗流程和注意点

应用python来做数据清洗业务是最好的选择,简单的数据清洗流程分为三部分,前期需求分析、输出设计,中期的开发和调试,后期的测试和数据校验。需要熟练掌握python中的dict、list和set集合来处理简单的数据需求。

2017-11-15 21:57:42 2939 1

原创 scrapy写爬虫注意事项

前段时间有个scrapy爬虫的需求,简单介绍下在学习scrapy这中间踩的坑吧。以及需要注意的地方。

2017-08-29 21:53:50 476

django基础入门代码

django基础入门的代码参考 https://blog.csdn.net/csa121/article/details/83386572 文章使用。文章中的所有代码示例都在资源包中。

2018-10-26

google的tensor2tensor的学习源码

可以参考 https://blog.csdn.net/csa121/article/category/7518359 学习使用

2018-09-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除