自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

混混

个人站点地址 http://bigdatadecode.club/

  • 博客(6)
  • 资源 (5)
  • 收藏
  • 关注

原创 YARN源码分析之ApplicationMaster启动流程之NM端

上一篇介绍了RMAppMaster在RM端的启动流程,本篇继续介绍下在nodemanager端的启动流程。接着上篇的逻辑继续看下node端的startContainers代码:public StartContainersResponse startContainers(StartContainersRequest requests) throws YarnException,

2017-07-12 09:52:02 1097

原创 YARN源码分析之ApplicationMaster启动流程之RM端

任何一个计算框架或者说一个服务要运行在yarn上,都需要一个master来对job进行管理,这个master就是ApplicationMaster。ApplicationMaster是一个job的大脑,下面就以MapReduce为例,介绍下ApplicationMaster的启动流程。首先client向RM提交一个application请求,RM创建一个application,然后再创建一个appa

2017-07-12 00:02:34 800

原创 Docker初体验

最近接触了点docker相关的技术,在此小记下。安装docker有多系统现在默认装了docker,可以运行docker启动命令尝试下

2017-06-27 23:34:28 359

原创 unclean.leader.election.enable引起的outOfRanger

前段时间采集平台的数据量发生异常,对数据进行排查发现hdfs上存在历史数据重复消费的问题。 采集平台是由TailDirSource+KafkaChannel将数据写入kafka,然后通过kafkaChannel+HDFSSink将数据写入hdfs 整个采集平台可能出现的故障的地方如下: taildir重复采集了log taildir调用kafkachannel向kafka写数据时进行了回滚

2017-06-24 17:10:03 1893

原创 YARN源码分析之ApplicationMaster分配策略

一次和朋友的谈话中涉及到ApplicationMaster的container分配策略是什么,我映像中是随机分配的,但他说是根据各节点空闲资源来分配的。 之前看代码的时候也没注意这块的逻辑,既然现在有了疑惑那就去代码里瞅瞅。个人站点地址:http://bigdatadecode.club/YARN源码分析之ApplicationMaster分配策略.html从MR的运行log中可以找到AM的con

2017-06-15 10:54:50 2909 1

原创 flume事务解析

在flume中事务是一个重要的概念,事务保证了数据的可用性。这里的事务有别于数据库中的事务,比事务在回滚时,可能会造成数据重复,所以flume保证的是每条数据最少发送一次,以此来保证数据不丢失。此篇从具体的数据流中分析事务,配置的数据流是taildir+kafkachannel,然后kafkachannel+hdfsSink。kafkachannel中维护了两个事务,分别是put事务和take事务。

2017-06-07 23:02:13 3213

用R实现随机森林的分类与回归

用R 实现随机森林的分类与回归 Applications of Random Forest using R Classification and Regression

2014-03-12

Java超市进销存(毕业设计及答辩资料)

用java写的超市管理系统,用的是sql的数据库

2013-05-06

操作系统处理机调度模拟

进程调度是处理机管理的核心内容,本实验要求用高级语言编写模拟进程调度程序,以便加深理解有关进程控制块、进程队列等概念,并体会和了解优先数算法和时间片轮转算法的具体实施办法。

2011-05-12

操作系统之处理机调度

进程调度是处理机管理的核心内容,本实验要求用高级语言编写模拟进程调度程序,以便加深理解有关进程控制块、进程队列等概念,并体会和了解优先数算法和时间片轮转算法的具体实施办法。 c环境下编写

2011-05-12

it本三求职攻略 pdf

本三的我们没有必要自卑,只要我们付出努力我们一样可以成功,加油

2011-01-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除