自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (33)
  • 收藏
  • 关注

原创 sparkstream-kafka

最近想弄一个sparkstream的实时监控,spark(1.2.0-cdh5.3.0)对接kafka。使用wordcount的例子如下:1.按照kafka官网quick start教程将kafka跑起来:http://kafka.apache.org/2.用eclipse 随意构建一个maven工程,在pom.xml中添加如下:

2015-05-14 18:33:02 985

原创 环境搭建(五) 错误笔记

hadoop-oozie配合使用有各种蛋疼问题,大多跟配置有关,部分记录如下:1.hadoop-2.5.0-cdh5.3.0 =》oozie4.4.0-cdh5.3.0 oozie对hadoop的身份认证问题 User: xxx is not allowed to impersonate xxx  $HADOOP_HOME/etc/hadoop/core-site.xml中进行设置,我

2015-04-27 13:11:17 677

原创 走进spark(二) rdd.persist

走进spark(二) rdd.persisit上篇我们讲到通过调用rdd.checkpoint,可以将rdd存储在磁盘,除此之外rdd还有一个有意思的持久化方法rdd.persist,代码如下:defpersist(newLevel: StorageLevel):this.type= {  // TODO:Handle changes of StorageLevel  if

2015-04-20 18:00:08 1643

原创 走进spark(一) rdd.checkpoint

RDD无疑是spark框架中的核心概念之一,RDD是什么?概念太抽象,不如看看RDD有什么用。本篇主要介绍rdd的容错机制之一checkpoint,就是将RDD写入disk进行做检查点。大致浏览 论文 ,RDD上的操作分为两种:transformation和 action.(1)    Transformation =>从一个\多个rdd生成另一个rddFilter,map,sam

2015-04-17 13:37:02 1436

原创 环境搭建(四)oozie3.3.2(ubuntu10.0.4)

.环境搭建(5)oozie3.3.2转至元数据结尾Created and last modified by 刘桂林 on 三月 11, 2015转至元数据起始考虑到hadoop-spark-oozie体系的稳定性,这里配置oozie3.3.2Step-by-step guide准备工作安装mysql

2015-04-16 14:55:14 490

原创 环境搭建(三)hive0.12.0(ubuntu10.0.4)

Step-by-step guide在mysql数据库中创建hive用户$ mysql -u root -p > use user; > insert into user(Host,User,Password) values("localhost","hive",password("hive"));下载,配置环境变量$ wget http://archive.apa

2015-04-16 14:53:00 320

原创 环境搭建(二)spark1.0.2 (ubuntu10.0.4)

考虑到hadoop,spark框架的稳定性,这里使用spark1.0.2Step-by-step guide       0.安装scalaspark框架使用scala开发下载scala$ wget http://www.scala-lang.org/files/archive/scala-2.10.4.tgz$ tar zxvf scala-2.1

2015-04-16 14:49:06 363

原创 环境搭建(一)hadoop2.2.0 (ubuntu10.0.4)

目前的开发测试环境中用到map-reduce框架,hive数据库,spark也涉及了hdfs文件系统,因此有必要配置Hadoop环境,考虑到整个框架的稳定性等因素,这里搭建hadoop2.2.0.准备工作:安装了jdk,测试:java -version安装了vim,测试: vim a.txt正式安装:下载 hadoop-2.2.0.x86_64.tar.gz$

2015-04-16 14:45:00 447

wide & deep.pdf

wide & deep.pdf

2020-11-09

在线最优化求解(Online Optimization)-冯扬-2014.12.09.pdf

在线最优化求解(Online Optimization)-冯扬-2014.12.09.pdf

2020-11-09

并行逻辑回归.pdf

并行逻辑回归.pdf

2020-11-09

深入理解FTRL.pdf

深入理解FTRL.pdf

2020-11-09

word2vec中的数学原理详解

word2vec中的数学原理详解

2020-10-29

SQL Practice Problem.pdf

SQL Practice Problem.pdf SQL Practice Problem.pdf SQL Practice Problem.pdf SQL Practice Problem.pdf

2017-11-14

Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf

Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf

2017-11-14

Effective Scala

Effective scala ,scala 学习丛书 Effective scala ,scala 学习丛书

2017-11-14

lucene应用开发揭秘 第四讲

lucene应用开发揭秘 第四讲

2012-07-31

java参考大全

java参考大全 可复制 文字版 高清

2012-07-27

深入java虚拟机 源代码

深入java虚拟机 源代码

2012-07-23

庖丁分词 jar

庖丁分词 jar

2012-07-18

IKAnalyzer3.2.5 jar

IKAnalyzer3.2.5 jar 配合lucene实现中文分词

2012-07-16

基于Solr的搜索引擎研究与实现

基于Solr的搜索引擎研究与实现

2012-07-13

Linux常用命令全集

Linux常用命令全集

2012-07-13

lucene in action 源码包

lucene in action 源码包

2012-07-13

lucene搜索引擎开发权威经典 源码包

lucene搜索引擎开发权威经典 源码包 将lucene分成一个个的模块的源码包 学习lucene的绝佳资料

2012-07-13

lucene in action 中文版

lucene in action 中文版 高清 带目录

2012-07-13

最完整的lucene原理与代码分析

最完整的lucene原理与代码分析

2012-07-13

华为java编程规范

华为java编程规范

2012-06-19

数据结构 严蔚敏 书 代码

数据结构 严蔚敏 书+代码 清华大学出版社

2012-05-24

搜索引擎信息检索实践 ppt 课件 随书ppt

搜索引擎信息检索实践 ppt 课件 随书ppt 原版ppt

2012-05-24

java算法大全

java写的很多算法,高清文字版·

2012-05-17

java数据结构和算法

高清 文字版 目前我发现的最清晰的版本了 有目录 可选中文本 用着爽

2012-05-17

java笔试面试题

java 笔试面试题,你要应聘的的是java开发吗?那赶紧看吧

2012-03-10

软件测试工程师面试题

比较齐全的软件测试面试题,如果要去面试的书,那么,下吧

2011-12-02

C++参考大全

C++参考大全,学c++必备书籍,值得珍藏~~

2011-11-26

形式语言与自动机导论 linz peter

An Introduction to Formal Languages and Automata 形式语言与自动机导论

2011-10-31

ACM 程序设计 教材

ACM程序设计教材,绝对值得珍藏,好东西~~

2011-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除