自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(975)
  • 资源 (18)
  • 收藏
  • 关注

原创 Alluxio Master - BlockMaster

Alluxio Master - Block Master

2016-11-10 22:49:49 1289

原创 Alluxio架构图-Worker

2016-10-23 14:40:55 2073

原创 Alluxio架构图-Master

Alluxio

2016-10-23 14:39:21 2461

原创 Alluxio架构图-总

注释:先把最粗的架构图填上

2016-10-23 14:37:18 1786

翻译 Alluxio Paper

Alluxio Paper原文 : http://people.eecs.berkeley.edu/~haoyuan/papers/2014_EECS_tachyon.pdf Reliable, Memory Speed Storage for Cluster Computing Frameworks本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Mark

2016-10-21 19:31:07 985

转载 欢迎使用CSDN-markdown编辑器

解析json之net.sf.jsonCome From:http://blog.csdn.net/itlwc/article/details/38442667下载地址 [plain] view plaincopy在CODE上查看代码片派生到我的代码片 本次使用版本:http://sourceforge.net/projects/json-lib/files/json-lib/json-lib-1

2015-07-07 22:04:30 705 1

转载 正则表达式 不包含指定字符串

参考资料 http://www.imkevinyang.com/2009/08/%E4%BD%BF%E7%94%A8%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E6%89%BE%E5%87%BA%E4%B8%8D%E5%8C%85%E5%90%AB%E7%89%B9%E5%AE%9A%E5%AD%97%E7%AC%A6%E4%B8%B2%E7%9

2015-04-08 21:48:57 6923

转载 ant

target>  target name="compile" depends="init" description="compile the source " > javac srcdir="${src}" destdir="${build}"/> target>  target name="dist" depends="compi

2015-04-08 21:48:53 725

转载 Centos 5 install SVN 1.7.X

Coming From: http://blog.csdn.net/pengyouchuan/article/details/8198667可以在这里下载http://subversion.apache.org/packages.html#centosCentOS默认的yum --install subversion ,安装的是1.6版本WANdis

2015-03-21 11:31:47 1512

转载 Virtualbox set shared folder

1. 安装增强功能包(Guest Additions)安装好Ubuntu 11.04 后,运行Ubuntu并登录。然后在VirtualBox的菜单里选择"设备(D)" -> "安装增强功能(I)..."。您会发现在Ubuntu桌面上多出一个光盘图标,这张光盘默认被自动加载到了文档夹/media/VBoxGuestAdditions-4.1.4进入命令

2015-03-21 11:09:05 849

转载 Linux命令----分析CPU的瓶颈

衡量CPU性能的指标:1,用户使用CPU的情况;CPU运行常规用户进程CPU运行niced processCPU运行实时进程2,系统使用CPU情况;用于I/O管理:中断和驱动用于内存管理:页面交换用户进程管理:进程开始和上下文切换3,WIO:用于进程等待磁盘I/O而使CPU处于空闲状态的比率。4,CPU的空闲率,除了上面的WIO以外的空闲时间

2015-01-28 00:11:36 835

转载 solaris上应该如何监控CPU使用情况

在solaris系统上,通常可以使用top和prstat命令监控CPU使用情况。但仅使用这两个命令还不够,因为这两个命令看到的CPU使用率是占全部CPU的比例。也就是说,如果服务器有10个CPU,其中9个CPU使用率为0,1个CPU使用率为100%,那么这两个命令看到的CPU使用率是10%。从整体上看似乎不存在CPU瓶颈,但实际上那个使用率为100%的CPU很可能就是系统性能不佳的根本原因。

2015-01-28 00:10:47 2662

转载 Java HotSpot VM Options

http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.htmlPlease note that this page only applies to JDK 7 and earlier releases. For JDK 8 please see the Windows, Solaris, Li

2014-12-14 17:13:28 3096

转载 hadoop伪分布式下 无法启动datanode的原因及could only be replicated to > 0 nodes, instead of 1的错误

目前发现一个原因是 因为datanode无法启动从而导致在hadoop上 put数据 出现 could only be replicated to > 0 nodes, instead of 1的错误。输入jps发现唯独只有datanode进程没有起来。所以我们要想办法把datanode启动起来。1.环境描述:ubuntu11.10伪分布是hadoopjdk

2014-11-27 17:52:37 923

转载 DirectBuffer及内存泄漏

创建Buffer对象时,可以选择从JVM堆中分配内存,也可以OS本地内存中分配,由于本地缓冲区避免了缓冲区复制,在性能上相对堆缓冲区有一定优势,但同时也存在一些弊端。两种缓冲区对应的API如下:JVM堆缓冲区:ByteBuffer.allocate(size)本地缓冲区:ByteBuffer.allocateDirect(size)从堆中分配的缓冲区为普通的Java对象,生命周期与

2014-11-27 13:38:50 884

转载 Understanding Java Garbage Collection

come from: http://www.cubrid.org/blog/dev-platform/understanding-java-garbage-collection/What are the benefits of knowing how garbage collection (GC) works in Java? Satisfying the intellectual cur

2014-11-26 18:06:25 810

转载 How to Monitor Java Garbage Collection

Come from: http://www.cubrid.org/blog/dev-platform/how-to-monitor-java-garbage-collection/This is the second article in the series of "Become a Java GC Expert". In the first issue Understanding

2014-11-26 18:05:09 791

转载 How to Tune Java Garbage Collection

Come from : http://www.cubrid.org/blog/dev-platform/how-to-tune-java-garbage-collection/This is the third article in the series of "Become a Java GC Expert". In the first issue Understanding

2014-11-26 18:03:39 875

转载 pig cookbook学习

Overview近期需要用pig做一些统计,由于没有系统学习,总是出现一些问题,且不容易调试,执行效率也不高。所以打算看一些官方文档,在此做些笔记。pig性能提升指定类型如果在load文件时不指定类型,pig在计算时会指定为double类型,而在很多时候,数据本应是整形等,指定为double类型会增加广计算量。另外,指定类型也会使错误提早暴露出来。--Query

2014-11-26 00:00:05 726

转载 Pig性能优化

Pig性能优化  1. 尽早去除无用的数据  MapReduce Job的很大一部分开销在于磁盘IO和数据的网络传输,如果能尽早的去除无用的数据,减少数据量,会提升Pig的性能。  1). 尽早的使用Filter  使用Filter可以去除数据中无用的行(Record),尽早的Filter掉无用的数据,可以减少数据量,提升Pig性能。  2). 尽早的使用Project(F

2014-11-25 23:57:57 809

转载 Hortonworks member of technical staff戴建勇解读Apache Pig的性能优化

以下为现场实录:什么是Apache  Pig?ApachePig包括两个部分,首先是PigLatin的语言,是类SQL的数据处理语言。其次,Apache  Pig是在Hadoop这个软件上运行Pig  Latin语言的执行引擎,一部分是语言的部分,还有一部分是实践的部分。比较一下Pig和Hadoop,跟Hadoop相比Pig具有更快的开发效率,所以可以用更少的代码实现和MapRed

2014-11-25 23:50:33 1649

转载 了解CMS(Concurrent Mark-Sweep)垃圾回收器

1.总体介绍:CMS(Concurrent Mark-Sweep)是以牺牲吞吐量为代价来获得最短回收停顿时间的垃圾回收器。对于要求服务器响应速度的应用上,这种垃圾回收器非常适合。在启动JVM参数加上-XX:+UseConcMarkSweepGC ,这个参数表示对于老年代的回收采用CMS。CMS采用的基础算法是:标记—清除。2.CMS过程:初始标记(STW initial m

2014-11-25 23:30:27 633

转载 Hive 的 distribute by

Order by 能够预期产生完全排序的结果,但是它是通过只用一个reduce来做到这点的。所以对于大规模的数据集它的效率非常低。在很多情况下,并不需要全局排序,此时可以换成Hive的非标准扩展sort by。Sort by为每个reducer产生一个排序文件。在有些情况下,你需要控制某个特定行应该到哪个reducer,通常是为了进行后续的聚集操作。Hive的distribute by 子句可以做

2014-11-25 23:09:00 939

转载 JVM系列三:JVM参数设置、分析

不管是YGC还是Full GC,GC过程中都会对导致程序运行中中断,正确的选择不同的GC策略,调整JVM、GC的参数,可以极大的减少由于GC工作,而导致的程序运行中断方面的问题,进而适当的提高Java程序的工作效率。但是调整GC是以个极为复杂的过程,由于各个程序具备不同的特点,如:web和GUI程序就有很大区别(Web可以适当的停顿,但GUI停顿是客户无法接受的),而且由于跑在各个机器上的配置不同

2014-11-25 22:47:56 678

转载 hive语句优化-通过groupby实现distinct

同事写了个hive的sql语句,执行效率特别慢,跑了一个多小时程序只是map完了,reduce进行到20%。该Hive语句如下:select count(distinct ip) from (select ip as ip from comprehensive.f_client_boot_daily where year="2013" and month="10"  uni

2014-11-25 22:23:44 871

转载 Scala 访问权限控制——Scala Access Modifiers

其他的都和Java的差不多,唯一的区别是多了Scope protectScope of protectionAccess modifiers in Scala can be augmented with qualifiers. A modifier of the form private[X] or protected[X] means that acces

2014-11-06 14:27:15 1071

转载 vim syntax highlighting for scala : A bash one liner

Just for posterity, here is a Bash one-liner to download the VIM plugins to handle syntax highlighting for Scala: 1$ mkdir -p ~/.vim/{ftdetect,indent,syntax} && for d in ftdetect

2014-11-03 10:33:47 1139

转载 如何成为数据科学家( http://gkkgo.com/guide/44)

KK学习助手基础统计学编程机器学习文本挖掘数据可视化大数据工具集合怎样成为一个数据科学家?有人说数据科学家将会是未来最性感的职业?且看小编攒的数据科学家学习路线图。第1节: 基础线性代数、概率

2014-10-27 22:15:17 1191

转载 [R] dataframe sort

dd data.frame(b = factor(c("Hi","Med","Hi","Low"), levels = c("Low","Med","Hi"), ordered = TRUE), x = c("A","D","A","C"), y = c(8,3,9,9), z = c(1,1,1,2))sort by column z (descending) then by column b

2014-10-26 20:04:46 2002

转载 [R]字符串函数

摘自:http://www.biostatistic.net/thread-195-1-1.html用于字符串分割的函数:如strsplit('123abcdefgabcdef','ab')[[1]][1] "123"   "cdefg" "cdef" #字符串连接:paste() #paste(..., sep = " ", collapse

2014-10-26 12:11:40 546

转载 GitHub的Ruby代码规范

最近开始接触Ruby和Rails的开发,个人是一个疯狂迷恋编写代码边format的编写方式,看到摆的凌乱的代码就会有一种无法言说的焦躁感,同样的习惯被我带到了Ruby的学习过程中,可是应该如何确定Ruby源文件的format呢? GitHub公布了他们的答案: Ruby Style Guide:https://github.com/bbatsov/ruby-style-guide 

2014-10-24 17:50:29 1304

转载 数据科学家

一、数据科学家的起源"数据科学"(DataScience)起初叫"datalogy "。最初在1966年由Peter Naur提出,用来代替"计算机科学"(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言,包括今天那些必不可少的软件工程工具的原型。图灵奖被

2014-10-24 13:13:37 1038

转载 js undefined & null

typeof()函数 返回的是字符串,有六种可能:"number"、"string"、"boolean"、"object"、"function"、"undefined" js中undefined,null,NaN的区别1.类型分析:js中的数据类型有undefined,boolean,number,string,object等5种,前4种为原始类型,第5种为引用类型。

2014-10-24 11:36:12 616

转载 dataframe常见操作

在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了,下面列出几种常见的dataframe的操作方法。1.查看数据head(dataframe) # 查看数据前10行tail(dataframe) # 查看数据后10行2.合并数据(1)data.frame(x,y)x,y是dataframe或者一列数据,x和y的行数一样,

2014-10-23 23:36:09 1490

转载 PowerMock介绍

转自:http://blog.csdn.net/jackiehff/article/details/14000779一、为什么要使用Mock工具      在做单元测试的时候,我们会发现我们要测试的方法会引用很多外部依赖的对象,比如:(发送邮件,网络通讯,远程服务, 文件系统等等)。 而我们没法控制这些外部依赖的对象,为了解决这个问题,我们就需要用到Mock工具来模拟这些外部依

2014-10-16 17:43:36 798

转载 对 HTTP 304 的理解(转)

对 HTTP 304的理解(转)最近和同事一起看Web的Cache问题,又进一步理解了 HTTP中的 304 又有了一些了解。304 的标准解释是:Not Modified 客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。如 果客户端在请求一个文件的时

2014-10-15 09:02:40 663

转载 MyBatis动态SQL

动态SQLMyBatis的动态SQL,解决了SQL字符串拼接的痛苦。1.if[html] view plaincopyselect id="findActiveBlogWithTitleLike"      parameterType="Blog" resultType="Blog">      SELECT * FROM BLO

2014-10-14 16:06:04 515

转载 Mysql更新字段中部分数据的方法

Mysql更新字段中部分数据的方法 Mysql更新字段中部分数据第一种情况: update tab set     A   = concat(substring(A,1,3),'bbb'); 从A的1个字符开始取3个字符,加上'bbb',再写入a中,如果A原始值为'123aaa',那么更新之后为'123bbb'了。 如果我们要将字段A

2014-10-10 09:10:31 733

转载 让terminal显示git所在的当前分支名

find_git_branch () { local dir=. head until [ "$dir" -ef / ]; do if [ -f "$dir/.git/HEAD" ]; then head=$( "$dir/.git/HEAD") if [[ $head = ref:\ refs/heads/* ]];

2014-10-09 23:26:47 5098

转载 JUnit4 中@AfterClass @BeforeClass @after @before的区别对比

JUnit4使用Java5中的注解(annotation),以下是JUnit4常用的几个annotation: @Before:初始化方法   对于每一个测试方法都要执行一次(注意与BeforeClass区别,后者是对于所有方法执行一次)@After:释放资源  对于每一个测试方法都要执行一次(注意与AfterClass区别,后者是对于所有方法执行一次)@Test:测试方法,在这里可以

2014-10-09 16:03:47 556

推荐系统实战

中文版的 推荐系统实战 推荐系统入门必备 非常好的书籍

2019-01-08

阿里中台战略

中台战略,挺详细的, 全方位介绍中台战略的思想与架构 专注与架构演进与变化发展

2019-01-08

PRML-pattern recognize and machine learning

PRML 翻译版,高清,一共有476也是拉地方撒快乐的咖啡洒楼的房间司法考试了

2018-04-14

dbus编译后的package 02

dbus编译后的package阿斯顿浪费拉升地方拉屎的发撒地方

2018-01-04

dbus编译后的package-04

dbus编译后的package阿斯顿发生的发生的发生的发生的发生的

2018-01-04

dbus编译后的package001

dbus编译后的package撒到佛罗伦萨啦啦啦啦啦收到两份收到了发生地方

2018-01-04

dbus编译后的package

dbus编译后的package塞法阿斯顿发生的发生的发生的发生

2018-01-04

UNIX网络编程第2卷

UNIX网络编程第2卷 经典书,不说了

2012-08-02

unix网络编程第1卷

unix网络编程第1卷 好书,经典书,多余的介绍就不必了

2012-08-02

unix编程艺术

unix编程艺术,美国的理曼德所著,经典书籍,多了就不说了

2012-08-02

java并发编程实践(英文)

java并发编程实践,很牛的一本书,作者都是世界上那几位大侠

2012-01-28

struts2权威指南

这本书好不好不说了,大家都知道的。这个是pdf,比较清晰了

2011-10-18

云存储压缩文件

这个是有关云计算方面的资料,比较详细,值得一看

2011-10-18

数据挖掘讲义

这个是最经典的那边教科书的讲义,比较丰富,是复习的资料

2011-10-18

数据挖掘pdf

这个是不错的有关数据挖掘方面的书籍,我看了下,确实比较不错

2011-10-18

hbase实战简介

这个是个ppt,介绍hbase的,我感觉还可以,特此抛砖引玉,望大家把好东西不要吝啬,贡献出来

2011-10-18

spring源码解析

这个我看了,比较不错,介绍地比较详细,特贡献出来,不知道对大家有没有帮主

2011-10-18

http协议详解

这个是比较完整的http协议方面的介绍,我觉得还是挺好的,必备

2011-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除