10 zhongwen7710

尚未进行身份认证

暂无相关描述

等级
TA的排名 1w+

Hadoop2.7.0+与Spark1.5+已将不支持JDK1.6

摘要:Hadoop2.7.0已发发布,但该版本已经不支持JDK1.6版本,由于该版本吸取了很多JIRAs,考虑到Bug还在测试中,请暂时不要使用该版本用于生产环境,可以用Hadoop2.7.1/2.7.2,版本的更新应该很快发布。Spark社区激烈讨论决定,预计2015年6月发布Spark1.4.x,该版本会在Java6,7,8上面工作;预计2015年9月发布Spark1.5+,该版本只能在

2015-05-06 11:24:10

PostgreSQL(数据库)资料和分布式系统(Distributed System)资料与Go语言资料整理

《PostgreSQLDocumentation》介绍:PostgreSQL官方文档主页《PG技术沙龙ppt》介绍:2013年4月PG技术沙龙PPT《PG9.3中文翻译文档》介绍:PG9.3中文翻译文档谢谢@skykiker提供《PostgreSQL从菜鸟到专家(中译稿by洞庭湖的泥鳅)》介绍:这篇文档是国内的一线postgreSQL

2015-04-28 13:02:17

【重磅干货整理】机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总

《BriefHistoryofMachineLearning》介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、DeepLearning.《DeepLearninginNeuralNetworks:AnOverview》介绍:这是瑞士人工智能实验室JurgenSchmidhuber写的最

2015-04-28 10:17:32

机器学习界大牛林达华推荐的书籍(Recommended Books)

HereisalistofbookswhichIhavereadandfeelitisworthrecommendingtofriendswhoareinterestedincomputerscience.MachineLearningPatternRecognitionandMachineLearningCh

2015-03-04 23:35:01

[置顶] 各大推荐引擎资料汇总

视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。Hulu:主要是itembasedCF,参考官方博客上的文章。Youtube:开始是randomwalk,后来改为类似itembasedCF的方法,这是他们算法团队发表的论文。recsyschina上的点评,豆瓣阿稳的点评。图书类Am

2015-02-25 16:23:00

VMware WorkStation11的三种网络连接方式详解与NAT模式下静态IP配置(Ubuntu12.04版本)

第一部分:与VMware网络连接相关的知识安装完VMwareWorkStation虚拟机后,默认安装了两个虚拟网卡,VMnet1和VMnet8,其他的未安装(当然也可以手动安装其他的)。其中VMnet1是host网卡,用于host方式连接网络的。VMnet8是NAT网卡,用于NAT方式连接网络的。它们的IP地址是随机生成的,如果要用虚拟机做实验的话,最好将VMnet1到VMnet8的IP地址

2015-01-26 17:38:09

2014 Spark美国峰会顶级数据商精彩PPT分享

Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的核心部分的代码只有63个Scala文件,非常短小精悍。Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,它们使Spark在某些工作负载方面表现得更加优,换句话说,

2015-01-22 14:49:37

聊聊HTTPS和SSL/TLS协议

要说清楚HTTPS协议的实现原理,至少需要如下几个背景知识。1.大致了解几个基本术语(HTTPS、SSL、TLS)的含义2.大致了解HTTP和TCP的关系(尤其是“短连接”VS“长连接”)3.大致了解加密算法的概念(尤其是“对称加密与非对称加密”的区别)4.大致了解CA证书的用途考虑到很多技术菜鸟可能不了解上述背景,俺先用最简短的文字描述一下。如果你

2015-01-15 11:23:00

Scala开发入门教程【整理来自引路蜂Blog】

Scala语言和其它语言比如Java相比,算是一个比较复杂的语言,它是一个面向对象和面向函数的统一体,使用起来非常灵活,因此也不容易掌握,前面的58篇文章仅仅是Scala的一个入门教程,有了这些基础知识,你就可以开始编写Scala应用,学习一种语言最好的方法是通过实践来学习。为方便起见,下面列出这些文章,后面我们就分专题进一步介绍Scala编程。Scala开发教程(1):开始神奇

2015-01-14 20:47:28

高清视频录制工具(Bandicam)v2.1.2.740中文使用技巧

Bandicam一款由韩国开发的高清录制视频的工具,Bandicam的优势在于对电脑配置要求低,一些配置比较低端的电脑,通常录制视频会出现不同步现象,使用Bandicam就可以避免此问题。Bandicam录制的视频体积小,而且画面清晰,可以录制分辨率高达2560×1600高画质视频(1080p全高清视频可以做的),录制的时候可添加自己的LOGO到视频中,支持bmp、png与jpeg

2015-01-12 17:13:00

【转自oschina网站】Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集

目录[-](一)hadoop相关安装部署(二)hive(三)pig(四)hadoop原理与编码(五)数据仓库与挖掘(六)Oozie工作流(七)HBase(八)flume(九)sqoop(十)ZooKeeper(十一)NOSQL(十二)Hadoop监控与管理(十三)Storm(十四)YARN&Hadoop2.0(十五)ha

2015-01-04 22:09:40

用Windows7+IDEA+SBT搭建Spark源代码调试与阅读环境

Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。因此,Spark源码阅读的IDE理所当然的选择了IDEA。今天将与大家分型Windows7+IDEA+SBT搭建Spark源代码调试与阅读环境。 实验环境准备:l JDK:Java语言的软件开发工具包(SDK)参考网址:ht

2015-01-04 21:48:55

用IDEA创建sbt的Scala工程

Spark源码是有Scala语言写成的,目前,IDEA对Scala的支持要比eclipse要好,大多数人会选在在IDEA上完成Spark平台应用的开发。下面我们以IDEA创建一个Scala项目。 实验环境准备:l JDK:Java语言的软件开发工具包(SDK)参考网址:http://www.oracle.com/technetwork/java/javase/downloa

2015-01-04 21:34:28

用Eclipse构建Spark源代码调试阅读环境

实验环境准备:l JDK:Java语言的软件开发工具包(SDK)参考网址:http://www.oracle.com/technetwork/java/javase/downloads/index.htmll SaclaIDE:一个基于Eclipse开发的Scala的集成开发软件。(可直接用)参考网址:http://scala-ide.org/l Scala:Spa

2015-01-04 21:26:37

BAT的薪资待遇大解密

三大互联网巨头公司,百度腾讯跟阿里如何划分级别?薪资待遇又有多少?除非身居其位,否则很难探知,但是等你到那个位置知道了,却又不能说,至少不能在公开场合谈论。接下来就为大家揭秘,百度、阿里与腾讯内部的级别划分跟薪资待遇。这是一个群众喜闻乐见却又讳莫如深的话题。各个公司头衔名字都不一样,级别的数目也不一样;有些扁平,有些很多level慢慢升;有些薪水范围严格跟级别挂钩,有些薪水跟级别没绝对的关

2015-01-04 21:14:53

推荐!国外程序员整理的机器学习资源大全

本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++,C,Python,Java以及MATLAB接口,并支持Windows,Linux,AndroidandMacOS操作系统。通用机器学习

2014-12-29 21:01:52

如何使用Maven和eclipse构建大数据开发框架项目

作为大数据开发者,特别是开发大数据应用程序的程序员或者框架师,在进行大数据项目开发,或者是研读源代码,的把相应的项目导入到集成开发环境,本文用Maven和eclipse来构建大数据开发框架项目。比如说开发storm项目、Hadoop项目、Spark项目等,本文以构建storm项目为例进行图文解读。 提纲摘要:第一部分:准备工作第二部分:Maven原理的理解第三部分:Maven相

2014-12-29 20:43:16

Mahout学习资料

mahout源码研究--参考资料:http://blog.csdn.net/zhouhong1026/article/details/19991435基于Mahout的电影推荐系统:http://blog.csdn.net/huhui_cs/article/details/8596388

2014-12-27 22:21:40

BDTC2014中国大数据技术大会

2014中国大数据技术大会32位核心专家演讲PDF下载汇总(重磅资料)下载地址:http://download.csdn.net/detail/zhongwen7710/82959072014中国大数据技术大会32位核心专家演讲PDF目录题目如下:1、高速网络InfiniBand加速大数据应用_刘通_Mellanox亚太市场开发总监2、Experience-Cent

2014-12-24 19:25:53

汇总从代数角度与几何角度理解相似度计算方法(以机器学习Mahout框架为主线)

相似度的计算是数据挖掘与机器学习中的一个永恒的话题,为了能更好地理解与比较各种相似度计算的方法,能灵活运用到各种计算模型中,自己在研究机器学习之Mahout框架时,源代码中也实现了很多相似度计算方法,本文结合机器学习Mahout框架中各种相似度计算方法的实现,并且从代数角度和几何角度来理解相似度的计算方法。并阐述其优缺点,及自己的适用场景。本文通过总结和归纳,一共总结了9中距离测量方法,方法一到方法七是Mahout中完完本本实现了,其中前面是方面名,破折号后是Mahout中各方法实现的类名,本文结合Maho

2014-12-22 22:57:37

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!