自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 资源 (7)
  • 收藏
  • 关注

原创 IT资源专业搜索-www.easysoo.cn

易搜(www.easysoo.cn)是一个面向IT开发从业人员的专业资源搜索站点,它将全球的知名博客论坛、专业IT行业站点、知名咨询机构和IT解决方案紧密的连接在一起,为其提供免费的IT资源搜索,继而提高用户搜索的效率和持续价值。本站点融合了csdn博客、博客园、开源社区、红黑联盟、ITeye、51CTO、BlogJava、IT技术、ChinaUnix、开源中国、ITPUB、伯乐在线、Linux公社、脚本之家、Linux.中国、PHP100中文网、Stack Overflow、msdn、open pro

2015-12-11 18:17:20 828

原创 solr的两种安装方式

安装模式StandaloneSolrCloud安装yuminstall lucidworks-hdpsearchwget https://issues.apache.org/jira/secure/attachment/12761323/solr_for_audit_setup_v3.tgz-O /usr/local/solr_for_audit_s

2016-12-21 11:04:55 2441

原创 ambari邮件告警配置

Ambari 配置告警配置Manage Notifications创建告警通知配置告警详见附件163邮箱授权码获取定义发送邮件格式  1、下载 alert-templates.xml:https://github.com/apache/ambari/blob/branch-2.1/ambari-server/src/main/resources/alert-te

2016-12-14 18:26:38 3287 3

原创 R语言连接HIVE

install.packages("RJDBC",dep=TRUE)library(RJDBC)drv <- JDBC('org.apache.hive.jdbc.HiveDriver',list.files("D:/r_hive_libs",pattern = "jar$", full.names=TRUE,recursive=TRUE))conn<- dbConnect(drv,

2016-11-15 16:31:37 2394 1

转载 解读2015之Spark篇:新生态系统的形成

摘自:易搜社区 http://bbs.easysoo.cn/?p=544编者按:2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了“解读2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。本文是大数据解读2015之Spark篇,明略数据的梁堰波为大家解读Spark在2015年的快速发展,后续InfoQ会有更多关于大数

2016-01-28 18:20:36 846

转载 十年回顾:Hadoop老矣,尚能饭否?

摘自:易搜社区 http://bbs.easysoo.cn/?p=532Hadoop,十岁生日快乐!于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。InfoQ特别策划了系列文章,为大家梳理Hadoop这十年的变化,以及技术圈的生态状况,这是为Hadoop庆生的第一篇。1、引子,什么是

2016-01-28 17:42:57 920

转载 年会上的程序猿

摘自:易搜社区 http://bbs.easysoo.cn/?p=514嗷嗷,大家好,我终于又更新了啦~~ 上一周没有更新是因为生病了(不不不,得的不是懒癌)。现在终于恢复健康啦,谢谢各位催更。>>>未完,浏览下一节    >>>未完,浏览下一节

2016-01-28 16:53:14 872

转载 关于智能硬件,BAT给董明珠支了什么招?

摘自:易搜社区 http://bbs.easysoo.cn/?p=509摘要:“怎样帮助格力空调在智能硬件、万物互联的背景下提升竞争力,开发新的东西?”面对这一问题,BAT的嘉宾们是这样说的。“我有一个大姐,就是董明珠,她也很想拥抱互联网。我现在替我大姐问个问题,帮助格力空调在智能硬件、万物互联的背景下提升竞争力,怎样开发新的东西?”2015上海创博会暨全球智能硬件供应链峰会上

2016-01-22 16:24:14 850

转载 中国居然没上榜—2015 年程序猿分布图

摘自:http://bbs.easysoo.cn/?p=493开发者调查是 Stack Overflow 每年都要进行的一次开发者用户调查问卷活动,调查对象为在 Stack Overflow 注册的开发者用户。和以往相比, 2015 年的调查涵盖面更广,参与人数最多,调查结果包括 157 个国家的 26086 名开发者。在这些人中,有 6800 人是经过认证的全栈工程师,另外还有移动开发者

2016-01-20 22:52:27 1129

转载 程序猿之华丽转身:菜鸟4步曲!

摘自:http://bbs.easysoo.cn/?p=488在 移动互联网大时代中,越来越多的人选择程序员作为自己的职业,但初入门的菜鸟程序员英爱如何来快速提升自己的技术,一直是值得大家深究的问题,对于出入 社会的程序员来讲,如何才能将工作做的更好,怎样可以更快的适应工作?如何才能够更好的学习这项技术,当然今天的这篇内容是为各位菜鸟程序员分享的实用内 容,对刚步入程序员之路的菜鸟一定有所

2016-01-20 21:55:30 978

转载 Python教你,谁把你的微信删除了!

摘自:http://bbs.easysoo.cn/?p=198“清理下[微笑],不用回。你的朋友圈没事也该清清了,打开设置,通用,功能,群助手,全选,把我的信息粘贴一下,就可以了,发送就知道谁把你删了,方便你清人,不清不知道,一清吓一跳。”相信大家在微信上一定被上面的这段话刷过屏,群发消息应该算是微信上流传最广的找到删除好友的方法了。但群发消息不仅仅会把通讯录里面所有的好友骚扰一遍

2016-01-20 12:39:49 1415

转载 互联网金融数据分析应用

转摘自:http://bbs.easysoo.cn/?p=476互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以来了解金额。还有像越女读财介绍的高暴利的钱宝网、MMM、百川币这些,如果没有互联网,相信他们也很难发展的起来。主要介绍下互联网金融行业的相关公司主要应用的数据

2016-01-19 22:45:50 2341

转载 第2章 基础语法 — 函数

摘自:http://bbs.easysoo.cn/?p=480函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。Python函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。定义一个函数

2016-01-19 22:37:23 871

转载 spark之基础学习篇:load文件 — WordCount

本节主要讲解spark加载不同的文件格式的方法,并且从local模式和cluster模式进行说明。1、加载txt文件1234567891011121314151617/** * txt格式:以空格分割 */import org.apache.spark.{SparkContext, SparkConf}object

2016-01-19 13:45:01 2074

原创 Spark Streaming 的玫瑰与刺

前言说人话:其实就是讲Spark Streaming 的好处与坑。好处主要从一些大的方面讲,坑则是从实际场景中遇到的一些小细节描述。玫瑰篇玫瑰篇主要是说Spark Streaming的优势点。玫瑰之代码复用这主要得益于Spark的设计,以及平台的全面性。你写的流处理的代码可以很方便的适用于Spark平台上的批处理,交互式处理。因为他们本身都是基于RDD模型的,并且Spa

2016-01-15 11:02:08 935

原创 程序猿之华丽转身:必备技术面试手册

这份清单,既是一份有助于对这些题目做深入研究的快速指南和参考,也算是计算机科学课程中不能忘记的基础知识总结,因此并不可能全面覆盖所有内容。它也可以作为 gist 在 Github 上公开,人人都可以编辑和补充。一、数据结构基础数组定义按顺序连续存储数据元素,通常索引从0开始以集合论中的元组为基础数组是最古老,最常用的数据结构 知识要点索引最优;不利于查找、插

2016-01-15 10:36:40 914

转载 机器学习系列 -- 丈母娘选女婿

作者:龙心尘 &&寒小阳时间:2016年1月。 出处: http://blog.csdn.net/longxinchen_ml/article/details/50471682http://blog.csdn.net/han_xiaoyang/article/details/50481967声明:版权所有,转载请联系作者并注明出处1. 引言再过一个月就是春节

2016-01-15 10:09:30 675

原创 第2章 基础语法 — 循环语句

2.6 Python循环语句本章节将向大家介绍Python的循环语句,程序在一般情况下是按顺序执行的。编程语言提供了各种控制结构,允许更复杂的执行路径。循环语句允许我们执行一个语句或语句组多次,下面是在大多数编程语言中的循环语句的一般形式:Python提供了for循环和while循环(在Python中没有do..while循环)循环控制语句循环控制语句可以更改语句执

2016-01-13 22:42:58 384

原创 第2章 基础语法 — 条件语句

2.5 Python条件语句Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:Python程序语言指定任何非0和非空(null)值为true,0 或者 null为false。Python 编程中 if 语句用于控制程序的执行,基本形式为:if 判断条件: 执行语句

2016-01-13 22:37:24 434

原创 Window下spark开发环境搭建IDEA

Window下spark开发环境搭建IDEA1、下载Idea版本:14.1.32、安装scala插件Ctrl+Alt+S-- > Plugins -- > Plugins -- > scala 安装,等待安装后 -- >Finish 重启Idea3、新建Scala工程选择本机的Jdk版本和scala版本,如果没有安装,请自行安装4、配置工

2016-01-11 11:51:51 700

原创 第2章 基础语法 -- 运算符

本章节主要说明Python的运算符。 Python算术运算符以下假设变量a为10,变量b为20:  Python比较运算符以下假设变量a为10,变量b为20: Python赋值运算符以下假设变量a为10,变量b为20:  Python位运算符按位运算符是把数字看作二进制来进行计算的。Python中的按位运算法则如下: 下表中...

2016-01-05 21:29:34 128

原创 第2章 基础语法 -- 运算符

本章节主要说明Python的运算符。Python算术运算符以下假设变量a为10,变量b为20:Python比较运算符以下假设变量a为10,变量b为20:Python赋值运算符以下假设变量a为10,变量b为20:Python位运算符按位运算符是把数字看作二进制来进行计算的。Python中的按位运算法则如下:

2016-01-05 21:24:10 490

原创 hive on spark的安装及问题

配置hivehive-site&lt;property&gt; &lt;name&gt;hive.metastore.uris&lt;/name&gt; &lt;value&gt;thrift://database:9083&lt;/value&gt;&lt;/property&gt; &lt;property&gt; &l

2016-01-05 12:52:31 114

原创 hive on spark的安装及问题

配置hivehive-site hive.metastore.uris thrift://database:9083 hive.metastore.client.socket.timeout 600s--> 600 把hive-site.xml 放到spark/conf目录下Mysql驱动放到spark/

2016-01-05 12:40:17 1082

原创 第2章 Python基础语法 -- 数据类型

2.2数据类型变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。2.2.1 标准数据类型在内存中存储的数据可以有多种类型。Python有五个标准的数据类型:Numbers(数字)String(字符串)List(列表)Tuple(元

2016-01-03 20:04:14 1089

第2章 Python基础语法 -- 数据类型

2.2数据类型变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。2.2.1 标准数据类型在内存中存储的数据可以有多种类型。Python有五个标准的数据类型:Numbers(数字)String(字符串)List(列表)Tuple(元组)Dictionary(字典)2.2.2 数...

2016-01-03 20:04:00 117

原创 第1章 Python简介

第1章Python简介1.1 Python简介Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,由Guido vanRossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件,源代码和解释器CPython遵循GPL(GNUGeneral Public License)协议。Python具有丰富

2016-01-01 20:55:11 435

第1章 Python简介

第1章Python简介1.1 Python简介Python(英语发音:/ˈpaɪθən/), 是一种面向对象、解释型计算机程序设计语言,由Guido vanRossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件,源代码和解释器CPython遵循GPL(GNUGeneral Public License)协议。Python具有丰富...

2016-01-01 20:55:00 180

原创 第2章 Python基础语法--Hello python

第2章 基础语法2.1 基本介绍2.1.1 Hello python每个语言的开始都是从”HelloWorld”开始的,我们也不例外。打开已经安装好的Python编译环境,至于Python如何安装,不作为我们这个教程的讲解,可自行在网上搜索Python在不同环境上的安装。由以下两种方式运行我们的程序:1、Python客户端2、编写.py文件,运用命令:python

2016-01-01 20:54:14 489

第2章 Python基础语法--Hello python

第2章 基础语法2.1 基本介绍2.1.1 Hello python每个语言的开始都是从”HelloWorld”开始的,我们也不例外。打开已经安装好的Python编译环境,至于Python如何安装,不作为我们这个教程的讲解,可自行在网上搜索Python在不同环境上的安装。由以下两种方式运行我们的程序:1、Python客户端2、编写.py文件,运用命令:python xx...

2016-01-01 20:54:00 301

原创 数据分析师常见的十道面试题目

数据分析师常见的10道面试题及解答1、海量日志数据,提取出某日访问百度次数最多的那个IP。  首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及

2015-12-23 23:02:58 7994 1

数据分析师常见的十道面试题目

数据分析师常见的10道面试题及解答1、海量日志数据,提取出某日访问百度次数最多的那个IP。  首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及...

2015-12-23 23:02:00 4759 2

转载 Spark解决Kaggle数据科学问题

作者:张天雷摘自:InfoQ如何利用高性能分布式计算平台来解决现实问题一直是人们所关心的话题。近期,comSysto公司的Danial Bartl就分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。Danial提到,comSysto公司经常会举行一些讨论会,来评估未来的技术和共享以往的经验。在近期,大数据分析类

2015-12-23 23:01:06 881

Spark解决Kaggle数据科学问题

作者:张天雷摘自:InfoQ如何利用高性能分布式计算平台来解决现实问题一直是人们所关心的话题。近期,comSysto公司的Danial Bartl就分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。Danial提到,comSysto公司经常会举行一些讨论会,来评估未来的技术和共享以往的经验。在近期,大数据分析类...

2015-12-23 23:01:00 153

原创 程序猿之华丽转身:必杀之八技

既然你选择了程序员这一条路,就说明了你接受这工作给你带来的酸甜苦辣,无论如何,勿忘初心。1.技术只是工具而非解决问题之本当我们在为掌握了最新的技术而欢欣雀跃时,但这些东西并不是用来解决问题的根本——它们只是用于解决问题的简单工具而已。我们必须非常谨慎,不要对某项正好喜欢或者正好很火的特定技术走火入魔。否则,我们将进入这样的思维怪圈:把掌握的那项技术比做是锤子,在思考问题时,会自然的

2015-12-23 22:55:27 969

程序猿之华丽转身:必杀之八技

既然你选择了程序员这一条路,就说明了你接受这工作给你带来的酸甜苦辣,无论如何,勿忘初心。1.技术只是工具而非解决问题之本当我们在为掌握了最新的技术而欢欣雀跃时,但这些东西并不是用来解决问题的根本——它们只是用于解决问题的简单工具而已。我们必须非常谨慎,不要对某项正好喜欢或者正好很火的特定技术走火入魔。否则,我们将进入这样的思维怪圈:把掌握的那项技术比做是锤子,在思考问题时,会自然的把所...

2015-12-23 22:55:00 273

原创 机器学习:你需要多少训练数据?

作者为Google 软件工程师,美国西北大学电子信息工程博士,擅长大规模分布式系统,编译器和数据库。从谷歌的机器学习代码中得知,目前需要一万亿个训练样本训练数据的特性和数量是决定一个模型性能好坏的最主要因素。一旦你对一个模型输入比较全面的训练数据,通常针对这些训练数据,模型也会产生相应的结果。但是,问题是你需要多少训练数据合适呢?这恰恰取决于你

2015-12-22 23:02:01 6331

机器学习:你需要多少训练数据?

摘自:PPTV课堂作者为Google 软件工程师,美国西北大学电子信息工程博士,擅长大规模分布式系统,编译器和数据库。从谷歌的机器学习代码中得知,目前需要一万亿个训练样本训练数据的特性和数量是决定一个模型性能好坏的最主要因素。一旦你对一个模型输入比较全面的训练数据,通常针对这些训练数据,模型也会产生相应的结果。但是,问题是你需要多少训练数据合适呢?这恰恰取决于你正在执行的任务、最终想通...

2015-12-22 23:02:00 1663

原创 教你用Python抢票 100%秒杀抢票

随着春节的临近,大家都在和12306斗智斗勇。今天,小编为大家分享不到100行的Python程序帮助大家来抢票。  首先说明一下,我们程序的出发点是能用机器做的事就用机器做,需要人来做的事还是要自己来做。因此,12306上五花八门的验证码还是需要大家自己动手输入确认的。另外,本程序对容错什么的考虑较少,请大家见谅。  我们要用到浏览器chrome,还没有安装的读者可

2015-12-22 22:54:34 15730

教你用Python抢票 100%秒杀抢票

摘自:柠檬大数据随着春节的临近,大家都在和12306斗智斗勇。今天,小编为大家分享不到100行的Python程序帮助大家来抢票。  首先说明一下,我们程序的出发点是能用机器做的事就用机器做,需要人来做的事还是要自己来做。因此,12306上五花八门的验证码还是需要大家自己动手输入确认的。另外,本程序对容错什么的考虑较少,请大家见谅。  我们要用到浏览器chrome,还没有安装的读者可以从...

2015-12-22 22:54:00 4390

ambari邮件告警配置

对ambari大数据平台进行邮件告警配置!

2016-12-14

impala安装与添加

impala安装与添加

2014-12-18

Hadoop集群的安装与配置

hadoop的安装与配置,以及相关问题的解决方法,欢迎大家下载,批评且给予建议

2014-08-11

PD反向ORACLE工程

PorwerDesigner 反向工程 ORACLE,还有一此注意事项之类的问题,希望对 大家有所帮助,要是是菜鸟哈!欢迎批评指点!!

2012-10-26

JAVA之WEB工程打包

JAVA之WEB工程打包,主要介绍了JAVA工程的几种打包方式

2012-10-26

网上调查详细设计书

这是一个网上调查的说明书,介绍了系统的详细说明,希望对大家有所帮助

2012-08-10

JAVA 23种设计模式

有趣解说 java23种设计模式,主要讲我们经常用到的设计模式,让你看了后一定能记住!

2012-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除