3 vinfly_li

尚未进行身份认证

暂无相关描述

等级
博文 14
排名 11w+

Actor模型与Akka

Actor模型与Akka一.Actor模型Actor模型概念一个概念模型,用于处理并发计算Actor模型内部的状态由自己的行为维护,外部线程不能直接调用对象的行为,必须通过消息才能激发行为,这样就保证Actor内部数据只有被自己修改Actor模型组成Actor模型详解在Actor模型中,一切都可以抽象为Actor,一个Actor指的是一个最基本的计...

2018-03-02 16:29:59

Solr语法解析及SolrJ使用

Solr语法解析及SolrJ使用标签(空格分隔):Solr官方指南:http://lucene.apache.org/solr/quickstart.htmlSolrj之HttpSolrClient旧版本的连接服务HttpSolrServer在solr5版本后已经停用,被新的HttpSolrClient取代,大家可以从下面的url中查看相关的API,了解更详细的变动。A...

2018-03-01 17:37:49

Windows系统Solr单机安装

Windows系统Solr单机安装标签(空格分隔):SolrSolr概览1,什么是SolrSolr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过HttpGet操作提出查找请求,并得到XML格式的返回结果。2,Solr特点Sol...

2018-03-01 17:36:00

Spark开发性能调优

Spark开发性能调优标签(空格分隔):Spark–WriteByVin1.分配资源调优Spark性能调优的王道就是分配资源,即增加和分配更多的资源对性能速度的提升是显而易见的,基本上,在一定范围之内,增加资源与性能的提升是成正比的,当公司资源有限,能分配的资源达到顶峰之后,那么才去考虑做其他的调优如何分配及分配哪些资源在生产环境中,提交spark作业时...

2018-03-01 17:26:44

Redis DB开发指南

RedisDB标签(空格分隔):Redis1,概述:Redis是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API2,安装、编译Redis安装、编译[hadoop@bigdata01sdb4]$lsapacheappeclipseidea-141l...

2018-02-28 10:31:09

Kafka全解析

kafka标签(空格分隔):Kafka一.ConceptsKafkaisusedforbuildingreal-timedatapipelinesandstreamingapps分布式消息传递网站活跃数据跟踪日志聚合流式数据处理数据存储事件源……Kafkaterminology术语1.TopicsKafka...

2018-02-28 10:28:22

Azkaban基础指南

Azkaban标签(空格分隔):AzkabanAzkabanisabatchworkflowjobschedulercreatedatLinkedIntorunHadoopjobs.Azkabanresolvestheorderingthroughjobdependenciesandprovidesaneasytousewebu...

2018-02-28 10:26:45

Hive基础指南

Hive指南标签(空格分隔):HiveHIVE基本介绍Hive是由FaceBook开源的用于解决海量结构化日志的数据统计,后成为ApacheHive的一个开源项目,Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL(也成为HQL)查询功能,它的本质是将HQL转化为MapReduce程序,灵活性和扩展性比较好,支持自定义函数(UDF)...

2018-02-28 10:23:45

Flume + Kafka + TridentStorm + Hbase项目实战

Flume+Kafka+TridentStorm+Hbase项目实战版权声明:禁止转载,转载必究标签(空格分隔):Storm项目WritebyVin1,项目简介项目名称:基于Storm开发实现的实时网站流量统计项目需求:通过Storm分析业务系统产生的网站访问日志数据,实时的统计出各种PV,包括:每个URL单独的PV网站外链...

2018-02-28 10:21:10

Flume指南

Flume基础标签(空格分隔):FlumeFlume概述Flume是一个分布式的,可靠的,可用的,非常有效率的对大数据量的日志数据进行收集,聚集,移动信息的服务,Flume仅仅运行在linux环境下,它是一个基于流式的数据的灵活的架构,具有健壮和容错性,官网中这样解释健壮和容错:Theeventsarestagedinachanneloneachagen...

2018-02-28 10:15:51

Apache Beam指南

ApacheBeam标签(空格分隔):Hadoop1.WhatisBeam?前世今生:诞生背景:分布式数据处理发展迅猛–>新的分布式数据处理技术越来越多–>HadoopMapReduce,ApacheSpark,ApacheStorm,ApacheFlink,ApacheApex–>新技术高性能,受欢迎,人们喜...

2018-02-28 10:12:37

Scala基础语法指南

Scala标签(空格分隔):ScalaByVinflyScalaScala介绍Scala语法声明变量数据类型与操作符函数调用和apply()函数条件控制和循环函数数组数组转换Map与Tuple面对对象编程之–类面向对象编程之对象面向对象之继承面向对象编程之Trait函数式编程引言语法函数式编程之集合操作模式匹配类型参数隐式转...

2018-02-28 10:08:26

Spark基础全解析

SPARK全解析标签(空格分隔):SparkSPARK全解析Spark是什么?Spark源码编译Spark本地模式安装配置及SparkShell基本使用Spark集群SparkApplication开发、运行及监控(IDEA)Spark日志监控(HistoryServer)配置SparkRDDSpark共享变量Spark内核Spark依赖Spa...

2018-02-28 10:05:32

Hbase基础全解析

HBASE基础全解析标签:大数据生态本文使用版本hbase-0.98.6-cdh5.3.6源码库:https://github.com/apache/hbase/releases注:rel=release即发行版本,RC=ReleaseCandidate即候选发行版WriteByVinFlyHBASE概述HBASE概述HBASE是...

2018-02-28 09:40:56
奖章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!