自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (4)
  • 收藏
  • 关注

原创 关于flume采集,这个问题一直无法解决,不知道是hadoop集群的问题还是,flume的问题

on_1_201408262011 to /data/flume/event_log/impression_washington_1_201408262011.COMPLETED2014-08-27 10:24:49,844 (pool-5-thread-1) [INFO - org.apache.flume.client.avro.ReliableSpoolingFileEventReade

2014-08-27 10:31:49 2776 2

原创 Mac 使用命令行解压 rar文件

1、首先安装brew> brewzsh: command not found: brew去官网:https://brew.sh/index_zh-cn 找到安装命令:/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"2、bre...

2019-02-13 15:46:11 1957

转载 在VMware中使用Nat方式设置静态IP

引用参考:https://www.cnblogs.com/jsonhc/p/7685393.html在VMware中使用Nat方式设置静态IP为了在公司和家中不改变ip,所以采用vm的NAT模式来设置静态ip1、vm采用NAT模式联网2、编辑vm虚拟机设置 3、查看该网段的网关 可以看出网关为192.168.44.2,然后开始设置静态ip然后查看win本机的vnet8网段:可以看出在同一网段了,于...

2018-04-09 15:30:13 404 2

原创 eclipse 搭建一个tomcat 传输文件

1.new -project--dynamic web project2.Windows-->show view-->serversadd tomcat server3.在webContent目录下,放置需要传输的文件一定要刷新出来,eclipse上面能看到,否则页面会报404。当然如果是单独启动的tomcat就不需要了:...

2018-04-04 15:46:08 253

原创 如何在Linux系统搭建jupyter notebook

参考如何在Linux系统搭建jupyter notebookhttps://blog.csdn.net/langhailove_2008/article/details/79110949准备环境,官网下载:linux版本的anaconda3:https://www.anaconda.com/download/#linux上传到server1.执行脚本:sudo sh Anaconda3-5.1...

2018-04-04 14:14:52 1406

原创 英文介绍

介绍项目Do some development work, and force on bigdata, about hadoop spark computer coding.Recently I work data anatyce about  sas logic transform spark rdd to implementbecause some metrics can not

2018-02-06 15:42:20 361

原创 Lambda 表达式

Passing Functions to SparkScalaJavaPythonSpark’s API relies heavily on passing functions in the driver program to run on the cluster. In Java, functions are represented by classes implementi

2016-09-10 16:12:19 299

原创 JSONObject_v3

package json;import net.sf.json.JSONArray;import net.sf.json.JSONObject;import java.io.*;import java.util.ArrayList;/** * Created by xz86173 on 2/5/2016. */public class JSONObject_

2016-02-24 11:52:39 370

原创 sbt编译spark源码

[username@server1 spark-1.5.2]$ /data/2/functionId/tmp/compile/sbt/bin/sbt gen-ideaGetting org.scala-sbt sbt 0.13.7 ...You probably access the destination server through a proxy server that is

2016-01-04 16:16:35 1985

原创 IntelliJ IDEA使用说明

安装完Intellij后请记得安装scala插件,此处跳过1.创建scala项目:IntelliJ IDEA使用说明单击右键,run第一次因为要进行编译时间会比较久,第二次运行就快多了进行spark开发:对刚才的程序打包:接下来进行build:

2015-12-06 09:12:47 480

原创 SimpleGraphX PageRank shell

package week7import org.apache.log4j.{Level, Logger}import org.apache.spark.{SparkContext, SparkConf}import org.apache.spark.graphx._import org.apache.spark.rdd.RDDobject SimpleGraphX { def m

2015-12-02 08:36:35 491

原创 hive参数调节

一.优化切入后session作用域set mapred.job.priorityset mapred.job.priority=VERY_HIGH整体map执行90%,才会启动reducedMR中间压缩set hive.exec.compress.intermediate=true;   hive开启压缩set mapred.compress.map.o

2015-12-02 07:39:26 1711

原创 SparkSqlForTest

package week4/** * Created by Administrator on 2015/3/31. */import java.text.SimpleDateFormatimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.SparkConte

2015-12-02 07:37:43 387

原创 english

1.No animal experiment,[ɪk'sperɪmənt],When we were on the operating['ɒpəreɪtɪŋ]  table.Human is the object of the experiment。If we can choose,the little mouse, or your family.How would you c

2015-11-29 23:24:18 331

原创 Deploy_Cluster_CDH

1.卸载java:rpm -qa | grep java  卸载:rpm -e --nodeps  查询出来的包名2.配置ssh: cd  ~/.ssh/                     ssh-keygen -t rsa                  cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys      

2015-11-27 07:57:28 1285

原创 spark cluster 下 spark-shell/spark-spark提交wordcount sparksql Demo

一:环境配置My conf/spark-env.sh is:export SPARK_MASTER_IP=node1.cluster.localexport SPARK_WORKER_CORES=20export SPARK_WORKER_MEMORY=12gexport SPARK_WORKER_DIR=/scratch/cperez/sparkexport 

2015-11-27 07:34:01 1679

原创 kafka安装及使用

一:kafka的安装1.n5上面下载:wget http://apache.dataguru.cn/kafka/0.8.1.1/kafka_2.9.2-0.8.1.1.tgz2.vi /usr/lib/kafka/config/server.properties   broker.id=5log.dirs=/usr/lib/kafka/kafka-logslog.flush.i

2015-11-26 23:04:51 1029

原创 Deploy_Cluster_Apache

一:环境部署修改主机名:vi /etc/sysconfig/network修改主机名和IP的映射关系:vim /etc/hostsjava安装卸载之前版本的java1.卸载java:rpm -qa | grep java  卸载:rpm -e --nodeps  查询出来的包名1.cd /opttar -zxvf jdk-7u75-linux-x64.tar.gz

2015-11-26 23:01:22 808

原创 maven 安装纪录

一:在线安装方式m2e - http://q4e.googlecode.com/svn/trunk/updatesite-iam/ Help -> Install New Software…1.http://download.eclipse.org/technology/m2e/releases 2.http://www.fuin.org/p2-repository/ 

2015-11-24 23:04:05 446

原创 spark 单机模式

一.安装scalahttp://www.scala-lang.org/download/2.10.6.htmltar -zxvf scala-2.10.5.tar二.安装spark1.下载http://spark.apache.org/downloads.html选择:pre build for hadoop 2.6 later spark-1.5.2-bi

2015-11-24 14:47:56 910

原创 hadoop 单机模式

一:安装hadoop1.binaryhttp://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.6.2/hadoop-2.6.2.tar.gz2.hadoop2.6 需要jdk1.7的环境,mac自带的是jdk1.6,升级方法见上一篇文章3.tar -zxvf hadoop-2.6.2.tar.gz4.cd had

2015-11-24 00:09:17 415

原创 mac安装/升级java并配置环境变量

工作需要升级java版本,(1.6-1.7).中间出现了一些插曲。摔,版本明明已经升上去了。。。1.下载java更新包jdk-7u45-macosx-x64.dmg2.安装出错,“您的系统具有 Mac OS X 版本 10.10.5。此产品可安装在版本 10.7.3 或更高版本上。有关详细信息, 请访问 java.com/help。”3.

2015-11-23 23:24:58 2939

原创 hadoop_cluser

修改主机名:vi /etc/sysconfig/network修改主机名和IP的映射关系:vim /etc/hostsjava安装卸载之前版本的java1.卸载java:rpm -qa | grep java  卸载:rpm -e --nodeps  查询出来的包名1.cd /opttar -zxvf jdk-7u75-linux-x64.tar

2015-11-18 08:29:01 1077

原创 hadoop 学习路线

一:大数据中心的技术内幕(彻底理解Hadoop)1.Hadoop:HDFS,MapReduce,Yarn,Sqoop,Hive,Hbase2.Kafka3.Spark4.Flink5.机器学习二:彻底掌握HDFS(具备开发自己网盘的能力)1.HDFS体系架构剖析2.Namenode,Datanode,SecondaryNameNode架构3.保证Name

2015-11-03 17:26:09 848

原创 pymongo 使用

1.连接数据库的脚本import pymongoconn = pymongo.Connection('localhost',27017)异常:Traceback (most recent call last):  File "", line 1, in AttributeError: 'module' object has no attribute 'Connectio

2015-08-13 14:29:27 543

原创 jvm学习笔记

1.局部变量栈上分配,永远不可能出现内存泄露堆:全局的,方法的。共享线程、栈:局部的,局部变量,私有线程,一个函数调用结束之后,栈会移除二:JVM启动流程JVM基本结构内存模型编译和解释运行的概念1.java 启动程序2.装载配置:在当前配置下寻找jvm的配置文件,之后定位jvm.dll3.根据配置寻找JVM.dll :4.根

2015-08-03 10:45:14 753

原创 awk 两个文件的两个列若相同,合并两个文件

1.文件1[root@bi-3 bin]# cat push TCL_P728M       TCL     74eda717a4aef660f362f1806eb85d9dTCL_S720_JB2    TCL     ecb6724875f6361466f4e91df603f06cTCL_P728M       TCL     f654f6d4f2157a658c0d7f688

2015-08-03 10:39:57 14129

原创 【异常】R语言使用library("XLConnect"):计算机丢失jvm.dll

http://write.blog.csdn.net/postedit

2015-07-23 16:39:19 2616

阿里大数据笔试

java, scala, python 相关代码实现。算法思想。分享答案

2018-01-23

数据结构相关算法题

java 向量的实现 栈实现 队列实现 链表的实现 二叉树的实现 求二叉树的深度 按层次遍历二叉树 求二叉树的宽度 各类排序算法java实现

2018-01-04

csapp手稿-计算机系统基础

第二部分 计算机系统基础 考试题型:问答、分析、编程 总分:40分 一、处理器体系结构 内容:CPU中的时序电路、单周期处理器的设计、流水线处理器的基本原理、DataHazard 的处理、流水线设计中的其他问题 二、优化程序性能 内容:优化程序性能、优化编译器的能力和局限性以及表示程序性能、特定体系结构或应用 特性的性能优化、限制因素、确认和消除性能瓶颈 三、存储器结构及虚拟存储器 内容:局部性、存储器层级结构、计算机高速缓存器原理、高速缓存对性能的影响、地址空 间、虚拟存储器、虚拟内存的管理、翻译和映射、TLB、动态存储器分配和垃圾收集 四、链接、进程及并发编程 内容:静态链接、目标文件、符号和符号表、重定位和加载、动态链接库、异常和进程、进 程控制和信号、进程间的通信、进程间信号量的控制、信号量,各种并发编程模式,共享变 量和线程同步,其他并行问题 五、系统级 I/O和网络编程

2017-12-01

961-软件工程学科

第一部分 软件工程 第二部分 计算机系统基础 第三部分 数据结构与算法

2017-12-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除