自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小时光

千里之行,始于足下!

  • 博客(36)
  • 资源 (11)
  • 收藏
  • 关注

原创 Centos7.6操作系统安装+Bond配置(600GB磁盘版本)

1.安装前准备工作准备centos7.6操作系统镜像 CentOS-7-x86_64-DVD-1810.iso 服务器安装一般都是在BMC界面操作,所以安装前需要在BMC界面挂载好操作系统镜像重启服务器后自动进入安装界面。华为大数据集群安装操作系统配置

2021-12-11 19:59:30 4229

原创 Shell流程控制

if 语句if [ 条件判断式 ];then 程序 fi 或者 if [ 条件判断式 ] then 程序 fi----------------------------#!/bin/bashif [ $1 -eq "1" ]then echo "11111111111111"elif [ $1 -eq "2" ]then ...

2019-12-11 19:45:03 176

原创 Linux命令每日一学

查看linux命令的解释 Linux命令大全

2019-12-08 22:40:08 259

原创 Kafka集群Leader选举原理

Kafka集群Leader选举原理我们知道Zookeeper集群中也有选举机制,是通过Paxos算法,通过不同节点向其他节点发送信息来投票选举出leader,但是Kafka的leader的选举就没有这么复杂了。Kafka的Leader选举是通过在zookeeper上创建/controller临时节点来实现leader选举,并在该节点中写入当前broker的信息{“version”:1,”br...

2019-12-03 15:30:34 882

原创 CDH部署时的依赖包

centos7下最小化安装yum install chkconfig python bind-utils psmisc libxslt zlib sqlite cyrus-sasl-plain cyrus-sasl-gssapi fuse fuse-libs redhat-lsb wget

2019-11-29 13:47:28 404

原创 MySQL基础知识

最近再看一本关于mysql的书,感觉很多基础的东西还是需要温习一下的,开文记录一下。

2019-09-30 21:46:30 81

原创 企业数据仓库的一些思考

数据仓库是一个用数据支持企业决策制定,为各部门提供系统的数据支持的集合,可以帮助企业改进业务流程、控制成本、提高产品质量等。

2019-09-19 21:48:45 180

原创 Lede 配置ddns解析(koolddns for openwrt)

准备工作本次采用的软路由,版本是kooolshareLede 2.32,其他的机器支持ddns都行koolddns for openwrt - 0.6.1 ,版本不一设置有较大区别家中有公网地址,这个是必须的,没有公网可以用frp之类的穿透你要有一个阿里的域名,其他域名提供商的也行第一步:获取AccessKey,有哪家的用哪家的https://usercenter.console....

2019-09-13 23:12:11 24893

原创 linux批量修改root密码脚本

#!/bin/bashremote_cmd="echo new_passwd@000 | passwd --stdin root" #new_passwd@000 替换成你自己的密码ip_array=(10.0.1.110.0.1.210.0.1.3)for ip in ${ip_array[*]}do ssh root@$ip $remote_cmddone缺点...

2019-09-03 11:38:16 3111

原创 Spark面试题库

1. Spark消费 Kafka,分布式的情况下,如何保证消息的顺序Kafka 分布式的单位是 Partition。如何保证消息有序,需要分几个情况讨论。同一个 Partition 用一个 write ahead log (WAL)组织,所以可以保证 FIFO 的顺序。不同 Partition 之间不能保证顺序。但是绝大多数用户都可以通过 message key 来定义,因为同一个 key ...

2019-09-01 23:54:21 1260

转载 frp内网穿透服务端搭建

Frp项目主页https://github.com/fatedier/frp/blob/master/README_zh.md

2019-08-27 16:20:13 321

原创 GCP配置root账户连接

GCP默认的系统为Debian获取root账户流程如下sudo -i //切换到root账户vi /etc/ssh/sshd_config //编辑配置文件修改如下配置PermitRootLogin yes //默认为no,需要开启root用户访问改为yesPasswordAuthentication yes //默认为no,改为yes开启密码登陆:wq 保存并退出/etc...

2019-08-27 15:45:40 609

原创 flume的一个错误

flume报错 (PollableSourceRunner-TaildirSource-s1) [WARN - org.apache.flume.source.taildir.TaildirSource.tailFileProcess(TaildirSource.java:266)] The channel is full or unexpected failure. The source wi...

2019-08-20 23:33:16 1088

原创 大数据面试题

wedwe

2019-08-20 00:18:15 237

原创 几个常用的Linux命令

1.查看cpu个数: cat /proc/cpuinfo | grep processor2.查看磁盘:df -h (查看磁盘使用率) df -i (查看iNode使用) fdisk -l (查看磁盘整体) iostat -kx (查看磁盘)

2019-08-19 02:23:35 245

原创 ES6.6.0集群部署(centos6.8)

ES从6.5开始后不允许直接使用root用户运行–待补充–太忙了

2019-08-15 17:24:16 440

原创 Presto 部署安装

1. 解压安装包到指定文件夹个人习惯将软件部署在opt/module下tar -zxvf presto-server-0.196.tar.gz -C /opt/module/2. 创建数据存储目录datamkdir data路径为/opt/module/presto/data3. 创建存储配置文件文件夹 etcmkdir etc路径为/opt/module/presto...

2019-08-10 02:02:31 1604

原创 Azkaban3.x编译

1.环境准备git,gcc,g++, jdk1.8,联网环境2.下载azkaban源码git clone https://github.com/azkaban/azkaban.git 或者(本次编译的是3.7.x)wget https://github.com/azkaban/azkaban/archive/3.70.2.tar.gz3.编译1. 进入源码目录/opt/cs/a...

2019-08-09 15:38:32 477

原创 04--Hive的DDL数据定义

1.1 创建数据库CREATE DATABASE [IF NOT EXISTS] database_name #创建数据库[COMMENT database_comment] #数据库的描述[LOCATION hdfs_path] #存储路径[WITH DBPROPERTIES (property_name=property_value, ...)]; //指定数据块属性数据库在HD...

2019-08-06 01:13:42 89

原创 03--hive交互命令和常见数据类型

bin/hive -help[root@hadoop33 hive]# hive -helpusage: hive -d,--define <key=value> Variable subsitution to apply to hive commands. e.g. -d A=B or --d...

2019-08-05 18:07:13 147

原创 ls: 无法访问/opt/module/spark/lib/spark-assembly-*.jar: 没有那个文件或目录

从spark升级到2.0.0之后,原有的lib的整个大JAR包已经被分散的小JAR包的替代,所以肯定没有办法找到这个spark-assembly的JAR包,修改一下配置就行了hive脚本114行开始if [[ -n "$SPARK_HOME" ]]then sparkAssemblyPath=`ls ${SPARK_HOME}/lib/spark-assembly-*.jar` C...

2019-08-05 17:51:09 2671

转载 02--Hive和数据库比较

Hive和数据库比较由于 Hive 采用了类似SQL 的查询语言 HQL(Hive Query Language),因此很容易将 Hive 理解为数据库。其实从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。1 查询语言由于SQL被广泛的应用在数据仓库中,因此,专门针对Hive的特性设计了类SQL的查询语言HQL。熟悉SQL开发的开发者可以很方便的使用Hive进行开发。...

2019-08-05 17:35:18 90

原创 01--浅析Hive

1.什么是HiveHive是由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序2 Hive的优缺点2.1 优点操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。避免了去写MapReduce,减少开发人员的学习成本...

2019-08-05 17:26:42 114

原创 02-几个常用的转换算子(value类型)

map(func)返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成mapPartitions(func)类似于map,但独立地在RDD的每一个分片(分区)上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T] => Iterator[U]。假设有N个元素,有M个分区,那么map的函数的将被调用N次,而mapPartitions...

2019-08-05 13:55:23 1030

原创 01--浅析RDD

1.1什么是RDDRDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据(计算)抽象。代码中是一个抽象类,它代表一个不可变、可分区、里面的元素可并行计算的集合。1.2 RDD的属性一组分区(Partition),即数据集的基本组成单位;一个计算每个分区的函数;RDD之间的依赖关系;一个Partitioner,即R...

2019-08-05 00:30:38 122

原创 OozieWeb控制台已禁用的错误

Oozie Web控制台已禁用。要启用Oozie Web控制台,请安装Ext JS库。有关详细信息,请参阅Oozie Quick Start文档。进入oozie安装路径[root@cdh11 oozie]# pwd /var/lib/oozie下载扩展库到该目录,解压,配置权限后既可 wget http://archive.cloudera.com/gplextras/misc/ex...

2019-08-01 21:23:07 146

原创 Hive函数----01关系运算

1. 等值比较: = 语法:A=B 操作类型:所有基本类型 描述: 如果表达式 A 与表达式 B 相等,则为 TRUE;否则为 FALSE;只要有任意比较项为NULL,均返回 FALSE;举例: select 1 from jred where 1=1;1 select 1 from jred where 1=null; 空 select 1 from jred where nu...

2019-08-01 01:17:26 158

原创 WEB篇一 初识html

Html介绍1.什么是html?Html是用来描述网页的一种语言。HTML 指的是超文本标记语言 (HyperTextMarkupLanguage)HTML 不是一种编程语言,而是一种标记语言(markup language)标记语言是一套标记标签(markup tag)HTML 使用标记标签来描述网页2.Html的作用?Web浏览器的作用是读取ht...

2019-07-31 00:21:14 429 1

原创 超好用的软件分享

记录一下我曾经用过的超级好用的软件Everything 最好用的文件搜索工具 下载地址Snipaste 最好用的截图工具 简介-----下载地址

2019-07-31 00:21:05 523

原创 MySQL5.5.27安装教程

一、MYSQL的安装1、打开下载的mysql安装文件mysql-5.5.27-win32.zip,双击解压缩,运行“setup.exe”2、选择安装类型,有“Typical(默认)”、“Complete(完全)”、“Custom(用户自定义)”三个选项,选择“Custom”,按“next”键继续3、点选“Browse”,手动指定安装目录4、填上安装目录,...

2019-07-31 00:17:49 10097 4

原创 本地源部署CDH 5.8.5集群(Centos6.8)

1.环境说明OS:CentOS release 6.8 (Final)CDH: CDH 5.8.53节点测试集群,32G内存,16核CPU,500G/SSD2.安装文件下载cm5.8.5-centos6.tar.gz:http://archive.cloudera.com/cm5/repo-as-tarball/5.8.5/cm5.8.5-centos6.tar.gzParce...

2019-07-31 00:06:30 225

原创 VMware网络设置

在日常使用VMware时最常用的时NAT网络转换模式,在这种模式下虚拟机可以通主机,主机可以通虚拟机,虚拟机之间可以互通,很方便我们进行各种测试,简单测记录一下配置过程。虚拟机安装成公后会多出两块网卡负责NAT 的网卡就是VMnet8的这块网卡,我基本上只用这个,所以另一块禁用了,VMnet1仅主机模式这个不重要打开虚拟机看看配置编辑-->虚拟网络编辑器配置网...

2019-07-30 03:39:34 1462

原创 CDH-5.8.5部署全过程

CDH-5.8.5 部署全过程最近公司部署测试环境,记录一下部署过程,本次部署采用的时虚拟机部署,系统为 CentOS Linux release 7.4.1708 (Core),部署的CDH的版本为CDH-5.8.5准备工作...

2019-07-30 03:18:34 777

原创 NTP服务部署(centos7)

NTP服务在大数据集群部署时时一个很关键的步骤,集群时间不对会导致很多问题1.yum安装ntp服务 yum -y install ntp 离线安装需要三个包 ntp.x86_64 0:4.2.6p5-28.el7.centos autogen-libopts.x86...

2019-07-29 23:54:09 786

原创 xsync 脚本

xsync文件分发脚本#!/bin/bash#1 获取输入参数个数,如果没有参数,直接退出pcount=$#if((pcount==0)); thenecho no args;exit;fi#2 获取文件名称p1=$1fname=`basename $p1`echo fname=$fname#3 获取上级目录到绝对路径pdir=`cd -P $(dirname $p1...

2019-07-29 22:35:36 941

原创 Centos7下安装Mysql-5.6.45

1.下载Mysql对应的RPM安装包贴一下下载地址(https://dev.mysql.com/downloads/mysql/)下载如下3个rpm包MySQL-devel-5.6.45-1.el7.x86_64.rpm MySQL-client-5.6.45-1.el7.x86_64.rpm MySQL-server-5.6.45-1.el7.x86_64.rpm2.卸载Mari...

2019-07-29 21:22:50 1970 1

3.x编译包.zip

源码编译azkaban,使用源码编译,编译后可以直接安装使用

2019-08-09

mysq el7.zip

centos7下mysql安装包,rpm包。 centos7下mysql安装包,rpm包。 centos7下mysql安装包,rpm包。 centos7下mysql安装包,rpm包。

2019-07-30

大数据hive连接工具dbeaver-5.3和对应驱动

大数据hive的一个连接工具dbeaver,以及连接驱动,适合idea开发,连接cdh集群hive使用

2019-02-01

CDH 5.4.7本地快速安装教程,基于ubuntu14.04

Cloudera 企业级数据中心的安装文档,基于Ubuntu 14.04( trusty) 本地快速安装 CDH 5.4.7,这篇文档将采用5节点,重介绍 Cloudera 管理器与 CDH 的安装注意事项,欢迎大数据工程师下载搭建测试环境.

2018-11-22

大数据集群端口故障详解

大数据相关组件的端口故障解析,如何测试端口是否是通的? 2.端口是否被暂用? 3.端口是否被打开?

2018-11-22

VMWare虚拟机安装黑群晖

VMWare虚拟机安装黑群晖,详细的安装操作,参考此文档即可搭建自己的群晖服务器

2018-04-17

Spring源码深度解析

Spring源码深度解析 深入浅出的解析spring源码文件

2018-04-17

Linux就该这么学

Linux就该这么学精校版,适合Linux初学者学习习使用。

2018-04-17

Java基础笔记-基础部分

适合初学者的java笔记,里面很详细的记录了java基础部分的主要知识点

2018-04-17

JavaScript编程精解机械出版社出版

《JavaScript编程精解》如果你只想阅读一本关于 JavaScript 的图书,那么本书应该是你的首选。本书由世界级 JavaScript 程序员 撰写,JavaScript 之父和多位 JavaScript 专家鼎力推荐。本书适合作为系统学习 JavaScript 的参考书,它在写作 思路上几乎与现有的所有同类书都不同,打破常规,将编程原理与运用规则完美地结合在一起,而且将所有知 识点与一个又一个经典的编程故事融合在一起,读者可以在轻松的游戏式开发中学会 JavaScript 程序设计,趣味 性十足,可操作性极强。

2018-04-17

Java基础笔记

自己参加培训的时候整理的java的基础笔记,都是很基础的东西,适合刚刚学习的新手,建议下载后打印一下,边写边看

2017-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除