自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

蚂蚁窝

努力成为一位经验丰富的解决方案架构师

  • 博客(34)
  • 收藏
  • 关注

转载 Power BI vs. QuickBI vs. DataV

转自https://blog.csdn.net/orz15/article/details/53081934

2019-07-18 17:10:04 2550

原创 cloudera Java API pom.xml

https://www.cloudera.com/documentation/enterprise/latest/topics/install_software_cm_wizard.html< project > < repositories > < repository > < id > cdh.repo </...

2019-07-16 20:32:32 239

原创 sublime打开txt乱码问题修复

Package Control是Sublime Text3负责插件管理的插件,所以安装Package Control插件时安装其他插件的前提,而Package Control安装方法分为手动安装和自动安装两种,下面是自动安装方法:Package Control的安装详情在官网上边有说明,首先百度搜索Package Control官网,我们便会出现如下的界面。点击右侧绿色的Install Now...

2019-07-13 21:17:38 425

原创 《hive编程指南》阅读随笔13

2019-07-09 20:58:23 126

原创 《hive编程指南》阅读随笔12

2019-07-09 18:31:51 124

原创 《hive编程指南》阅读随笔11

2019-07-09 18:12:01 107

原创 《hive编程指南》阅读随笔10

2019-07-09 17:24:16 271

原创 《hive编程指南》阅读随笔09

2019-07-09 14:40:17 83

原创 《hive编程指南》阅读随笔08

2019-07-09 13:53:26 91

原创 《hive编程指南》阅读随笔07

2019-07-09 11:53:13 97

原创 To enable Oozie web console install the Ext JS library解决办法

新集群安装后,oozie还不能打开:解决办法:下载ext-2.2.zip到本机,上传到Oozie Server上对应目录下:whereis ooziecd /var/lib/oozie/sudo yum install unzipsudo unzip ext-2.2.zipchown oozie:oozie -R ext-2.2再次访问web,正常了。...

2019-07-08 20:06:25 316

原创 执行sqoop脚本提示Permission denied

执行sqoop import --connect jdbc:mysql://test.public.db.gdapi.net/etnadb --username etna --password C4rWqW9vvgMFh9om --table etna_function --target-dir /tmp/test报错:解决办法:sudo -u hdfs sqoop import --...

2019-07-08 18:33:51 1012

原创 《hive编程指南》阅读随笔06

数组索引是基于0的,这个和java是一样的。函数数学函数聚合函数

2019-07-08 09:42:55 96

原创 《hive编程指南》阅读随笔05

hive会根据select的最后两列来确定分区字段country, state的值

2019-07-05 19:43:52 102

原创 《hive编程指南》阅读随笔16

hive cli会在本地创建.hivehistory这样的文件,以及会在/tmp目录和hadoop.tmp.dir目录下创建一些条目。hiveserver2成了hadoopjob开启执行的地方

2019-07-04 20:16:01 122

原创 《hive编程指南》阅读随笔15

文件格式、记录格式stored as textfile/sequencefile/文件格式行分隔符字段分隔符记录格式:SerDeRegexSerDe处理标准格式的apache web日志CSVSerDe / TSVSerDe 处理CSV/TSV文件XPath(XML路径语言)JSONSerDeAvro Hive SerDe...

2019-07-04 19:19:53 98

原创 《hive编程指南》阅读随笔04

分区分层存储alter table log_message add partition(month=1) location ‘hdfs://master-server/data/log_messages/month=6’describe extended log_messages;describe extended log_messages pa...

2019-07-04 18:10:12 89

原创 《hive编程指南》阅读随笔03

2019-07-04 16:03:18 85

原创 《hive编程指南》阅读随笔02

一次使用命令hive -ehive -S -ehive -S -e “select * from test_table” > /tmp/a.txthive会将输出写到标准输出中。上面的shell命令将输出重定向到本地文件系统,而不是hdfshive CLITab制表符 自动补全...

2019-07-04 14:52:36 132

原创 《hive编程指南》阅读随笔01

CLI:hive命令行界面thrift服务:提供了可远程访问其他进程的服务,也提供了JDBC/ODBC访问hive的功能。JDBC/ODBC:访问hive,都是基于thrift服务来实现的。HWI:hive网页界面,提供了远程访问hive的服务metastore:元数据存储,通常替换为mysqlhadoop dfs 已经不推荐使用,推荐hdfs dfs警告:不推荐使用Hive...

2019-07-04 12:34:48 98

原创 执行本地文件加载在hive中的py脚本及依赖安装记录

脚本demo脚本功能:把本地文件加载在hive中#!/usr/bin/env python # encoding: utf-8 """@version: v1.0@author: chey@contact: ~@software: PyCharm@file: test.py.py@time: 2019-07-03 15:56""""""创建分区表:CREATE TA...

2019-07-03 17:13:55 389

原创 org.apache.hadoop.security.AccessControlException 解决办法

异常1:上传文件到hdfs,找不到文件异常2:spark-shell启动报错org.apache.hadoop.security.AccessControlException: Permission denied: user=root, access=WRITE, inode="/user":hdfs:supergroup:drwxr-xr-x异常3:远程提交任务给Hadoop 可...

2019-07-02 20:15:12 10289 2

原创 Python3安装

必须root下执行,bigdata下sudo执行make && make install 时某些包权限受限,会报错下载安装包:wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz解压:tar -zxvf Python-3.6.1.tgz建立一个空文件夹,用于存放python3程序:mkdir /u...

2019-07-02 20:04:18 172

原创 大数据组件的退出命令

spark-shell 退出 :quithive 退出 quit; exit;beeline 退出 !exithbase 退出 exithadoop job -kill jobid

2019-07-02 19:00:37 349

原创 本地maven仓库清理(.bat)

要清理的内容包括 所有的包含lastUpdated 的文件set REPOSITORY_PATH=D:\repositoryrem 正在搜索...for /f "delims=" %%i in ('dir /b /s "%REPOSITORY_PATH%\*lastUpdated*"') do ( del /s /q %%i)rem 搜索完毕pause.bat...

2019-06-29 12:02:49 6686

原创 反编译.class和原java文件的源码对比

主要是对比字面型常量之间、变量之间以及两者之间运算在编译后的差异源代码:int a=1+2;System.out.println(a);int b=10;int c=20;int d=a+b;System.out.println(d);.class文件反编译int a = 3;System.out.println(a);int b=10;int c=20;...

2019-06-29 12:01:34 4707

原创 Windows快捷打开服务的命令查询表

“开始”—&gt; “运行”输入以下命令,或者Win + R,输入以下命令对我比较有用的几个:31. regedit.exe----注册表48. msconfig.exe---系统配置实用程序 80. services.msc---本地服务设置 93. regedit.exe----注册表 1. gpedit.msc-----组策略 2. sndrec32-----...

2019-06-29 12:00:49 9718

原创 HDFS读写文件流程

HDFS写流程: 写的详细流程: ① 客户端向HDFS写数据,首先跟namenode通信以确认可以写文件(namenode检查目标文件是否存在,父目录是否存在),确认可以上传,返回给客户端client ② client会先对文件进行切分,默认一个block块是128M,比如说,文件有300M,就会被切分成3块,两个128M,一个44M。然后client会向namenode请求上传...

2019-06-29 11:55:27 987

原创 iTerm2配置rz/sz

注意事项

2019-06-29 11:51:33 678

原创 iTerm2配置显示主题+字体

iTerm2 + oh my zsh +agnoster

2019-06-29 11:50:46 3516

原创 iTerm2配置远程连接服务器实操记录

草稿

2019-06-29 11:48:40 2848

原创 sqoop+crontab(mysql表定期导入到hive)

执行命令sqoop job --create todbincrementjob -- import \--connect jdbc:mysql://xx.xx.xx.xx:3306/iepdb \--username xxxxx_iep \--password-file /user/train/password.file \ --target-dir /tmp/mysqldb/hs_xx...

2019-06-29 11:38:21 473

原创 airflow分享

组成部分从一个使用者的角度来看,调度工作都有以下功能:系统配置($AIRFLOW_HOME/airflow.cfg)作业管理($AIRFLOW_HOME/dags/xxxx.py)运行监控(webserver)告警(邮件或短信)日志查看(webserver 或 $AIRFLOW_HOME/logs/)跑批耗时分析(webserver)后台调度服务(scheduler)除了短信需...

2019-06-29 11:30:47 2151

原创 airflow安装实操记录

1.1 基础安装1.1.1 默认自带python2环境,自行安装pipsudo yum -y install python-pip使用bigdata用户安装,需要加sudo,否则会出现Permission denied1.1.2 进行pip的更新,否则后续很多安装会报错 sudo pip install --upgrade pip sudo pip install --upgrade...

2019-06-29 11:25:42 391

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除