自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CentOS_Pc的博客

站在巨人的肩膀上,寻找黎明的曙光

  • 博客(21)
  • 收藏
  • 关注

原创 SQL优化

1:查询模糊匹配尽量避免在复杂查询中使用like “%parml%”,因为%会导致相关列索引无法使用。2:索引问题不要在建立索引的数据列中进行如下操作:避免对索引字段进行计算操作;避免在索引字段上使用not,<>,! ;避免在索引列上使用IS NULL和IS NOT NULL;避免在索引列上出现函数类型转换;避免在索引列中使用空值;3:where语法法则避免在wh...

2019-05-05 19:04:19 132

原创 Hbase集群优化-实用

Hbase集群优化信息-平台优化是为了在程序运行调用的过程中 1:保障程序正常执行 2:给程序提供较优的执行环境1:针对Hbase优化信息如果集群内存够用的话,建议关闭交换区,直接使用物理内存关闭内存空间或者调整交换空间大小Linux默认交换空间为60;查看路径:/proc/sys/vm/swappiness如果需要关闭内存空间将改值设置...

2019-04-15 19:43:39 693

原创 Linux文件系统选择对hbase的影响

优化一:1:用户采用ext3系统进行挂载的时候,设置notime属性来禁止记录文件访问时间戳,减少内核管理开销,这样达到hbase读优化目的:设置如图:优化二: ext3提供磁盘空间,默认情下为每一个系统进程保留一块固定空间,保证磁盘存储满以后不影响关键系统进程的使用,这个功能对数据存储磁盘几乎没用,所以,要对存储磁盘的次功能进行优化。注意:此优化只适用于数据...

2019-03-13 09:57:47 338

原创 hbase.regionserver.global.memstore.upperLimit is deprecated by hbase.regionserver.global.memstore

程序运行过程中日志中存在WARN信息hbase.regionserver.global.memstore.upperLimit is deprecated by hbase.regionserver.global.memstore.size但是无论怎么设置这两个参数,hbase在进行读写过程中很容易就触碰到阀值,甚至regionservice直接死掉。一直被WARN信息困扰,无论怎么调...

2019-02-20 08:21:11 2090 1

原创 Kettle 从oracle导入hhbase

Kettle 从oracle导入hhbase配置Hbase output配置      一:Configure connection配置                   1:找到hbase的主节点作为hadoop cluster的链接地址                   2:从hbase主节点中获取对应的hbase-site.xml数据。用来配置URL to hbase-s...

2019-02-19 15:12:38 468

原创 hbase数据迁移-利用export/import

数据导入方式一:基本数据导入    第一步:数据从目标集群导出        hbase org.apache.hadoop.hbase.maprduce.Export  表名 /导出表的hdfs路径        支持增量导入 在原有的导入命令下添加版本号和时间戳        hbase org.apache.hadoop.hbase.maprduce.Export  表名 /导出表的...

2019-02-19 15:09:27 653

原创 虚拟机磁盘扩容+hdfs磁盘挂载

第一步:在vm中创建对应得虚拟磁盘       第二步:依据默认,选择下一步,进入磁盘大小选择界面。选择后,下一步操作。完成磁盘创建     第三步:使用root权限进入命令行界面,并且执行fdisk -l 命令。查看已经创建的磁盘【提示:如果是在开机状态下创建虚拟磁盘,执行该命令未发现创建的磁盘,只要重启该虚拟机就可以】                            ...

2019-02-19 15:05:38 615

原创 基于flink流处理的动态实时电商分析系统02

1:电商分析数据来源     上报服务:从已有的业务系统中获取数据     日志数据:从已有的业务系统中通过flume获取数据     数据库数据:从关系型数据库中获取数据(mysql、oracle)2:获取不同源数据,将数据上传到kafka消息队列中。3:flink中kafka消息队列中获取数据,对数据级别进行处理    实时处理、批处理4:分析后的数据进行存储,存储...

2019-02-04 10:14:06 1029 3

原创 基于flink流处理的动态实时电商分析系统01

0:计算引擎的发展史:   第一代:hadoopMapreduce   第二代:Tez、Oozie批处理   第三代:spark基于内存实时处理框架有向无环图,job内部的有向无环图   第四代:flink真正的实时系统1:flink特点:     1.1高吞吐、低延迟                                                 ...

2019-02-03 14:10:06 975 2

原创 2.blink-fink-example-KMeans

方法:KMeans()  / ** *此示例实现了基本的K-Means聚类算法。 * * K-Means是一种迭代聚类算法,其工作原理如下: * K-Means被赋予一组要聚类的数据点和一组初始的''K''聚类 *中心。 *在每次迭代中,算法计算每个数据点到每个聚类中心的距离。 *每个点都分配给最靠近它的集群中心。 *随后,每个聚类中心都移动到所有点的中心(“均值”)...

2019-01-29 14:49:24 246

原创 1.blink-fink-quickstart-scala

方法:object BatchJob {}object StreamingJob {}  import org.apache.flink.api.scala._/**--译文* Flink批处理作业的骨架。 * *有关如何编写Flink批处理应用程序的教程,请查看 *有关&lt;a href="http://flink.apache.org/docs/stabl...

2019-01-29 14:45:25 190

原创 blink目录

 1:fink-quickstart2:fink-example3:fink-core4:fink-scala5:flink-streaming-scala6:flink-filesystems7:fink-clients8:fink-connectors9:fink-container

2019-01-29 14:43:23 332

原创 Elasticsearch-入门

wget 官网复制下载地址:https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.5.2.tar.gz解压    bin:存放启动脚本    config:配置文件目录     lib:第三方库目录     modules:模块目录     plugins:插件目录满足jdk版本1.8以...

2019-01-29 14:34:32 135

原创 Kettle 从oracle导入hhbase配置

Kettle 从oracle导入hhbase配置Hbase output配置一:Configure connection配置1:找到hbase的主节点作为hadoop cluster的链接地址2:从hbase主节点中获取对应的hbase-site.xml数据。用来配置URL to hbase-site.xml[注意]:这里windows下地址需要在路径前面加 file:///3:ur...

2019-01-29 14:32:07 588

翻译 归并排序-java实现

归并排序的代码和思路整理很多。这里我只做整理。易理解的图、思路清晰的代码1:归并排序图解过程如下:以数组{50,10,90,30,70,40,80,60,20}为例,Java实现如下:package cn.itpcc.sort;import java.util.Arrays;//归并排序是一种比较占内存,但却效率高且稳定的算法public class MergeSort ...

2018-09-29 09:28:00 134

翻译 图解快速排序

快速排序的代码和思路整理很多。这里我只做整理。易理解的图、思路清晰的代码public class FastSort{ public static void main(String []args){ System.out.println("Hello World"); int[] a = {12,20,5,16,15,1,30,45,23,9...

2018-09-28 09:19:40 425 1

原创 启动namenode出现警告

[root@hadoop128 hadoop-2.7.2]# sbin/hadoop-daemon.sh start namenodestarting namenode, logging to /opt/module/hadoop-2.7.2/logs/hadoop-root-namenode-hadoop128.outJava HotSpot(TM) Client VM warning:...

2018-09-17 23:14:01 2718

原创 使用连接mysql的jdbc驱动最新版(6.0+时,遇到数据库和系统时区差异引起的问题。 )引发的问题

使用最新的连接驱动 &lt;dependency&gt; &lt;groupId&gt;mysql&lt;/groupId&gt; &lt;artifactId&gt;mysql-connector-java&lt;/artifactId&gt; &lt;version&gt;6.0.3&lt;/version&gt; &lt;/dependency&gt;运行程序时抛出异

2018-09-17 23:12:02 443

原创 Flink Ha搭建

自己搭建ha的时候也遇到不少坑,各种报错。也是站在前人的肩膀上前行。整理一下具体的ha流程。希望能让后来者少走弯路~具体的属性的含义可以查看官方说明。这里直接上配置信息。不多说,就是干!默认集群设置:pcc01、pcc02、pcc03,设置pcc03为主节点、pcc02为备用节点实现高可用0:下载解压flink-1.6.01:配置相关节点信息    0:pcc03  节点配置...

2018-09-17 22:54:39 1231

原创 The import XXX cannot be resolved 完美解决

 alt+/  解决Eclipse如果报错:The import XXX cannot be resolved,xxx类都没什么问题。解放方法 project--》clean下。                                                                                                       ...

2018-03-24 12:46:30 25594 4

转载 vm三种网络模式介绍-2018-2-21

一、Brigde——桥接:默认使用VMnet0 1、原理:  Bridge  桥"就是一个主机,这个机器拥有两块网卡,分别处于两个局域网中,同时在"桥"上,运行着程序,让局域网A中的所有数据包原封不动的流入B,反之亦然。这样,局域网A和B就无缝的在链路层连接起来了,在桥接时,VMWare网卡和物理网卡应该处于同一IP网段  当然要保证两个局域网没有冲突的IP.  VMWare 的桥也是同样...

2018-02-21 10:59:12 793

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除