CentOS_Pc-CSDN博客

原创 SQL优化

1：查询模糊匹配尽量避免在复杂查询中使用like “%parml%”，因为%会导致相关列索引无法使用。2：索引问题不要在建立索引的数据列中进行如下操作：避免对索引字段进行计算操作；避免在索引字段上使用not,<>,! ；避免在索引列上使用IS NULL和IS NOT NULL；避免在索引列上出现函数类型转换；避免在索引列中使用空值；3：where语法法则避免在wh...

2019-05-05 19:04:19 132

原创 Hbase集群优化-实用

Hbase集群优化信息-平台优化是为了在程序运行调用的过程中 1：保障程序正常执行 2：给程序提供较优的执行环境1：针对Hbase优化信息如果集群内存够用的话，建议关闭交换区，直接使用物理内存关闭内存空间或者调整交换空间大小Linux默认交换空间为60；查看路径：/proc/sys/vm/swappiness如果需要关闭内存空间将改值设置...

2019-04-15 19:43:39 693

原创 Linux文件系统选择对hbase的影响

优化一：1：用户采用ext3系统进行挂载的时候，设置notime属性来禁止记录文件访问时间戳，减少内核管理开销，这样达到hbase读优化目的：设置如图：优化二： ext3提供磁盘空间，默认情下为每一个系统进程保留一块固定空间，保证磁盘存储满以后不影响关键系统进程的使用，这个功能对数据存储磁盘几乎没用，所以，要对存储磁盘的次功能进行优化。注意：此优化只适用于数据...

2019-03-13 09:57:47 338

原创 hbase.regionserver.global.memstore.upperLimit is deprecated by hbase.regionserver.global.memstore

程序运行过程中日志中存在WARN信息hbase.regionserver.global.memstore.upperLimit is deprecated by hbase.regionserver.global.memstore.size但是无论怎么设置这两个参数，hbase在进行读写过程中很容易就触碰到阀值，甚至regionservice直接死掉。一直被WARN信息困扰，无论怎么调...

2019-02-20 08:21:11 2090 1

原创 Kettle 从oracle导入hhbase

Kettle 从oracle导入hhbase配置Hbase output配置一：Configure connection配置 1：找到hbase的主节点作为hadoop cluster的链接地址 2：从hbase主节点中获取对应的hbase-site.xml数据。用来配置URL to hbase-s...

2019-02-19 15:12:38 468

原创 hbase数据迁移-利用export/import

数据导入方式一：基本数据导入第一步：数据从目标集群导出 hbase org.apache.hadoop.hbase.maprduce.Export 表名 /导出表的hdfs路径支持增量导入在原有的导入命令下添加版本号和时间戳 hbase org.apache.hadoop.hbase.maprduce.Export 表名 /导出表的...

2019-02-19 15:09:27 653

原创虚拟机磁盘扩容+hdfs磁盘挂载

第一步：在vm中创建对应得虚拟磁盘第二步：依据默认，选择下一步，进入磁盘大小选择界面。选择后，下一步操作。完成磁盘创建第三步：使用root权限进入命令行界面，并且执行fdisk -l 命令。查看已经创建的磁盘【提示：如果是在开机状态下创建虚拟磁盘，执行该命令未发现创建的磁盘，只要重启该虚拟机就可以】 ...

2019-02-19 15:05:38 615

原创基于flink流处理的动态实时电商分析系统02

1：电商分析数据来源上报服务：从已有的业务系统中获取数据日志数据：从已有的业务系统中通过flume获取数据数据库数据：从关系型数据库中获取数据（mysql、oracle）2：获取不同源数据，将数据上传到kafka消息队列中。3：flink中kafka消息队列中获取数据，对数据级别进行处理实时处理、批处理4：分析后的数据进行存储，存储...

2019-02-04 10:14:06 1029 3

原创基于flink流处理的动态实时电商分析系统01

0：计算引擎的发展史：第一代：hadoopMapreduce 第二代：Tez、Oozie批处理第三代：spark基于内存实时处理框架有向无环图，job内部的有向无环图第四代：flink真正的实时系统1：flink特点： 1.1高吞吐、低延迟 ...

2019-02-03 14:10:06 975 2

原创 2.blink-fink-example-KMeans

方法：KMeans() / ** *此示例实现了基本的K-Means聚类算法。 * * K-Means是一种迭代聚类算法，其工作原理如下： * K-Means被赋予一组要聚类的数据点和一组初始的''K''聚类 *中心。 *在每次迭代中，算法计算每个数据点到每个聚类中心的距离。 *每个点都分配给最靠近它的集群中心。 *随后，每个聚类中心都移动到所有点的中心（“均值”）...

2019-01-29 14:49:24 246

原创 1.blink-fink-quickstart-scala

方法：object BatchJob {}object StreamingJob {} import org.apache.flink.api.scala._/**--译文* Flink批处理作业的骨架。 * *有关如何编写Flink批处理应用程序的教程，请查看 *有关<a href="http://flink.apache.org/docs/stabl...

2019-01-29 14:45:25 190

原创 blink目录

1：fink-quickstart2：fink-example3：fink-core4：fink-scala5：flink-streaming-scala6：flink-filesystems7：fink-clients8：fink-connectors9：fink-container

2019-01-29 14:43:23 332

原创 Elasticsearch-入门

wget 官网复制下载地址：https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.5.2.tar.gz解压 bin：存放启动脚本 config:配置文件目录 lib:第三方库目录 modules：模块目录 plugins：插件目录满足jdk版本1.8以...

2019-01-29 14:34:32 135

原创 Kettle 从oracle导入hhbase配置

Kettle 从oracle导入hhbase配置Hbase output配置一：Configure connection配置1：找到hbase的主节点作为hadoop cluster的链接地址2：从hbase主节点中获取对应的hbase-site.xml数据。用来配置URL to hbase-site.xml[注意]：这里windows下地址需要在路径前面加 file:///3：ur...

2019-01-29 14:32:07 588

翻译归并排序-java实现

归并排序的代码和思路整理很多。这里我只做整理。易理解的图、思路清晰的代码1：归并排序图解过程如下：以数组{50,10,90,30,70,40,80,60,20}为例，Java实现如下：package cn.itpcc.sort;import java.util.Arrays;//归并排序是一种比较占内存，但却效率高且稳定的算法public class MergeSort ...

2018-09-29 09:28:00 134

翻译图解快速排序

快速排序的代码和思路整理很多。这里我只做整理。易理解的图、思路清晰的代码public class FastSort{ public static void main(String []args){ System.out.println("Hello World"); int[] a = {12,20,5,16,15,1,30,45,23,9...

2018-09-28 09:19:40 425 1

原创启动namenode出现警告

[root@hadoop128 hadoop-2.7.2]# sbin/hadoop-daemon.sh start namenodestarting namenode, logging to /opt/module/hadoop-2.7.2/logs/hadoop-root-namenode-hadoop128.outJava HotSpot(TM) Client VM warning:...

2018-09-17 23:14:01 2718

原创使用连接mysql的jdbc驱动最新版（6.0+时，遇到数据库和系统时区差异引起的问题。）引发的问题

使用最新的连接驱动 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>6.0.3</version> </dependency>运行程序时抛出异

2018-09-17 23:12:02 443

原创 Flink Ha搭建

自己搭建ha的时候也遇到不少坑，各种报错。也是站在前人的肩膀上前行。整理一下具体的ha流程。希望能让后来者少走弯路~具体的属性的含义可以查看官方说明。这里直接上配置信息。不多说，就是干！默认集群设置：pcc01、pcc02、pcc03，设置pcc03为主节点、pcc02为备用节点实现高可用0：下载解压flink-1.6.01：配置相关节点信息 0：pcc03 节点配置...

2018-09-17 22:54:39 1231

原创 The import XXX cannot be resolved 完美解决

alt+/ 解决Eclipse如果报错：The import XXX cannot be resolved，xxx类都没什么问题。解放方法 project--》clean下。 ...

2018-03-24 12:46:30 25594 4

转载 vm三种网络模式介绍-2018-2-21

一、Brigde——桥接：默认使用VMnet0 1、原理： Bridge 桥"就是一个主机，这个机器拥有两块网卡，分别处于两个局域网中，同时在"桥"上，运行着程序，让局域网A中的所有数据包原封不动的流入B，反之亦然。这样，局域网A和B就无缝的在链路层连接起来了，在桥接时，VMWare网卡和物理网卡应该处于同一IP网段当然要保证两个局域网没有冲突的IP. VMWare 的桥也是同样...

2018-02-21 10:59:12 793

CentOS_Pc的博客