jQueryZK-CSDN博客

原创 3-整合·

数据量太大，换成 kddcup.data_10_percent（为抽样去重后10%的实验数据）package NetWorkimport org.apache.spark.mllib.clustering.{KMeansModel, KMeans}import org.apache.spark.mllib.linalg.{Vectors,Vector}import org.apache.spark.rdd.RDDimport org.apache.spark.{SparkContext,

2021-06-13 20:53:32 272

原创 2-算法实操

单例对象里面封装了欧氏距离公式和将欧氏距离应用到model中，还有计算k值model平均质心距离和对k的取值进行评价的方法package NetWorkimport org.apache.spark.mllib.clustering.{KMeans, KMeansModel}import org.apache.spark.mllib.linalg.Vectorimport org.apache.spark.rdd.RDD/** *单例对象里面封装了欧氏距离公式和将欧氏距离应用到model中，

2021-06-13 20:48:35 264

原创 1-环境搭建

环境搭建群起Zookeeper群起HDFS群起YARN将数据文件传到Linux系统在HDFS文件上新建一个文件夹将数据文件上传到HDFS文件系统

2021-06-13 20:43:19 248

原创大数据之Hive（三）-Hive元数据配置到MySQL和HiveJDBC访问

1、MySQL引入当打开一个客户端窗口启动Hive后再打开一个客户端窗口启动Hive，会产生java.sql.SQLException异常。原因是，Metastore 默认存储在自带的derby数据库中，推荐使用MySQL存储Metastore;Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.q

2020-11-09 20:07:44 847

原创大数据之Hive（二）-Hive安装运行环境搭建和Hive基本操作

1、Hive安装和配置Hive1.2.1资源链接：https://pan.baidu.com/s/14kVGv6CUGPufPOD57LShGg提取码：69op1、通过XFTP工具将Hive的压缩包远程传输到Linux的/opt/software目录下2、解压apache-hive-1.2.1-bin.tar.gz到/opt/module/目录下面[zhukun@hadoop102 software]$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /op

2020-11-07 16:47:19 426

原创大数据之Hive（一）-Hive入门

1、什么是HiveHive：由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。（本质上是将HQL转化成MapReduce程序）...

2020-11-07 15:16:04 244

原创大数据之Hadoop（六）-hadoop的API和I/O流操作

1、hadoop的API操作1.1建立Maven工程工程目录结构：1.2导入依赖<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 h

2020-11-01 10:08:38 383

原创大数据之HBase（四）-HBase原理分析（读流程、写流程、数据Flush过程、数据合并过程）

1、架构原理分析1、StoreFile保存实际数据的物理文件，StoreFile 以 HFile 的形式存储在 HDFS 上。每个 Store 会有一个或多个 StoreFile（HFile），数据在每个 StoreFile 中都是有序的。2、MemStore写缓存，由于 HFile 中的数据要求是有序的，所以数据是先存储在 MemStore 中，排好序后，等到达刷写时机才会刷写到 HFile，每次刷写都会形成一个新的 HFile。3、WAL由于数据要经 MemStore 排序后才能刷写到 H

2020-10-24 18:05:18 541

原创大数据之HBase（三）-HBase Shell操作（DDL&DML常用操作）

1、基本操作1.进入HBase客户端命令行[zhukun@hadoop102 hbase-1.3.1]$ bin/hbase shell2.查看帮助命令hbase(main):001:0> help命令组：3．查看当前数据库中有哪些表hbase(main):002:0> list3.2 表的操作1．创建表hbase(main):002:0> create ‘student’,‘info’2．插入数据到表hbase(main):003:0> put ‘

2020-10-23 16:40:16 983

原创大数据之HBase（二）-HBase的安装&HBase集群分布式环境搭建和群起

1、Zookeeper正常部署首先保证Zookeeper集群的正常部署，并启动之：[zhukun@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start[zhukun@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh start[zhukun@hadoop104 zookeeper-3.4.10]$ bin/zkServer.sh start也可以通过写群起脚本群起：2、Hadoop正常部署Hadoop集

2020-10-22 16:50:43 598

原创大数据之HBase（一）-HBase入门

1、什么是HBaseHBase的原型是Google的BigTable论文，受到了该论文思想的启发，目前作为Hadoop的子项目来开发维护，用于支持结构化的数据存储。2006年Google发表BigTable白皮书2006年开始开发HBase2008年北京成功开奥运会，程序员默默地将HBase弄成了Hadoop的子项目2010年HBase成为Apache顶级项目HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储

2020-10-22 16:00:22 623

原创大数据之Zookeeper（六）-Zookeeper的API应用&监听服务器节点动态上下线案例

ZookeeperAPI应用1、创建一个Maven工程2、添加pom文件<dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>RELEASE</version> </dependency> <dependency>

2020-10-22 12:42:18 591

原创 JavaWeb学习-用户登录案例（多用户类型选择登录+验证码验证）

1、项目文件整体结构2、准备每一种实体用户对应的数据库表3、index.jsp编写<%@ page contentType="text/html;charset=UTF-8" language="java" %><html><head> <title>LoginTest</title></head><body><form action="LoginServlet" method="post

2020-10-11 10:47:23 9264 2

原创 JavaWeb学习（三）-Servlet体系结构（HTTPServlet抽象类、HttpServletRequest和HttpServletResponse接口、request和response对象）

Servlet体系结构package cn.zhukun.web.servlet;import javax.servlet.*;import javax.servlet.annotation.WebServlet;import java.io.IOException;@WebServlet("/demo")public class ServletDemo implements Servlet { @Override public void init(ServletConfig

2020-10-08 18:47:21 1222

原创 JavaWeb学习（二）-Servlet入门（Servlet工作原理，Servlet接口，Servlet生命周期，Servlet3.0）

1、先介绍一下Tomcat容器tomcat的容器等级分为四个等级，servlet的容器管理context容器，一个context对应一个web工程。Engine是个引擎容器，HOST是主机容器2、Servlet入门2.1什么是Servletservlet 是在服务器上运行的小程序，一个 servlet 就是一个 Java 类，并且可以通过 “请求 - 响应” 编程模式来访问这个驻留在服务器内存里面的 servlet 程序2.2新建Servlet程序在之前创建的JavaEE项目中的src目录下创

2020-10-07 20:47:31 830

原创 JavaWeb学习（一）-Javaweb入门 && IDEA JavaEE项目部署Tomcat

1、 web相关概念1.1 软件架构C/S：客户端/服务器端B/S：浏览器/服务器端1.2资源分类1、静态资源：所有用户访问后，得到的结果都是一样的，称为静态资源.静态资源可以直接被浏览器解析如： html,css,JavaScript2.、动态资源：每个用户访问相同资源后，得到的结果可能不一样。称为动态资源。动态资源被访问后，需要先转换为静态资源，在返回给浏览器如：servlet/jsp,php,asp…1.3网络通信三要素IP：电子设备(计算机)在网络中的唯一标识。端口：

2020-10-07 15:57:05 992

原创大数据之Zookeeper（五）-Zookeeper客户端命令行操作

1、Zookeeper客户端命令行操作1.1启动客户端[zhukun@hadoop103 zookeeper-3.4.10]$ bin/zkCli.sh1.2显示所有操作命令[zk: localhost:2181(CONNECTED) 1] help1.3查看当前znode中所包含的内容[zk: localhost:2181(CONNECTED) 0] ls /[zookeeper]1.4查看当前节点详细数据[zk: localhost:2181(CONNECTED) 1] l

2020-10-07 11:59:30 758

原创大数据之Zookeeper（四）-Zookeeper分布式安装部署和群起Zookeeper服务器

1、Zookeeper分布式安装部署1.1集群规划在hadoop102、hadoop103和hadoop104三个节点集群上部署Zookeeper1.2集群环境搭建hadoop102、hadoop103和hadoop104三个节点间满足SSH免密登录。通过集群分发脚本将hadoop102 的/opt/module/zookeeper-3.4.10目录内容同步到hadoop103、hadoop104（关于xsync集群分发脚本和SSH免密登录可参考：hadoop运行模式之完全分布式运行模式）[z

2020-10-06 20:14:14 1145

原创大数据之Zookeeper（三）-Zookeeper内部原理（选举机制、节点类型、Stat结构体、监听器原理和写数据流程）

1、Zookeeper内部选举机制1、半数机制：集群中必须要有半数以上机器存活，集群才可以正常使用。（Zookeeper适合安装奇数台服务器）2、Zookeeper虽然在配置文件中并没有指定Master和Slave。但是，Zookeeper工作时，是有一个节点为Leader，其他则为Follower，Leader是通过内部选举机制临时产生的3、以一个简单的例子来说明整个选举的过程假设有五台服务器组成的Zookeeper集群，它们的id从1~5，同时它们都是最新启动的，也就是没有历史数据，在存放数

2020-10-06 18:51:23 3079

原创大数据之Hadoop（五）-Hadoop运行模式之完全分布式运行模式（集群分发脚本、集群配置、SSH无密配置、群起集群、集群时间同步）

1、虚拟机准备通过VMware虚拟机克隆功能将hadoop101克隆出hadoop102，hadoop103，hadoop104三台虚拟机并且这3台虚拟机已经完成（关闭防火墙、配置静态IP、配置主机名称、配置主机映射）的操作，接下来准备用这3台克隆的虚拟机搭建集群。上述操作在这篇博客中有详解：Linux学习（六）-Linux学习过程中实用操作（找回root密码&&克隆虚拟机）2、集群分发因为hadoop102，hadoop103，hadoop104是通过hadoop101克隆出来的，

2020-10-06 15:44:01 1361

原创 Linux学习（六）-Linux学习过程中实用操作（找回root密码&&克隆虚拟机）

1、找回root密码很多人在虚拟机中安装Linux系统的过程中就设置好了root密码，初学者没有认识到root权限用户的重要性，设密码时胡乱设置，导致后来忘记root密码，下面就来讲一讲如何找回root密码1.1重启Linux，见到下图，在3秒钟之内按下回车1.2 按回车后出现下图，按e键1.3按e键后，出现下图，↓移到第二个选项再按e键1.4在第二个选项按e键后，出现下图，在quiet后空一格输入single1.5输入single后回车回到grub模式按b进入单用户模式，然后用pa

2020-10-05 22:20:49 1118

原创 Linux学习（五）-常见的系统管理操作（service后台服务管理、chkconfig服务自启配置、进程级别、系统关机重启）

1、service后台服务管理service 服务名 start （功能描述：开启服务）service 服务名 stop （功能描述：关闭服务）service 服务名 restart （功能描述：重新启动服务）service 服务名 status （功能描述：查看服务状态）例如：前面提到的网络服务的管理：（1）查看网络服务的状态#service network status（2）停止网络服务#service network stop（3）启动网络服务#ser

2020-10-05 21:19:58 1158

原创 Linux学习（四）-Linux系统目录结构和 vi/vim 编辑器

Linux目录结构1、基本介绍:linux的文件系统是采用级层式的树状目录结构，在此结构中的最上层是根目录“/”，然后在此目录下再创建其他的目录。深刻理解linux树状文件目录是非常重要的：在Linux世界里，一切皆文件。2、具体目录功能/bin (/usr/bin 、 /usr/local/bin)：是Binary的缩写, 这个目录存放着最经常使用的命令/sbin (/usr/sbin 、 /usr/local/sbin)：s就是Super User的意思，这里存放的是系统管理员使用的系

2020-10-05 16:19:18 1341

原创大数据之Hadoop（四）-Hadoop运行模式之伪分布式运行模式（启动HDFS和YARN并运行MapReduce程序、配置历史服务器和日志聚集）

启动HDFS并运行MapReduce程序1、配置集群1.1配置：hadoop-env.sh先从Linux系统中获取11JDK的安装路径修改hadoop-env.sh配置文件中JAVA_HOME路径：保存后退出1.2配置：core-site.xml[zhukun@hadoop101 hadoop]$ vim core-site.xml1.3配置：hdfs-site.xml[zhukun@hadoop101 hadoop]$ vim core-site.xml2、启动集群2.

2020-10-05 15:08:18 1942 1

原创大数据之Zookeeper（二）-Zookeeper安装（本地模式安装部署）

1、Zookeeper安装1.1将Zookeeper安装包通过Xftp工具导入到linux的/opt/software目录下Zookeeper压缩包资源：链接：https://pan.baidu.com/s/1MqbIX2BksbjzrrY5ScNfUw提取码：6a6r（因为之前学习Hadoop时已经安装了JDK所以不需要再安装JDK，如果没有先安装JDK）关于Xftp的安装和使用：远程登录Linux系统（Xshell5和Xftp5的使用）1.2将Zookeeper压缩包解压到/opt/m

2020-10-05 12:29:47 1240

原创大数据之ZooKeeper（一）-ZooKeeper入门

1、Zookeeper入门1.1概述Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应1.2Zookeeper的特点Zookeeper是由一个领导者（Leader）和多个跟随者（F

2020-10-05 11:46:56 1203

原创 Linux学习（一）-虚拟机VMware安装和CentOS系统安装

虚拟机VMware安装1、VMware12 pro 资源链接：https://pan.baidu.com/s/189YbYP4_6HrZbTZ_eD78ow提取码：d5es2、安装步骤文档链接：https://pan.baidu.com/s/184YUYKN9j23CH9Q4QWKmrw提取码：xuezCentOS系统安装1、CentOS6.8镜像资源链接：https://pan.baidu.com/s/1rE-Iu0NrOAoQbX2YmRwexg提取码：7bfx2、安装步骤文档链

2020-10-04 16:23:30 1372

原创大数据之Hadoop（三）-Hadoop运行模式之本地运行模式（实现官方Grep案例和WordCount案例）

Hadoop本地运行模式1、官方Grep案例创建在hadoop-2.7.2文件下面创建一个input文件夹[zhukun@hadoop101 hadoop-2.7.2]$ mkdir input将Hadoop的xml配置文件复制到input[zhukun@hadoop101 hadoop-2.7.2]$ cp etc/hadoop/*.xml input执行share目录下的MapReduce程序[zhukun@hadoop101 hadoop-2.7.2]$ bin/had

2020-10-04 16:11:38 1864

原创大数据之Hadoop（二）-Hadoop运行环境搭建（JDK安装和Hadoop安装及Hadoop目录结构分析--手把手教）

1、虚拟机环境准备1、准备一台虚拟机2、配置网络设置静态IP具体参考：Linux网络配置3、修改主机名vim /etc/sysconfig/network4、关闭防火墙#1:查看防火状态systemctl status firewalldservice iptables status#2:暂时关闭防火墙systemctl stop firewalldservice iptables stop#3:永久关闭防火墙systemctl disable firewalld

2020-10-04 15:32:50 2418

原创大数据之Hadoop（一）-Hadoop入门

1、Hadoop是什么Hadoop是一个由Apache基金会所开发的分布式系统基础架构主要解决，海量数据的存储和海量数据的分析计算问题广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈

2020-10-04 14:10:21 1510

原创 Linux学习（二）-Linux网络配置和vmtools安装

1、网络配置1.1网络配置的三种形式1.2查看网络IP和网关查看虚拟网络编辑器点击NAT设置查看网关1.3Linux网络环境配置第一种方法（自动获取IP）默认的是自动获取IP缺点：Linux启动后会自动获取IP，每次自动获取的IP地址可能不一样，不适合做服务器因为服务器的IP需要固定的第二种方法（指定静态固定IP）修改配置文件来指定IP，并可以连接到外网打开终端输入以下命令：vi /etc/sysconfig/network-scripts/ifcfg-eth0按照图

2020-10-02 16:18:35 1728

原创 Linux学习（三）-远程登录Linux系统（Xshell5和Xftp5的使用）

1、为什么要使用Linux远程登录？在公司实际项目开发中，Linux服务器是开发小组共享的，Linux服务器管理员有root权限，他为开发小组的每一位成员创建一个用户和密码，开发项目的程序员使用这个分配给自己的用户名和密码远程登录到Linux系统上进行项目管理或者开发，正式上线的项目是在公网上运行的，每一个用户在Linux系统中都有一个home文件夹在创建用户时就已经创建，当员工离职后root权限管理员把该员工对应的用户名注销但通常不删除用户名对应的文件夹。2、远程登录Linux-Xshell5Xs

2020-10-02 16:02:38 1734

软件设计师历年真题全汇总（2004上半年-2015上半年）（答案+解析）.rar

springboot基础脚手架.zip

ssm框架酒店管理系统.zip

Javaweb学生信息管理系统.zip

Javaweb学生宿舍管理系统.zip

空空如也