自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

转载 three-sum问题总结

three-sum问题总结本文主要描述了6中解题策略和相应的耗费鸡蛋和试验次数。问题概述:有n个鸡蛋和k层楼,且存在一个楼层T,在这个楼层或高于这个楼层时鸡蛋会摔碎,低于这个楼层时鸡蛋完好。在1楼鸡蛋也有可能摔碎,在第k层楼鸡蛋也有可能完好。目标:找到这个楼层T。

2020-08-08 22:34:06 296

转载 java正则表达式中appendReplacement和appendTail方法

java正则表达式中appendReplacement和appendTail方法

2020-08-03 16:32:35 833

转载 正则表达式种的‘\b‘和‘\w‘

正则表达式中有很多需要记忆的符号,在本文记录一下其中的'\b'和'\w'的用法。

2020-08-03 16:03:20 1640

转载 Java中print,println和printf的区别

JAVA中print,println和printf的区别

2020-08-03 10:21:39 304

转载 System.out中“.out”的理解

System.out中“.out”的理解

2020-08-03 10:04:15 1319

转载 java String字符串赋值和常量池原理

https://www.cnblogs.com/fangfuhai/p/5500065.html

2020-08-03 09:52:01 246

转载 Java中Calendar.getInstance()的理解

Calendar抽象类实例化的理解

2020-08-03 09:45:10 7788

转载 java序列化与反序列化学习记录

java的序列化与反序列化基本概念概述:Java平台允许我们在内存中创建可复用的Java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在,即,这些对象的生命周期不会比JVM的生命周期更长。但在现实应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。Java对象序列化就能够帮助我们实现该功能。使用Java对象序列化,在保存对象时,会把其状态保存为一组字节,在未来,再将这些字节组装成对象。必须注意地是,对象序列化保存的是对象的"状态",即它的

2020-08-01 22:39:42 88

转载 Java非访问修饰符

本文介绍了Java的非访问修饰符~

2020-08-01 22:29:54 280

转载 Java访问控制修饰符之protected

Java访问控制修饰符之protectedprotected可见性说明基类的 protected 成员是包内可见的,并且对子类可见;若子类与基类不在同一包中,那么在子类中,子类实例可以访问其从基类继承而来的protected方法,而不能访问基类实例的protected方法。针对protected修饰符的这两个特点,下面进行举例说明。注1:例中用到的clone()函数是java.lang包中Object类内的函数,其访问控制修饰符为protected,当创建一个类时,默认继承java.lang.

2020-08-01 11:37:52 321

转载 Java中的数据类型概念理解

本文针对Java中的数据类型,主要包括以下几个内容:1. 内置数据类型和其对应的包装类之间的关系理解,相互转化。2. 引用类型的介绍3. Java常量的介绍4. Java的数据类型转换及异常现象解释

2020-07-31 18:42:40 355

转载 Java中的特殊类——内部类、匿名类

本文主要记录了Java中的两种特殊类——内部类和匿名类的使用。

2020-07-31 15:07:41 206

转载 Java的变量类型及其初始化与赋值

本文主要介绍了Java类变量和实例变量的初始化方法以及常见注意点。其中重点介绍了实例变量初始化的三种方法,分别是:1)通过构造函数进行初始化;2)系统赋初始化值;3)通过对象代码块进行初始化。其中,在通过构造函数进行初始化时,注意this的使用及不使用this会出现的情况及原因。

2020-07-31 11:01:34 2089

转载 以Java,C,Python为例浅谈编译型语言和解释型语言的区别

高级程序语言运行过程——以Java,C,Python为例高级程序语言的分类Java的运行C语言的运行Python的运行高级程序语言的分类高级程序语言可分为解释型语言和编译型语言。计算机是不能够识别高级语言的,所以当我们运行一个高级语言程序的时候,就需要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分成两类,第一种是编译,第二种是解释。编译型语言:编译型语言在程序执行之前,先会通过编译器对程序执行一个编译的过程,把程序转变成机器语言。运行时不需要再翻译,而直接执行就可

2020-07-30 17:59:16 1159

转载 理解环境变量(以Windows操作系统给为例)

环境变量环境变量、用户变量和系统变量的关系环境变量的理解Java中的环境变量为什么需要配置Java中的环境变量Java中需要配置的环境变量JAVA_HOMEJRE_HOMEPathCLASSPATHJava的IDEThe interest of Computer Science partly lies in the stability of every command.环境变量、用户变量和系统变量的关系环境变量只是一个总称,代表了系统变量和用户变量。系统变量就是系统级别的变量,用户需要使用系统变量

2020-07-30 14:36:27 575

转载 Java开发工具基本概念

Java开发工具基本概念JDK、JRE、JVMJDKJava Development Kit,是Java的标准开发工具包,供程序开发者必须编译、调试程序。它提供了编译、运行Java程序所需的各种工具和资源,包括Java编译器、Java运行环境JRE,以及常用的Java基础类库等,是整个JAVA的核心。在jdk安装目录中,bin目录下存放了各种开发工具的可执行文件,例如javac.exe;lib文件存放的是JDK工具命令的实际执行程序JREJava runtime environme

2020-07-30 10:56:56 259

原创 回归算法(正规方程线性回归,梯度下降线性回归,岭回归)

回归算法线性回归线性回归的定义线性回归误差的度量线性回归减小误差的方法方法一:正规方程方法二:梯度下降正规方程和梯度下降的对比回归性能评估过拟合和欠拟合过拟合欠拟合解决方法岭回归岭回归的概念岭回归的代码实现线性回归线性回归的定义线性回归通过一个或多个自变量与因变量之间的关系进行建模与回归分析,其特点为一个或多个回归系数的参数的线性组合。根据自变量的个数不同分为一元线性回归和多元线性回归。其具体表示公式如下:线性回归误差的度量损失函数,又称最小二乘法,其具体表示公式如下:线性回归减小误差的方法

2020-07-24 14:49:45 929

原创 分类算法之决策树、随机森林

分类算法之决策树、随机森林决策树决策树的相关概念决策树的代码实现决策树的优缺点评价随机森林随机森林的相关概念随机森林的代码实现随机森林的优点决策树决策树的相关概念信息熵:信息熵表示了信息的不确定性,其具体公式如下,当没有任何其他信息,即所有事件发生概率相等时,信息熵最大。信息增益:信息增益是决策树的划分依据之一,其定义为:特征A对训练数据集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定条件下D的信息条件熵H(D|A)之差。信息增益表示得知特征X的信息而使得类Y的信息的不确定性

2020-07-23 21:09:11 593

原创 k近邻算法,朴素贝叶斯算法,分类模型评估,模型调优

k近邻算法,朴素贝叶斯算法,分类模型评估,模型调优k近邻算法k近邻算法概述k近邻算法代码实现k近邻算法的评价朴素贝叶斯算法朴素贝叶斯算法概述朴素贝叶斯代码实现朴素贝叶斯的评价分类模型的评估分类模型评估概述分类模型评估代码实现模型的调优相关概念交叉验证网格搜索模型调优代码实现k近邻算法k近邻算法概述k近邻算法的定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。距离计算公式两个样本的距离可以通过如下公式计算,又叫欧式距离若点a,

2020-07-22 16:31:32 434

原创 机器学习特征选择、开发流程、数据集划分、转换器与估计器

机器学习特征选择、开发流程、数据集划分、转换器与估计器机器学习特征工程特征选择(降维)特征选择的原因特征选择的定义特征选择的三大方法过滤式:VarianceThresholdPCA(主成分分析)PCA目的PCA定义PCA代码实现机器学习的开发流程机器学习整体开发流程机器学习模型工作流程机器学习算法分类机器学习数据集划分数据集划分代码实现转换器与估计器转换器估计器估计器工作流程机器学习特征工程特征选择(降维)特征选择的原因冗余:部分特征的相关度高,容易消耗计算性能噪声:部分特征对预测结果有负影响

2020-07-21 15:45:05 559

原创 机器学习概述、数据特征抽取、数据特征处理

机器学习概述、数据特征抽取、数据特征处理机器学习概述机器学习的定义机器学习的应用场景机器学习常用库数据的特征工程数据集数据的结构组成特征工程的定义特征工程的意义数据的特征抽取字典的特征抽取文本特征抽取英文文本中文文本TF-IDF数据的特征处理特征处理的概念数据处理的方法归一化标准化缺失值机器学习概述机器学习的定义机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测机器学习的应用场景自然语言处理计算机视觉智能驾驶系统推荐…机器学习常用库scikit-learn:

2020-07-20 11:11:28 1620

原创 MapReduce实际案例、MapReduce参数、yarn集群

MapReduce实际案例、MapReduce参数、yarn集群MapReduce实际案例GroupingComparator求取top1MapReduce补充概念多job串联mapreduce参数优化资源相关参数容错相关参数效率和稳定性相关参数yarn集群yarn介绍yarn主要组件组件介绍组件作用yarn的架构yarn调度器FIFO Schedulercapacity schedulerFair SchedulerMapReduce实际案例GroupingComparator求取top1需求求

2020-06-15 11:36:19 280

原创 MapReduce实操案例

MapReduce实操案例共同好友求取MapReduce倒排索引自定义InputFormat自定义OutputFormat共同好友求取要求求出哪些人两两之间有共同好友,及他俩的共同好友都有谁?解题思路第一步map读一行 A:B,C,D,F,E,O输出 <B,A><C,A><D,A><F,A><E,A><O,A>在读一行 B:A,C,E,K输出 <A,B><C,B><E

2020-06-14 18:45:11 492

原创 MapReduce实际案例,MapTask运行机制,ReduceTask运行机制,MapReduce执行流程,hadoop数据压缩,Join算法的实现

MapReduce实际案例,MapTask运行机制,ReduceTask运行机制,MapReduce执行流程,hadoop数据压缩,Join算法的实现MapReduce实际案例上行流量倒序排序手机号码分区MapTask运行机制运行流程基础配置ReduceTask 工作机制运行流程MapReduce执行流程hadoop数据压缩Join算法的实现reduce端join算法实现map端join算法实现原理阐述实现示例MapReduce实际案例上行流量倒序排序第一步:定义FlowBean实现Writable

2020-06-13 14:25:00 217

原创 MapReduce程序运行模式,MapReduce分区,MapReduce排序,MapReduce计数器,MapReduce规约,手机上网流量求和案例

MapReduce程序运行模式,MapReduce分区,MapReduce排序,MapReduce计数器,MapReduce规约,手机上网流量求和案例MapReduce分区本地运行模式集群运行模式MapReduce分区默认1个reduce分区的情况手动设置多个分区MapReduce排序MapReduce中序列化MapReduce实现排序案例MapReduce计数器系统计数器自己定义计数器方式一:方式二MapReduce规约手机上网流量求和案例MapReduce分区本地运行模式(1)mapreduce程

2020-06-12 11:50:33 207

原创 hdfs的javaAPI,hdfs的小文件合并,MapReduce

hdfs的javaAPI,hdfs的小文件合并,MapReducehdfs的javaAPI创建创建maven工程并导入jar包使用url的方式访问数据使用文件系统方式访问数据获取FileSystem的几种方式遍历文件系统当中的所有文件下载文件到本地hdfs上创建文件夹hdfs文件上传HDFS权限问题以及伪造用户hdfs的小文件合并MapReduceMapReduce思想MapReduce设计构思MapReduce框架结构MapReduce示例编写编写步骤WordCount示例编写hdfs的javaAPI

2020-06-11 20:09:40 1986

原创 分布式文件系统设计,hdfs的副本机制,hdfs的block块,hdfs的元数据信息,hdfs的文件上传,hdfs的文件读取,分布式文件系统的JavaAPI操作

分布式文件系统设计,hdfs的副本机制,hdfs的block块,hdfs的元数据信息,hdfs的文件上传,hdfs的文件读取,分布式文件系统的JavaAPI操作分布式文件系统的设计分布式文件系统介绍HDFS分布式文件系统设计目标HDFS的来源HDFS的架构图之基础架构![在这里插入图片描述](https://img-blog.csdnimg.cn/20200531091036634.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shad

2020-05-31 09:41:08 659

原创 hdfs的使用和hadoop的测试

HDFS的使用和Hadoop的测试HDFSHDFS 介绍HDFS特性master/slave 架构分块存储名字空间(NameSpace)Namenode 元数据管理Datanode 数据存储副本机制一次写入,多次读出hdfs命令hdfs基本命令hdfs的高级命令hdfs文件限额配置数量限额空间大小限额查看hdfs文件限额数量hdfs的安全模式hadoop的基准测试测试写入速度测试读取速度清除测试数据HDFSHDFS 介绍HDFS 是 Hadoop Distribute File System 的简称,

2020-05-29 09:18:02 526

原创 apache版本伪分布式环境搭建,apache版本完全分布式环境搭建,cdh版本伪分布式环境搭建

apache版本伪分布式环境搭建,apache版本完全分布式环境搭建,cdh版本伪分布式环境搭建apache版本伪分布式环境搭建服务规划搭建步骤apache版本完全分布式环境搭建集群运行服务器规划搭建步骤hdfs状态查看cdh版本伪分布式环境搭建CDH版本hadoop重新编译为什么要编译hadoop编译环境的准备准备linux环境虚拟机联网,关闭防火墙,关闭selinux安装jdk1.7安装maven安装findbugs在线安装一些依赖包安装protobuf安装snappy下载cdh源码准备编译常见编译错误

2020-05-28 05:51:10 122

原创 Hadoop发展历史和Hadoop环境搭建

Hadoop发展历史和环境搭建Hadoop发展历史Hadoop的起源于发展Hadoop历史版本介绍hadoop三大公司发型版本介绍hadoop的架构模型1.x的版本架构模型介绍2.x的版本架构模型介绍Hadoop环境搭建第一步:下载apache hadoop并上传到服务器第二步:修改配置文件修改core-site.xml修改hdfs-site.xml修改hadoop-env.sh修改mapred-site.xml修改yarn-site.xml修改slaves第三步:启动集群Hadoop发展历史Hadoo

2020-05-24 09:23:47 301

原创 ZK的环境搭建、ZK的节点、ZK的java编程,网络编程

ZK的环境搭建、ZK的节点、ZK的java编程,网络编程ZK的环境搭建ZK的节点zookeeper的shell操作创建节点读取节点更新节点删除节点deletermrzookeeper的数据模型数据结构节点类型节点创建节点属性zookeeper的watch机制watch机制特点ZK的java编程zookeeper的javaAPI创建maven java工程,导入jar包节点的操作创建永久节点创建临时节点修改节点数据节点数据查询节点watch机制网络编程概述网络通信三要素IP地址端口号传输协议网络模型Sock

2020-05-23 08:24:27 589

原创 Linux的shell编程、环境搭建、Zookeeper介绍

Linux的shell编程、环境搭建、Zookeeper介绍Shell编程Shell文件的基本格式Shell变量语法格式变量使用变量类型局部变量环境变量shell 变量参数传递特殊字符Shell运算符流程控制if else 语句for循环while语法case语句函数使用函数参数Linux环境搭建三台虚拟机关闭防火墙三台机器关闭selinux三台机器更改主机名三台机器做主机名与IP地址的映射三台机器重启三台机器机器免密码登录三台机器生成公钥与私钥拷贝公钥到同一台机器复制第一台机器的认证到其他机器三台机器

2020-05-22 08:36:18 119

原创 hadoop网络连接和linux基础命令

hadoop配置和linux基础命令Hadoop配置Hadoop网络地址的确认修改mac地址配置文件修改网络配置检查是否能够正常联网linux基础命令查找命令grep 命令find命令locate命令whereis命令which命令用户与用户组su与sudosu:切换用户sudo:借用权限linux的权限问题linux的系统服务网络管理更改ip地址与mac地址域名的映射网络端口的监听crontab定时器的配置配置方法Hadoop配置Hadoop网络地址的确认windows系统查看所有的服务命令 se

2020-05-17 22:23:47 707

原创 pandas电影数据分析

电影数据分析初始操作数据读取数据集成用透视表对电影进行数据分析选取评分高或低的电影不同性别对电影平均评分的差异pandas分组运算分析不同年龄段的评分规律改良操作总结初始操作数据读取输入import numpy as npimport pandas as pdfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt%matplotlib inline# 数据读取labels = ['UserId','Ge

2020-05-16 20:53:47 1803 1

原创 pandas美国人口分析实例

美国人口分析读取csv文件中的数据使用merge进行数据融合当需要级联的属性名相同时当需要级联的属性名不同时删除一列数据:drop查看空数据,并根据不同情况进行相应处理数据清洗当空数据比例高时,对空数据进行赋值操作当空数据比例低,且难以赋值时,对数据进行删除操作级联之后的分析操作查看是否包含空数据,进行数据清洗对人口密度进行计算、级联用类似sql的功能进行数据查找读取csv文件中的数据要从csv类型文件中读取数据到pandas中,可以使用read_csv命令输入import numpy as n

2020-05-16 07:31:43 940

原创 数据可视化之注释、文本标注、Tex公式、颜色填充、绘制图像,设置样式、极坐标,综合练习

数据可视化之注释、文本标注、Tex公式、颜色填充、绘制图像,设置样式、极坐标,综合练习注释文字标注Tex公式颜色填充图像与x轴间颜色填充两条曲线之间的区域颜色填充自动精确填充绘制填充图形图形样式极坐标综合练习绘制函数积分图绘制条形图注释import matplotlib.pyplot as pltimport numpy as npx = np.arange(-10,11,1)y = x*xplt.plot(x,y)#第一项表示文字内容,第二项表示箭头尾部坐标(箭头部分),第三项表示文字起

2020-05-09 20:01:20 794

原创 数据可视化之numpy,统计图,plt交互式可视化,面向对象可视化,创建子图,创建多图,绘制网格,绘制图例,调整坐标轴范围,调整坐标轴刻度,添加新坐标轴

数据可视化之numpy,统计图,plt交互式可视化,面向对象可视化,创建子图,创建多图,绘制网格,绘制图例,调整坐标轴范围,调整坐标轴刻度,添加新坐标轴numpynumpy中调用函数的两种方法统计图散点图折线图条形图直方图条形图和直方图的区别双变量直方图饼状图箱型图颜色和样式颜色点线样式字符串三种可视化方法pyplotpylab面向对象的方式推荐使用方法matplotlib面向对象matplotl...

2020-05-08 08:44:04 428

原创 Pandas索引,Pandas分组计算,聚合函数,数据IO,时间序列,重采样,数据可视化

Pandas索引,Pandas分组计算,聚合函数,数据IO,时间序列,重采样,数据可视化Pandas索引Series索引DataFrame索引多级索引Series多级索引DataFrame多级索引多级索引的统计列数据和索引数据的转换Pandas分组计算通过列表进行分组按行进行分组按列进行分组通过字典进行分组通过函数进行分组通过多级索引进行分组对列索引进行分组对行索引进行分组聚合函数内置聚合函数自定...

2020-05-06 21:06:05 345

原创 numpy、pandas操作

numpy、pandas操作pandas介绍numpy介绍及使用numpy简介numpy使用Pandas操作Pandas数据结构Series结构:列表,会自动创建索引Series的创建Series特性验证DataFrame:二维数组DataFrame的创建DataFrame的插入操作DataFrame的删除操作DataFrame的数据查找DataFrame的其他属性DataFrame的数据选择修改...

2020-04-17 22:47:38 199

原创 numpy基础用法

import numpy as nparray = np.array([[1,2,3],[2,3,4])print(array)print('number of dim:'array.ndim)print(‘shape:’, array.shape)print(‘size:’, array.size)输出结果:[[1,2,3],[2,3,4]]number of dim: 2...

2020-03-23 14:30:42 192

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除