自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Linux学习笔记

Linux学习笔记一、命令的基本语法格式命令名称 [选项] [目录或者文件]例如:查看当前目录下的所有文件 ls -a二、常用命令**命令格式:**命令 [-选项] [参数]如:ls -la /usr大部分命令遵从该格式多个选项时,可以一起写 eg:ls –l –a 可以写成: ls –la简化选项与完整选项(注:并非所有选项都可使用完整选项)1、帮助命令1.manman [命令或者配置文件] (功能描述:获得帮助信息)显示说明:信息功能

2020-11-04 11:29:32 168

原创 大数据之HIVE的安装

大数据之HIVE的安装安装分两个阶段:1、安装mysql服务2、安装数据仓库工具HIVE一、安装mysql服务1、在node03节点上安装mysql服务在root用户 下安装,root用户权限大方便我们的mysql的安装在CentOS7中默认安装有MariaDB,这个是MySQL的分支,但为了需要,还是要在系统中安装MySQL,而且安装完成之后可以直接覆盖掉MariaDB。2.下载并安装官方的mysql的yum源使用root用户在node03服的/kkb/soft路径下执行以下命令cd

2020-07-22 11:25:59 244

原创 大数据之数据仓库

大数据之数据仓库数据仓库1、数据仓库的基本概念数据仓库(Data Warehouse,可简写为DW或DWH)是用来构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它处于分析报告和决策支持目的而创建的。数据仓库本身并不"生产"数据,同时也不"消费"任何数据,数据来源于外部供给外部使用,这也是为什么叫数据仓库,而不是工厂的原因。2、数据仓库的四大特征2.1、面向主题的数据仓库是一般从用户实际需求出发,将不同平台的数据源按设定主题进行划分整合,与传统的面向事务的

2020-07-22 10:55:13 878

原创 数据分析之pandas(一)

数据分析之pandas(一)简介pandas 是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。数据结构Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、b

2020-07-03 18:39:50 322 1

原创 python数据分析之Numpy(三)

python数据分析之Numpy(三)一、数组的拼接1、竖向拼接vstack()import numpy as npimport matplotlib.pyplot as pltarr1 = np.arange(1,10).reshape(3,3)arr2 = np.arange(10,19).reshape(3,3)print(arr1)#[[1 2 3] [4 5 6] [7 8 9]]print(arr2)#[[10 11 12] [13 14 15] [16 17 18]]a

2020-07-02 19:47:46 467

原创 python数据分析之Numpy(二)

python数据分析之Numpy(二)一、Numpy读取文件loadtxt()方法numpy.loadtxt(fname, dtype=, comments=’#’, delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)参数作用fname被读取的文件名(文件的相对地址或者绝对地址)dtype指定读取后数据的数据类型comments跳过文件中指定开头的行(

2020-06-30 00:39:58 360

原创 python数据分析之numpy(一)

python数据分析之Numpy(一)一、什么是Numpy?​ NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库 [1] 。二、创建数组了解了numpy的概念我们就来感受一下一下它的强大吧!Numpy三种创建数组的方法1、

2020-06-25 00:37:03 372

原创 数据结构——链表

数据结构——链表一、概念​ 链表(Linked list)是一种常见的基础数据结构,是一种线性列表,但是并不会按线性的顺序存储数据,而是在每一个节点里存到下一个节点的指针(Pointer)。链表通常由一连串节点组成,每个节点包含两种域,即信息域和指针域,信息域可以存储任意的实例数据(data fields)指针域包含一或两个用来指向上一个或下一个节点的位置的链接(“links”)。二、链表的优点和缺点优点1、由于链表不必须按顺序存储,链表在插入的时候可以达到O(1)的复杂度,比另一种线性表顺序表

2020-05-22 22:42:17 611

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除