自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 文件权限,用户和组管理

文件权限,用户和组管理文件/目录的所有者:一般为文件的创建者,谁创建了该文件,就自然的成为该文件的所有者查看文件的所有者:ls -ahl(ll)修改文件所有者:chown 用户名 文件名文件/目录的所在组修改文件所在的组chgrp 组名 文件名改变用户所在组usermod –g 组名 用户名usermod –d 目录名 用户名 改变该用户登陆的初始目录chmod用于改变 linux 系统文件或目录的访问权限。用它控制文件或目录的访问权限。该命令有两种用法。

2021-01-24 12:10:56 187

原创 软件包的安装与管理

软件包的安装与管理rpm函数作用rpm -ivh xxx.rpmrpm包安装rpm -e [rpm软件包名1] [rpm软件包名2]…删除软件(如使用-e选项时是不能删除的,如果要删除,应使用–nodeps选项进行删除)rpm -q [査询选项1] [査询选项1] …<软件名|软件包名|文件名>rpm査询yumyum清空缓存列表命令作用yum clean packages清除缓存目录下的软件包,清空的是**(/var/ca

2021-01-24 10:01:46 220

原创 科学计算库NumPy

科学计算库NumPy科学计算库NumPy01 认识NumPy数组对象ndarray对象中定义了一些重要的属性02 创建NumPy数组创建NumPy数组03 ndarray对象的数据类型查看数据类型转换数据类型04 数组运算数组运算05 ndarray的索引和切片06 数组的转置和轴对称数组的转置和轴对称07 NumPy通用函数NumPy通用函数08 利用NumPy数组进行数据处理将条件逻辑转为数组运算09 线性代数模块线性代数模块10 随机数模块随机数

2021-01-13 20:53:45 740

原创 数据分析工具Pandas

数据分析工具Pandas数据分析工具Pandas01 Pandas的数据结构分析SeriesDataFrame02 Pandas索引操作及高级索引索引对象03 算术运算与数据对齐算术运算与数据对齐04 数据排序按索引排序按值排序05 统计计算与描述常用的统计计算06 层次化索引认识层次化索引07 读写数据操作读写文本文件读写数据库本章小结数据预处理01 数据清洗空值和缺失值的处理重复值的处理异常值的处理更改数据类型02 数据合并轴向堆叠数据主键合并数据根

2021-01-13 20:01:58 515

原创 hadoop伪分

hadoop伪分的搭建配置免密配置映射,并在最后一行添加“ip地址+主机名(或者是localhost)”vim /etc/hosts生成密钥ssh-keygenssh-copy-id 主机名(localhost)安装jdk,hadoop注意:/apps是文件的解目录,/data是文件的下载目录将下好的jdk,hadoop解压至/appstar -zxf jdk的包 -C /appstar -zxf hadoop的包 -C /apps切换至/apps下,并给文件重命名(方便后续的

2020-12-17 13:56:42 112

原创 Linux网络设置

网络配置网络接口配置文件DEVICE=name #name物理设备名IPADDR=addr #addr是IP地址HWADDR=addr #addr是物理地址NETMASK=mask #mask是网络掩码值NETWORK=addr #addr是网络地址BROADCAST=addr #addr是广播地址GATEWAY=addr #addr是网关地址ONBOOT=answer #answer是yes(引导时激活社备)或no(引导时不激活社备)USERCTL=answer #answer是yes

2020-10-17 21:05:10 204

原创 Java基础

文件读写字节流:每次IO操作时一个byteInputStream<-----FileInputStream:int read():一次读取一个字节 int read(byte[] b):一次把数据读取到b中,返回值为读取的长度OutputStream<-----FileOutputStream write(byte b) write(byte[] b)实体流:真正连接文件的对象文件的写入@Test public void outputFile() throw

2020-10-11 14:56:31 439 1

原创 Python(持续更新)

Python基础语法基本语法注释单行注释,以#开头#这是第一个注释print("Hello World") #这是第二个注释多行注释:""“注释的内容”"""""这是一个多行注释print("这是一个多行注释")"""行与缩进Python最具特色的就是用缩进表示代码块语句换行Python通常是一行写完一条语句,但如果语句很长,我们需要换行,这时可以使用圆括号来实现需要注意的是,在{},[]或()中的语句,不需要使用变量和数据类型变量超市购物现实生活中,大家去超市买

2020-09-22 19:53:21 530

原创 Hive

数据仓库-Hive1. 数据仓库1.1. 基本概念英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。数据仓库是存数据的,企业的各种数据往里面存,主要目的是为了分析有效数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表等。可以理解为:面向分析的存储系统。1.2. 主要特征数据仓库是面向主题的(Subject-Oriented )、集成的(In

2020-09-21 15:18:56 129

原创 hadoop-HA

hadoop平台搭建任务分配:master(第1台虚拟机)主机名运行进程master(第1台虚拟机)NameNode,DataNode,QuorumPeerMain,JournalNode,DFSZKFailoverController,ResourceManager,NodeManagerslave1(第2台虚拟机)NameNode,DataNode,QuorumPeerMain,JournalNode,DFSZKFailoverController,NodeManag

2020-09-17 14:15:05 343 1

原创 Scrapy(一)

葵花宝典Python基本语法迭代器(iterator)类和对象Scrapy的框架详解scrapy工作流程Scrapy的安装Scrapy框架的功能以下介绍下主要文件的作用创建Scrapy创建项目和爬虫xpath解析xpath快速复制(通往成功的另一条路)Python基本语法迭代器(iterator)迭代器相当于一个函数,每次调用都可以通过next()函数返回下一个值,如果迭代结束了,则抛出StopIteration异常。从遍历的角度看这和列表没什么区别,但它占用内存更少,因为不需要一下就生成整个列表。

2020-09-15 17:24:07 195

转载 数据可视化

数据可视化数据可视化数据可视化概述常见的图表类型Matplotlib—绘制图表通过figure()函数创建画布通过add_subplot()方法添加和选中子图添加各类标签多学一招:图表正确显示中文绘制常见图表多学一招:颜色、线型、标记的设置本地保存图形Seaborn—绘制统计图形可视化数据的分布用分类数据绘图交互式可视化库本章小结数据可视化数据可视化概述常见的图表类型图表是指在屏幕中显示的、可以直观地展示统计信息、对知识挖掘和信息生动感受起关键作用的图形结构。直方图,又称作质量分布图,它是由一系

2020-09-14 23:07:33 449

原创 在hadoop搭建中用到的部分linux代码

在hadoop搭建中用到的部分linux代码查linux的ip地址修改,査询主机名:用户root权限:vi/vim永久关闭防火墙重启网络服务:查linux的ip地址ifconfig修改,査询主机名:修改:hostnamectl set-hostname hadoop1査询:hostname用户root权限:vim /etc/sudoers用户名 ALL=(ALL) ALLvi/vim使用vi/vim命令后,是不可编辑的,输入i进入编辑模式,编辑过后按ESC进入末行模式

2020-07-11 13:58:11 820

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除