7 醉糊涂仙

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 2k+

yum命令安装rpm包之后保留rpm包

yum 默认情况下,升级或者安装后,会删除下载的rpm包。我们也可以如下设置升级后不删除下载的rpm包vim/etc/yum.conf将 keepcache=0 修改为 keepcache=1

2020-05-24 18:16:31

pyspark单词计数

一、shell模式# 输入数据data = ["hello", "world", "hello", "world"]# 将collection的data转为spark中的rdd并进行操作rdd = sc.parallelize(data)res_rdd = rdd.map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)# 将rdd转为collection并打印res_rdd_coll = res_rdd.collect()f

2020-05-15 01:21:21

spark单词计数

一、spark-shell模式注:单词文件上传至hdfs,参考博文:https://blog.csdn.net/u010916338/article/details/81102346?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158946937419724835823007%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&req

2020-05-15 00:28:15

TypeError: namedtuple() missing 3 required keyword-only arguments: verbose, rename, and module

spark不支持python3.6(1)卸载anaconda,参考博文:https://blog.csdn.net/u010916338/article/details/106108146(2)带有python3.5的安装包下载地址:链接:https://pan.baidu.com/s/17jkomEQhoc3EzdCH18SfKw提取码:1t9a(3)anaconda安装步骤,参考博文:https://blog.csdn.net/u010916338/article/details/106101

2020-05-13 22:22:11

Linux卸载anaconda

一、找到安装Anaconda的目录,删除其文件夹sudo rm -rf path/anaconda3二、修改配置文件(1)vim ~/.bashrc(2)删除语句,或者注释语句export PATH=path/anaconda3/bin:PATH(3)vim/etc/profile(4)删除exportPATH=path/anaconda3/bin:PATH(3)vim /etc/profile(4)删除export PATH=path/anaconda3/bin:PATH(3)vim/etc

2020-05-13 22:17:34

Linux安装anaconda

一、下载anaconda3.5.2历史版本地址:https://repo.continuum.io/archive/百度网盘地址:链接:https://pan.baidu.com/s/1QWb6uhsTx6QZtwEdEUk8_g提取码:x4fc二、安装anaconda3.5.2(1)赋予Anaconda3-5.2.0-Linux-x86_64可执行权限chmod u+x Anaconda3-5.2.0-Linux-x86_64.sh(2)./Anaconda3-5.2.0-Linux-x

2020-05-13 17:05:16

【seaborn】(十)sns.facetgrid

一、sns.facetgrid

2020-05-11 22:17:02

【seaborn】(九)sns.factorplot

一、sns.factorplot

2020-05-11 22:11:38

【seaborn】(八)条形图

一、sns.barplot()1.1 加载数据1.2 x, y, data:x轴数据,y轴数据,dataframe数据1.3 hue:指定列名,按照列名类别,标记不同颜色

2020-05-11 21:52:59

【seaborn】(七)盒图

一、sns.boxplot()IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点1.1 x, y, data:x轴数据,y轴数据,dataframe数据1.2 hue:指定列名,按照列名类别,标记不同颜色二、sns.violinplot()2.1 x, y, data:x轴数据,y轴数据,dataframe数据2.2 hue:指定列名,按照列名类别,标记不同颜色2.3 split:hu

2020-05-11 21:42:57

【seaborn】(六)回归分析

文章目录一、sns.regplot()1.1 加载数据1.2 x, y, data:x轴数据,y轴数据,dataframe数据1.3 x_jtter 同一个位置上的点沿着x轴散开1.4 color颜色1.5 maker点类型一、sns.regplot()1.1 加载数据1.2 x, y, data:x轴数据,y轴数据,dataframe数据1.3 x_jtter 同一个位置上的点沿着x轴散开1.4 color颜色1.5 maker点类型...

2020-05-11 21:09:10

hive表和kudu表删除指定数据

1,hive表删除数据1.1 分区表1.1.1 删除具体partitionalter table table_name drop partition(partiton_name='xxx'))1.1.2删除具体partition的部分数据 INSERT OVERWRITE TABLE table_name PARTITION(year='2018') SELECT * FROM table_name WHERE year='2018' AND month>6;.

2020-05-11 12:18:47

【seaborn】(五)联合分布图

一、单变量分析单变量分析就是直方图参考博文:https://blog.csdn.net/u010916338/article/details/106036759二、多变量分析图2.1 散点图参考博文:https://blog.csdn.net/u010916338/article/details/1060189032.2 sns.jointplot()双变量分析图,直方图加散点图seaborn.jointplot(x, y, data=None, kind=’scatter’, stat_fu

2020-05-10 17:38:09

【seaborn】(四)直方图

一、sns.distplot()seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)1.1 x变量1.2 kde是否显示密度函数线条-

2020-05-10 16:21:34

【seaborn】(一)基本设置

文章目录一、主题风格1.1 sns.set()默认主题风格1.2 5种主题风格1.2.1 darkgrid黑色背景有网格线1.2.2 whitegrid白色背景有网格线1.2.3 dark黑色背景无网格线1.2.4 dark黑色背景无网格线1.2.5 ticks带有刻度线2.2、子图设置不同风格二、sns.despine图边框设置2.1 默认情况2.2 offset设置图形与轴距离2.3 left设置左边框是否显示2.4 bottom设置下边框是否显示2.5 top设置上边框是否显示2.6 right

2020-05-10 15:17:29

【seaborn】(三)散点图

一、sns.scatterplot()seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=No

2020-05-09 16:58:40

【seaborn】(二)折线图

文章目录一、sns.plot()1.1 加载数据1.2 data1.3 x, y1.4 hue 基于某列的类别将y分成多条线,并分配不同线条颜色1.5 style基于某列的类别将y分成多条线,并分配不同线条颜色1.6 size 基于某列的类别将y分成多条线,并分配不同线条粗细程度1.7 markers 关键点是否做标记1.8 dashes 分组是否破折号显示一、sns.plot()seabor...

2020-05-08 13:54:18

【Matplotlib】(十一)3D图

文章目录一、3种方式拿到3D图像轴域1.1 fig.gca获取轴域句柄1.2 fig.add_subplot创建子图1.3 Axes3D对象构建二、折线图一、3种方式拿到3D图像轴域1.1 fig.gca获取轴域句柄import matplotlib.pyplot as pltplt.fig = plt.figure()ax = fig.gca(projection='3d')1....

2020-04-30 15:25:22

【word】标题绑定列表

文章目录一、标题二、列表三、字体分别在序号和标题中设置一、标题一般情况下,都会去点标题一,标题二但是怎么才能让它带上序号呢?二、列表默认的标题并没有序号自己定义一个列表(当然你也可以选库里自带的列表)三、字体分别在序号和标题中设置...

2020-04-27 17:36:59

df.plot

一、介绍使用DataFrame的plot方法绘制图像会按照数据的每一列绘制一条曲线,默认按照列columns的名称在适当的位置展示图例,比matplotlib绘制节省时间,且DataFrame格式的数据更规范,方便向量化及计算。二、df.plot()DataFrame.plot(x=None, y=None, kind=‘line’, ax=None, subplots=False,sha...

2020-04-24 16:09:55

查看更多

勋章 我的勋章
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。