自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(88)
  • 收藏
  • 关注

转载 kafka知识点

参考:

2023-04-01 16:33:56 152

转载 kafka知识汇总

kafka

2023-03-22 18:01:24 167

原创 【无法访问org.springframework.web.bind.annotation.RequestMapping

参考 https://www.cnblogs.com/gulugulu123/p/17189411.html。java 和 springboot版本兼容问题,需要在pom.xml里边修改 springboot版本。

2023-03-20 14:00:57 275

转载 hive 中cast 用法

参考: https://www.jianshu.com/p/999176fa2730。cast( 字段 as 数据类型)

2023-03-09 17:51:21 309

转载 hive sql 用法之 lateral view

鉴于hive 表中某一个行json格式的数据,需要拆分成多行,即输入一行 输出多行,类似于 [1,2,3] 输出 三行每行上的数据分别是1,2,3 ,hive中的 explode 函数负责以上拆分功能, lateral view 负责将表格中原来的数据和拆分后的数据连接起来,详细用法请参考链接 https://www.cnblogs.com/rocky-AGE-24/p/7458094.html。

2023-03-06 12:43:49 257

原创 pandas round不同的列进行四舍五入

print(df.round(2))print(df.round({‘dogs’:2, ‘cats’:1}))备注 : df 是数据

2022-04-07 18:20:11 1407

原创 pandas 中将某一列带有小数的数值转换成百分数

data[‘f’] = data[‘b’].apply(lambda x: format((x+0.000001), ‘.2%’))备注:之所以不用round 是因为roud在涉及5 这个临界点的时候四舍五入时候跟正常四舍五入会有偏差所以用 0.000001 进行补救 ,补救的标准,假设 0.xxsv 是一个小数点有四位数的数值,如果是保留两位小数,那么将在第三位s上进行四舍五入 ,那么 需要在这个数值 0.xxsv 加上 s的后一位v 上加上1 即 0.xxsv + 0.0001 的和进行四舍

2022-04-07 17:43:12 3014

转载 eclipse 中导入一个已经存在Java项目

eclipse java项目的导入

2022-02-24 12:00:34 200

原创 非root用户在没有权限的情况下 在个人账号下安装软件,如scala

主要是两个方面1 更改bin目录,将root 用户中的bin目录更改为 个人普通账户下的bin目录2 更改环境变量:将需要安装的软件路径添加环境变量下1 具体操作mkdir + 路径 : 新增一个路径作为个人账户下的bin目录,例如我是直接home 目录下 执行mkdir bin命令则新增一个路径/home/xxx/bincd ~ 切换到home 目路后,执行 echo ‘export PATH=/home/xxx/bin’ >> ~/.bashrcsource ~./bashr

2021-11-18 13:46:58 421

转载 pandas 之dropna

dropna 很多新奇的用法参考: https://blog.csdn.net/weixin_40283816/article/details/84304055

2021-09-16 15:34:40 203

转载 K-means[np.argwhere/图片压缩/kmeans.cluster_centers_]

参考链接:https://blog.csdn.net/Dorisi_H_n_q/article/details/82794167

2020-12-24 16:14:35 154 2

原创 python - 图片和numpy数组之间的相互转化 及 各自的可视化

import PIL.Image as imageimport numpy as npa = image.open("./weixin.jpg")# 获取图像print("type (a): ", type(a)) # <class 'PIL.JpegImagePlugin.JpegImageFile'> #a.show()# 从图像转换为数组b = np.array(a)print("type(b): ", type(b)) # <class 'numpy.n

2020-12-23 11:38:09 2987 1

原创 Python安装skimage的方法 pip install scikit-image

Python安装skimage的方法 pip install scikit-image备注: 在pycharm 里边直接安装是不行的,需要在pycharm的 控制台 或者 本地的 cmd 的编译器里边,运行 pip install scikit-image安装完成了 只需要import skimage#这个函数是处理图像的#还有一个函数PIL也是处理图像的...

2020-12-21 16:25:30 49291

转载 Python的PIL库中的getpixel方法 putpixel方法

python 中的 PIL 库是用来处理图片的主要用到的是 PIL.Image 这个函数a = Image.new("L",(100, 177)) # 创建一个mode 为L ,像素是(100, 177)# 的图像b = Image.new("RGB",(100, 177)) # 创建一个mode是RGB,像素是#(100, 177)的图像a.getpixel((20,20)) # 获得 图像a 中 (20, 20)这个像素点的颜色值b.putpixel((20,20)) # 给 图像 b

2020-12-19 14:26:25 3360 2

转载 Python安装skimage的方法 pip install scikit-image

Python安装skimage的方法 pip install scikit-image参考链接:https://blog.csdn.net/weixin_44928646/article/details/105933359

2020-12-17 17:21:58 2365

转载 【pandas】DataFrame列重命名

老生常谈,怕忘记 所以又重新写一遍:给链接中的补充一点:df.rename({A:B}, axis=1, inpalce=Ture) # A:原来的列名,B: 现在的列名;axis=1 表示更改的是列名,axis=0 表示更改的是行名参考链接:https://blog.csdn.net/qq_36037953/article/details/107695880?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-2.contro

2020-12-17 15:24:48 687

转载 plt.show()和plt.imshow()的区别

plt.imshow(image) 的 类型可以是 list 数组 形式 也可以是 numpy.array 形式参考链接:https://blog.csdn.net/ab_1_2_3_4_5_6_7_8_9/article/details/89306797

2020-12-16 15:25:24 1556

转载 python np.random.random_integers 和 np.random.uniform

参考:https://www.jianshu.com/p/85ec63259c4ehttps://blog.csdn.net/weixin_42338058/article/details/83934187

2020-12-16 11:18:19 609

转载 python 使用sklearn进行对数据标准化,以及将数据还原

具体请看参考链接;特别注意的是np.std(df) np.mean(df) 是分别将整个数据求标准差,以及 求 平均值另外 np.std(df) 是求标准差不是方差sklearn.preprocessing.StandardScaler 该函数是使数据同等缩放,改变了数据的大小,但是数据表现出来的应有的数据趋势是没变的参考链接:https://blog.csdn.net/FrankieHello/article/details/79659111?utm_medium=distribute.p

2020-12-16 10:44:26 1695 1

转载 关于python 中np.newaxis的用法

特别说明:data = np.arange(100)data_new = data[:,np.newaxis] # 这列中括号中的冒号是选取 data这个数据中的数据,如果是直接【:,np.newaxis 】 就是选取全部数据做变换,如果是切片形式【:40, np.newaxis】这个是选取前40 行变形参考链接:https://blog.csdn.net/qq_31347869/article/details/89194410?utm_medium=distribute.pc_relevant_

2020-12-15 20:58:48 1799

转载 python matplotlib 中的gridspec 的用法

#使用import导入matplotlib.pyplot模块, 并简写成plt. 使用import导入matplotlib.gridspec, 并简写成gridspec.#用plt.figure()创建一个图像窗口, 使用gridspec.GridSpec将整个图像窗口分成3行3列.#plt.figure()import matplotlib.pyplot as pltimport matplotlib.gridspec as gridspecimport numpy as npplt.figu

2020-12-15 20:02:07 11293 3

原创 python sklearn 中数据处理 归一化函数 — MinMaxScaler()

MinMaxScaler()函数在sklearn包中MinMaxScaler()函数原型为:sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True)其中:feature_range:为元组类型,范围某认为:[0,1],也可以取其他范围值。copy:为拷贝属性,默认为True,表示对原数据组拷贝操作,这样变换后元数组不变,False表 示变换操作后,原数组也跟随变化,相当于c++中的引用或指针。copy = 1 的效果 同

2020-12-15 11:53:37 20732 1

转载 python 机器学习——数据预处理标准化StandardScaler模型

个人理解是为了使数据集中每列数据(也就是每个特征数据)都统一标准化。即:采用Z-Score规范化数据,保证每个特征维度的数据均值为0,方差为1注意: fit_transform 之前的数据集 train_X可以是二维的列表,也可以是pandas.DataFrame类型,fit_transform 之后的train_XX 数据类型是二维的umpy.ndarrayfrom sklearn.preprocessing import StandardScalerss = StandardScaler()

2020-12-11 15:27:24 3064

转载 python 字符串编码 ,区别 utf-8 和utf-8-sig

参考链接:https://blog.csdn.net/weixin_45105469/article/details/105117366?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control

2020-12-10 11:32:18 313

转载 python绘制双y轴坐标轴的图

之前有个网友给留言,怎么在y轴右侧设置坐标关键代码:ax2 = ax.twinx()具体如下:import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import rctime = np.linspace(1,16,16)ranksum1= [0.013113572066554608, 0.007277342460741646, 0.001865617255167422, 0.09793058424531026, 0

2020-12-09 10:59:43 2720

原创 python 关于列表中元素的排序顺序

工作中遇到一些情况,需要列表中的元素排序,列表中的元素中包含1 和 包含10 的元素,列表经过升序排列,居然先把10拍在前面,但是我本意是需要把 1 排在前面的,解决此类问题的方法是将 1 改成01 ,具体例子见下面a = ['a10_2','a2_2','a3_5','a1_2','a1_3','a3_4','a1_1','a2_1','a2_3','a3_2','a3_1','a10_1']b = ['a10_02','a02_02','a03_05','a01_02','a01_03','a03_

2020-12-07 16:00:41 1968

原创 python 相同值对应的地址也是相同的

起因来源于 在工作中保存不同的图片,但是保存的地址名称是相同的 ,就比如dir = "C://user//xxx//xx.jpg"多次循环保存的都是同一个地址,所以只有最后循环生成的图片保存成功,因为覆盖了之前的所有图片内容另: 如果变量的值 对应的内容相同,即便变量的名字不同,那么他们对应的id 内存地址是一样的例如 :a = 8b = 8id(a)out:1747812688id(b)out:1747812688...

2020-12-07 10:43:54 1918

转载 机器学习之决策树 Decision Tree scikit-learn算法库

1 sklearn特征抽取----01字典类型特征提取(DictVectorizer) 参考:https://blog.csdn.net/weixin_46165569/article/details/1068850752 数据预处理sklearn.preprocessing中,fit_transform()和transform()的区别 参考:https://blog.csdn.net/qbluesky/article/details/

2020-12-03 19:38:21 101

转载 np.random.randint()和random.randint()的用法和区别

详细用法见 参考链接,纠正一下参考链接里边的random.randint(2, 2) 这个是错误的 参数对应的是low 和 hight hight一定是整数,且一定要比 low 大所以random.randint(2, 2.5) 也是错误的参考链接:https://blog.csdn.net/weixin_41560402/article/details/105286649...

2020-12-03 16:07:24 284

转载 python 矩阵和数组的区别

矩阵是数组的一种特殊形式,即数组包含矩阵,所以尽可能用数组数组可以是多维矩阵只能是二维更多却别详细见:https://blog.csdn.net/qq_42067550/article/details/105216683?utm_medium=distribute.pc_relevant.none-task-blog-baidulandingword-3&spm=1001.2101.3001.4242https://blog.csdn.net/qq_26645205/article/det

2020-12-03 14:49:09 322

转载 python决策树模型可视化报错解决方案:graphviz.backend.ExecutableNotFound: failed to execute [‘dot‘, ‘-Tpng‘, ‘-O‘, ‘

谨记: 安装完 + 设置完系统环境变量,记得重启编辑器,才能正常运行!另:如果安装文件下载不成功,可以站内私信我提供!安装参考链接:https://blog.csdn.net/zhaoluwei/article/details/109296082

2020-12-03 10:44:16 280

转载 pandas to_dict函数的用法介绍

参考链接:https://blog.csdn.net/a1272899331/article/details/93522840

2020-12-02 21:34:53 118

原创 pandas.DataFrame.describe

pandas.Da他Frame.describe 的参数有 percentiles , include ,excludepercentiles 是自定义百分位的 ,数值是从0-1 之间,默认的是[0.25,0.50, 0.75] 可以自定义,但是结果会默认自带0.5 ,例如import pandas as pda = pd.DatafFrame({"a":[1,2,3,4,5,6,7],"b":["b1","b2","b3","b4","b5","b6","b7"]})a.describe(pe

2020-12-01 20:58:17 637

原创 python 决策树 可视化

对于 CART 回归树的可视化,可以先在电脑上安装 graphviz;然后 pip install graphviz,这是安装python的库,需要依赖前面安装的 graphviz。可视化代码如下:from sklearn.tree import export_graphvizimport graphviz# 参数是回归树模型名称,不输出文件。dot_data = export_graphviz(dtr, out_file=None)graph = graphviz.Source(dot_da

2020-12-01 11:45:06 217

转载 总结】python sklearn模型中random_state参数的意义

这是在决策树CART模型时,遇到的,random_state 是为了固定随机状态的,主要用在随机数据集,数据集的随机划分,设置决策树模型参数,设置随机森林模型参数。random_state 取值大小可以是任意一个整数,在调参缓解,只要保证其值一致即可。参考链接:https://blog.csdn.net/xiaohutong1991/article/details/107923970...

2020-12-01 10:26:04 1412

转载 python log函数

impoort numpy as npfrom math import eimport math# 以自然数e为底的对数a = np.log([1,np.e,np.e**2]) # [0,1,2] # 类型是 np.array# 以 10 为底的对数 b = np.log10([1,10,1000]) #[0,1,3] # 类型是 np.arrayc = np.log10(10000) # 4 # 类型是np.float64# 以 2 为底的对数

2020-11-27 18:12:30 240

原创 pycharm debug使用

涉及到复杂算法的时候,不容易看出他的每一步运行过程,这时候debug 是个好方法下面是 pycharm 的debug 步骤,自己忘记的时候可以拿来看看参考链接:https://blog.csdn.net/qq_33472146/article/details/90606359...

2020-11-26 12:15:07 94

原创 剑指offer:51 数组中的你序列

在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数。示例 1:输入: [7,5,6,4]#输出: 5使用归并排序的思想:分治,归并排序,每次将数组分成两部分,分到不能再分的时候计算逆序对数,然后返回排序好的数组,比较容易看懂。个人理解:这题主要是讲一组数组 从中间分为左右两个部分,再将这两个部分分别从中间分为两个部分,依此类推,每个部分分到不能再分为止;再将分到最小单位,即只有两个元素比对大小,返回值为升序排序后的序列,即

2020-11-26 11:24:45 52

转载 递归_python 实现

主要是刷51 剑指offer 里边的有两次递归,有点绕(之后会将51题解奉上)突然记不清递归了,所以今天复习了下链接:https://www.cnblogs.com/alex3714/articles/8955091.html另:大佬博客推荐:https://blog.csdn.net/a2011480169/article/details/73273993?locationNum=3&fps=1...

2020-11-24 16:58:02 61

原创 python 面向对象 疑难点之一

coding时遇到一个一种现象,也许是我之前没有见过吧,贴上下面的一个完整的代码class Solution: def a(self, m): def b(m): # b(m) 和 a(self, m) 这两个括号中的m 是不一样的 print("------ start -----") print(m) print("------ end -----") return m #

2020-11-24 10:37:39 83

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除