自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (9)
  • 收藏
  • 关注

转载 VSCode中LeetCode插件测试报错[ERROR] http error [code=301]

vscode报错301解决方案

2022-12-30 11:57:20 504 1

原创 【python数据分析】数据建模之Kmeans聚类

K-means聚类:最常用的机器学习聚类算法,且为典型的基于距离的聚类算法。 K均值:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度 Kmeans聚类案例分析:make_blobs聚类数据生成器# 导入模块fromsklearn.clusterimportKMeansfrom sklearn.datasets import make_blobs# 创建数据x,y_true=make_blobs(n_samples=300,...

2022-05-06 15:39:06 1072

原创 【python数据分析】数据建模之 PCA主成分分析

PCA主成分分析:最广泛无监督算法 + 基础的降维算法。 通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 → 高维数据的降维 PCA主成分分析:二维数据降维 / 多维数据降维 /主成分筛选二维数据降维# 加载主成分分析模块PCAfrom sklearn.decomposition import PCA# 数据创建rng = np.random.RandomState(8)data = np.dot(rng.rand(2,2),

2022-05-06 15:31:29 3141

原创 【python数据分析】数据建模之KNN分类

最近邻分类:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。KNN分类案例分析:电影分类from sklearn import neighbors # 导入KNN分类模块data = pd.DataFrame({'name':['北京遇上西雅图','喜欢你','疯狂动物城','战狼2','力王','敢死队'], 'fight':[3,2,1,101,99,98],

2022-05-06 13:50:31 604

原创 【python数据分析】:数据建模之线性回归

线性回归通常是人们在学习预测模型时首选的技术之一。在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的。线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。线性回归:简单线性回归 / 多元线性回归 /模型评估简单线性回归(一元线性回归)# 导入线性回归模块from sklearn.linear_model import LinearRegression# np.random.Rando

2022-05-06 13:37:41 1076

原创 【python数据分析】:数据预处理之连续数据离散化

连续属性变换成分类属性,即连续数据离散化。在数值的取值范围内设定若干个离散划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表每个子区间中的数据值。连续数据离散化:等宽法 / 等频法等宽法 :cut方法→ 将数据均匀划分成n等份,每份的间距相等举例:有一组人员年龄数据,希望将这些数据划分为“18到25”,“26到35”,“36到60”,“60以上”几个面元。ages=[20,22,25,27,21,23,37,31,61,45,41,.

2022-05-04 16:22:35 2839

原创 【python数据分析】:数据预处理之数据标准化

数据预处理之数据标准化

2022-05-04 15:07:46 2000

原创 【python数据分析】:数据预处理之异常值分析

本文主要是介绍如何找到异常值并将其可视化【异常值分析】

2022-05-04 15:04:22 1761

原创 【python数据分析】:数据预处理之缺失值填充实例

数据预处理之缺失值填充

2022-05-04 15:00:26 2478

原创 【python数据分析】:数据预处理之缺失值处理

数据处理之缺失值处理

2022-05-04 13:14:22 711

原创 用python制作上海疫情评论词云图-自定义形状

用Python制作词云图

2022-05-04 13:05:52 2155

原创 用python制作魔都头像生成器

用Python中的turtle作图

2022-05-04 09:50:30 310

原创 【python解决问题】分块读取:解决超大文件读取Memory error的问题

# memery errorf = open(path)data = pd.read_csv(path, sep=',',engine = 'python',iterator=True)loop = TruechunkSize = 1000chunks = []index=0while loop: try: print(index) chunk = data.get_chunk(chunkSize) chunks.append(chun.

2021-05-20 10:25:53 284

原创 【python自动化办公】获取当前周周一日期

import datetimeimport pandas as pddef get_current_week_monday(): monday, sunday = datetime.date.today(), datetime.date.today() one_day = datetime.timedelta(days=1) # 返回当前的星期一的日期 while monday.weekday() != 0: monday -= one_day .

2021-05-19 13:37:17 199

原创 【python办公自动化】批量合并excel文件

import pandas as pddf=pd.DataFrame()i=1for file in os.listdir(): dfi=pd.read_excel(file,header=0) df=pd.concat([df,dfi]) print('第%s个文件合并完成!'%i) i+=1

2021-05-18 17:24:07 61

原创 【python问题解决】seaborn中文显示问题,以及负号显示问题

plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体设置-黑体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题sns.set(font='SimHei',font_scale=1.5) # 解决Seaborn中文显示问题并调整字体大小...

2021-05-18 10:03:08 1179

原创 【零基础入门python】python环境搭建:anaconda+jupyter+vscode

【零基础入门python】python环境搭建:anaconda+jupyter+vscodepython学习第一步:搭建环境现在市面上有很多版本,工程派特喜欢pycharm。斑点鱼平时还会使用R和sql,所以没有选用pycharm,而是偏好vscode。环境配置:win10+anaconda3+python3.7+jupyter notebook+vscode1. anaconda...

2020-04-05 22:15:39 968

文本生成模板-RNN-Tensorflow

可用于文本生成,如诗词,歌词生成等 RNN模型 Tensorflow

2022-05-04

用户画像资料收集58份

用户画像资料收集58份

2022-05-04

电商运营数据模板300+

电商运营数据模板300+

2022-05-04

练手1个G的中国统计年鉴数据

练手1个G的中国统计年鉴数据

2022-05-04

matplotlib中文乱码解决办法

matplotlib中文乱码解决办法

2022-05-04

算法导论 学习笔记.pdf

算法导论 学习笔记

2022-05-04

pyecharts数据和代码

pyecharts数据和代码,可直接套用上手

2021-05-18

个人所得税的计算.xlsx

个人所得税的计算公式,输入工资,五险一金就可以立即计算出个人所得税的年度汇算,是多退还是少补。 非常便捷

2020-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除