自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 Python数据分析整理

Python数据分析整理成都找了份实习工作,之前本来是打算先熟悉下SPSS的使用,但是公司要分析的基本是百万左右的数据,于是边学习边整理下资料吧。所有代码基本都来自网上,我都会注明学习整理的出处,可能由于一些库版本的原因会进行稍加修改,所有代码都是在我的版本下可以跑通的,有不了解的地方可以在下方留言。Python 3.7.6sklearn 0.0pandas 1.0.5matplotlib

2020-09-19 18:42:09 323

原创 Linux操作整理

Linux操作整理主要对自己常用的Linux操作进行整理,免得自己忘了Linux操作目录Linux操作整理基本操作vim修改文件cat查看文件应用操作查看并管理运行的程序运行python文件基本操作vim修改文件cat查看文件应用操作查看并管理运行的程序运行python文件...

2020-09-12 21:26:35 101

原创 SPSS学习整理

SPSS基本操作# 学习目标:学习内容:学习时间:学习资料均来自工信出版集团——《SPSS 22.0 统计分析从入门到精通》,大四找工作学的新东西太多太杂,尝试发下博客整理下自己学到的东西,方便日后查看。学习内容:目录1、2、3、4、学习时间:整理后更新:1、2、3、...

2020-09-12 17:26:49 2087 1

原创 SPSS实现简单对应分析

总目录:SPSS学习整理SPSS实现简单对应分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的通过分析由定性变量构成的交互汇总表来揭示变量间的联系。适用情景列联表两个分类变量变量不存在0,负数变量应为n*p的矩阵形式数据处理只用到了红框中的数据SPSS操作分析——降维——对应分析SPSS输出结果分析汇总表第一维惯量0.114,第二维惯量0.009,第一维惯量占到了0.928,第二维惯量占比0.072。数量为占比,其他是每个类对各个维度的

2021-02-06 23:53:24 2439 1

原创 阿里云ubuntu利用flask搭建网站问题记录

总目录:Linux操作整理阿里云ubuntu利用flask搭建网站问题记录总思路Virtualenv安装和使用Virtualenv报错及解决方案最后一个运行的坑搭建成功# flask测试代码from flask import Flaskapp = Flask(__name__)@app.route('/')def index(): return 'hello sayasora!'if __name__ == '__main__': app.run(debug=Fa

2020-11-08 23:02:07 261 1

原创 Python&SPSS完成空气质量状况的指数(AQI)分析

记一次课程作业,利用所给数据,以AQI指数(空气质量状况指数)为因变量,其他指标为解释变量,建立线性回归分析模型,并形成分析报告。Python&SPSS完成AQI指数分析题目要求原始数据数据处理数据总览“最高”&“最低”变量处理“风向”变量处理“星期”变量处理“天气”变量处理数据分析多重共线性新建“温差”变量回归建模数据导入SPSS线性回归操作SPSS结果分析模型概要模型比较排除的变量共线性诊断异常个案诊断模型回归系数残差检验模型的不足第二次数据处理“星期”变量处理第二次建模SPSS分析

2020-10-15 18:14:04 6407 10

原创 SPSS实现系统聚类

总目录:SPSS学习整理SPSS实现系统聚类目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的能对个案或变量聚类,并计算可解范围适用情景只适合较小的数据文件数据处理SPSS操作分析——分类——系统聚类SPSS输出结果分析第二行表示第2阶段将15,16聚合成了一类,其中15是首次聚合,没有出现过,16在第一次分类中出现了(所以首次出现阶段标记1),也就是说16,17,14都是一类了,在第十三阶段才会有新的类加入他们。一共17次后将所有个案分成一个大类。上图

2020-10-11 00:55:36 8509 4

原创 SPSS实现快速聚类(K-Means/K-均值聚类)

总目录:SPSS学习整理SPSS实现快速聚类(K-Means/K-均值聚类)目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的利用K均值聚类对数据快速分类适用情景数据处理SPSS操作分析——分类——K-均值聚类最大迭代次数根据数据量,分类数量,电脑情况自己调整,能选多点就把上限调高点。SPSS输出结果分析在数据集最右两列保存了该个案的分类结果与到聚类中心的距离。由于没有自定义初始中心,系统设定了三个。迭代9次后中心值不变。最终个三个聚类中心以及他们

2020-10-08 23:26:38 29871 5

原创 SPSS实现曲线回归

总目录:SPSS学习整理SPSS实现曲线回归目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的用曲线估计的方法建立一个简单的模型(一个自变量)适用情景数据处理SPSS操作分析——回归——曲线估计SPSS输出结果分析共设置了6种模型排除了12个个案(无教育支出)六个模型的R²为:线性0.901,对数0.698,二次0.983,三次0.987,复合0.971,增长0.971。R²最大的为三次曲线,0.987方程为y= 264.52 - 0.144

2020-10-08 20:41:33 8318 3

原创 SPSS实现线性回归

总目录:SPSS学习整理SPSS实现线性回归目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的输出不同个案之间的距离,用户自己判断相似或不相似程度。适用情景拟合为数学模型一元线性回归:Yi=A0 + A1* Xi + Bi多元线性回归:Yi=A0 + A1* Xi1 + A2* Xi2 + ···+ An* Xin + Bi其中Bi服从均值为0,方差为定值的正态分布,且相互独立。数据处理SPSS操作分析——相关——距离SPSS输出结果分析知识点...

2020-10-08 17:01:54 3237 1

原创 SPSS实现距离分析

总目录:SPSS学习整理SPSS实现距离分析目的适用情景数据处理数据1数据2SPSS操作操作1操作2SPSS输出结果分析结果1结果2知识点目的输出不同个案之间的距离,用户自己判断相似或不相似程度。适用情景数据处理数据1Tablueau作图直观感受,12相似,34相似,5和其他不太相似。数据2想了想应该这个图比较符合分析的目的,比较这三组数据的相似性。不过也可以发现从图上不太能直观感受到谁和谁更相似,需要数据支持。SPSS操作分析——相关——距离操作1把非相似性设

2020-10-05 02:15:01 10796

原创 SPSS实现两变量偏相关分析

总目录:SPSS学习整理SPSS实现两变量偏相关分析目的适用情景数据处理SPSS操作操作1操作2SPSS输出结果分析结果1结果2综合结果知识点目的之前直接研究两个变量的相关关系,现在多了一个影响因素,为了排开这个因素对两个变量之间相关关系的影响。如控制C,研究A和B的相关关系。适用情景Pearson检验:正态分布数据Spearman,Kendall等级相关系数:有序数据或非正态数据。数据处理燃料效率*价格燃料效率*马力马力*价格SPSS操作分析——相关——偏相关性操作1

2020-10-05 00:54:23 12769 1

原创 SPSS实现两变量相关分析

总目录:SPSS学习整理SPSS实现两变量相关分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的相关系数已经放在了目录里面,https://blog.csdn.net/weixin_44255182/article/details/108552332和题目一样,就是实现两变量相关分析。适用情景Pearson检验:正态分布数据Spearman,Kendall等级相关系数:有序数据或非正态数据。数据处理为了自我熟悉下Tablueau的操作,之后数据展示这个地方都放上Tab

2020-10-05 00:19:37 4886 1

原创 SPSS实现重复测量方差分析

总目录:SPSS学习整理SPSS实现重复测量方差分析目的适用情景数据处理SPSS操作知识点目的观察一个指标是否因为多次测量而变化,或是否受时间影响。适用情景方差分析前提:各个总体服从正态分布各个总体方差相等观测值独立数据处理SPSS操作基本信息显示第二个方案平均值都比第一个方案高。P=0.675>0.05接受原假设,认为协方差矩阵没有差异。三次销售量误差方差没有显著差异。月份的四种检验P值均小于0.05拒绝原假设,认为月份之间对销量存在显著差异,而月份*销量显

2020-10-03 23:38:53 7680 1

原创 SPSS实现多元方差分析

总目录:SPSS学习整理SPSS实现多元方差分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的观察影响因素如何影响一组因变量适用情景方差分析前提:各个总体服从正态分布各个总体方差相等观测值独立数据处理SPSS操作分析——一般线性模型——多变量(这个多变量是针对的多个因变量,不是多个自变量的意思)SPSS输出结果分析首先检查方差是否相等,苗高,地径P值分别为0.344,0.166,均大于0.05,接受原假设,认为方差相等。海拔与施肥量四种检验结果P值

2020-10-02 23:55:53 10021 4

原创 SPSS实现协方差分析

总目录:SPSS学习整理SPSS实现协方差分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的观察协变量对因变量的影响效应适用情景方差分析前提:各个总体服从正态分布各个总体方差相等观测值独立数据处理SPSS操作分析——一般线性模型——单变量SPSS输出结果分析基本信息P=0.237>0.05接受原假设,认为方差相等修正模型P=0.017<0.05,拒绝原假设,认为培训前成绩与培训后成绩存在线性关系(原假设为不存在线性关系);职称和公司

2020-10-02 22:45:59 5823 1

原创 SPSS实现多因素方差分析

总目录:SPSS学习整理SPSS实现多因素方差分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验多个因素对因变量的作用和影响,以及因素共同作用的影响。(因素之间独立影响变量,因素之间交互作用影响变量)适用情景方差分析前提:各个总体服从正态分布各个总体方差相等观测值独立数据处理SPSS操作分析——一般线性模型——单变量SPSS输出结果分析基本信息显著性为0.371>0.05,接受原假设,认为方差相等。肥料显著性为0,拒绝原假设,认为肥料对

2020-10-01 21:01:49 29325 3

原创 SPSS实现单因素方差分析

总目录:SPSS学习整理SPSS实现单因素方差分析目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验单因素水平下的一个或多个独立因变量均值是否存在显著性差异,即检验单因素各个水平的均值是否来自同一个总体。(因变量为连续变量)适用情景方差分析前提:各个总体服从正态分布各个总体方差相等观测值独立数据处理SPSS操作SPSS输出结果分析基本信息基于平均值显著性为0.729,大于0.05,认为各组总体方差相等F=8.744,显著性为0.007,小于0.

2020-10-01 16:34:08 4058

原创 SPSS实现多个配对样本非参数检验

总目录:SPSS学习整理SPSS实现多个配对样本非参数检验目的适用情景数据处理数据1数据2数据3SPSS操作操作1操作2操作3SPSS输出结果分析结果1结果2结果3知识点目的检验多个配对样本之间是否具有相同分布适用情景这次好像比较复杂,SPSS有三种检验方式第一种检验适用于重复测量同一样本的数据。第二种可以判断评分者评分标准是否一致,W系数(范围0~1)越接近1,评分标准越一致。第三种是第一种检验数据为二分变量的特例。数据处理数据1适用于第一种检验数据2适用于第二种检验

2020-10-01 14:43:15 8770

原创 SPSS实现两配对样本非参数检验

总目录:SPSS学习整理SPSS实现两配对样本非参数检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验两个相关样本之间是否具有相同分布。适用情景数据处理SPSS操作SPSS输出结果分析20组全为正秩,培训后成绩均大于培训前,显著性为0,即两组配对样本存在显著差异(成绩显著提高)符号检验结果相同。知识点...

2020-10-01 00:11:14 4709

原创 SPSS实现多个独立的样本非参数检验

总目录:SPSS学习整理SPSS实现多个独立的样本非参数检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验多个独立样本的分布是否相同适用情景数据处理SPSS操作SPSS输出结果分析p=0<0.05认为三组数据存在显著差异。中位数检验也认为三组数据存在显著差异。三种检验方式均认为三组数据的分布存在显著差异。知识点...

2020-09-30 23:52:22 9377

原创 SPSS实现两独立样本非参数检验

总目录:SPSS学习整理SPSS实现两独立样本非参数检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点秩目的检验两个样本的分布是否相同适用情景数据处理SPSS操作这里勾选想检验的分布,体重数据勾选正态分布SPSS输出结果分析基本信息p=0.684>0.05接受原假设,认为两组数据不存在显著差异。第一个显著性为1,修正后显著性为0.089,均大于0.05,认为不存在显著差异。P=0.988>0.05,接受原假设,认为两组数据不存在显著差异。P

2020-09-30 00:09:27 8776

原创 SPSS实现单样本K-S检验

总目录:SPSS学习整理SPSS实现单样本K-S检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验单样本是否符合正态分布/泊松分布/均匀分布/指数分布适用情景数据处理SPSS操作这里勾选想检验的分布,体重数据勾选正态分布SPSS输出结果分析P=0.185,大于0.05,接受原假设,即体重分布符合正态分布。这张图是描述统计的正态性检验结果,也是符合正态分布。结果也是0.185.试了试检验了以下均匀分布和泊松分布,应该是样本量太少的原因,都没有拒绝。知识

2020-09-29 23:49:13 4207 1

原创 SPSS实现游程检验

总目录:SPSS学习整理SPSS实现游程检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点游程目的通过游程检验数据的随机性(原假设为数据具有随机性)适用情景数据处理硬币正反面SPSS操作SPSS输出结果分析基本信息显著性大于0.05,接受原假设,认为数据是随机的。知识点游程0001111100010010100上面数据可分为000 11111 000 1 00 1 0 1 00即连续相邻的数在一起为一个游程上面有5个0游程,4个1游程...

2020-09-29 23:35:05 3704

原创 SPSS实现二项分布检验

总目录:SPSS学习整理SPSS实现二项分布检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的检验数据是否符合指定的二项分布适用情景数据处理SPSS操作比例输入你想检验的分布,比如你想检验数据分布是否符合3:1,你就输入0.75SPSS输出结果分析基本信息最后看到,实际的合格率只有0.93。但P值为0.13,接受原假设,即数据符合0.95的二项分布,产品合格率达到了95%。知识点...

2020-09-29 23:23:13 4827

原创 SPSS实现卡方检验

总目录:SPSS学习整理SPSS卡方检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的统计样本的实际观测值与理论推断值之间的偏离程度(如完全相等,卡方为0)适用情景数据处理SPSS操作SPSS输出结果分析基本信息残差也就是期望值和实际值的差值最主要的分析结果,卡方为0.571。显著性为0.989,大于0.05,接受原假设,认为样本分布于期望没有差异,即筛子是均匀分布的。知识点...

2020-09-29 23:11:54 2871

原创 SPSS实现单样本t检验

总目录:SPSS学习整理SPSS单样本t检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的判断样本均值和指定检验值之间差异是否显著适用情景数据处理SPSS操作SPSS输出结果分析基本信息p值小于0.05,说明样本均值不等于50.知识点...

2020-09-27 00:09:06 1085

原创 SPSS配对样本t检验

总目录:SPSS学习整理单样本t检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的判断样本均值和指定检验值之间差异是否显著适用情景数据处理SPSS操作SPSS输出结果分析p=0.001双尾检验结果小于0.05,拒绝原假设,认为年龄平均值不等于50.知识点...

2020-09-26 23:50:49 12144

原创 SPSS两独立样本t检验

总目录:SPSS学习整理平均值检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的判断两个样本的均值是否相等适用情景数据处理SPSS操作SPSS输出结果分析没啥说的p=0.001<0.05认为平均值不等于50知识点...

2020-09-26 22:54:55 5610 1

原创 SPSS平均值检验

总目录:SPSS学习整理平均值检验目的适用情景数据处理SPSS操作SPSS输出结果分析知识点目的判断两个样本的均值是否相等适用情景数据处理SPSS操作SPSS输出结果分析这没啥说的显著性大于0.05即平均值没有显著性差异相关性测量只有0.001,也就是说储蓄金额和性别关系并不大。知识点...

2020-09-26 22:45:24 5108

原创 python实现非标准正态分布下概率密度有关计算

总目录:Python数据分析整理之后马上要学习朴素贝叶斯算法了,为之后的学习做好铺垫,重新用python实现了一下数据正态性的检验。根据数据的均值方差,求出小于某个值的概率,或者根据概率求出这个值是多少。python实现非正态分布概率密度有关计算原理代码实现实例数据集代码分析原理参考文章正态分布下的累积概率代码实现normal_eval.py(我自己命名的,后面会导入)from scipy import stats# 前提!!!!!数据服从正态分布# 求小于x的概率,即x左侧

2020-09-24 23:38:00 3269

原创 python实现决策树的保存和调用

总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树的保存和调用决策树的保存和调用决策树的保存和调用前面讲到将训练的决策树绘制成简单易懂的图片,trees.py下的代码def classify(inputTree, featLabels, testVec): print(featLabels) firstStr = list(inputTree.keys())[0] secondDict = inputTree[firstS

2020-09-23 22:07:20 2627

原创 利用python实现决策树图片绘制

总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树绘制treePlotter测试与使用treePlotter东西太多了,懒得看咋实现的了,直接把书上的代码搬过来,修改了几个可能版本问题引起的bug,加了句保存图片的代码,直接拿来用了。treePlotter.py'''Created on Oct 14, 2010@author: Peter Harrington'''import matplotlib.pyplot as pltde

2020-09-23 16:36:58 2213 1

原创 python实现决策树分类(ID3)

总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战决策树分类导入包数据集信息熵计算信息熵分类数据找出使信息熵最少的分类方法导入包import pandas as pdimport numpy as np# trees为自己编写的py文件,放在同一目录,之后有写import treesfrom math import logimport operator数据集No. no surfacing flippers fish1 L1 R1 yes

2020-09-23 15:32:23 962

原创 利用python操作word文档

总目录:Python数据分析整理本文代码参考自官方文档:python-docx使用的库下载方式为:pip install python-docx注意!! 不是:pip install docx(为保护公司隐私,已将数据更改为非敏感数据)python操作word文档数据集操作文档最终结果数据集序号 告警名称 告警类别 告警规则1 8ad880857454c47b017472d7d2c926b2+55_1 低危告警 【高空坠物】铁锤从高空坠落 物业找到责任人2 8ad880857454

2020-09-22 00:17:04 280

原创 利用python实现K近邻算法

总目录:Python数据分析整理本文数据以及大部分代码来自《机器学习实战》机器学习实战K近邻算法(改进约会网站配对效果)数据集KNN.py数据分析K近邻分类数据集https://www.manning.com/downloads/1108\machinelearninginaction\Ch02\datingTestSet.txt\machinelearninginaction\Ch02\datingTestSet2.txtKNN.pyfrom numpy import *impo

2020-09-20 23:32:49 2171

原创 Python实现多元线性回归

总目录:Python数据分析整理本文基本是对文章的整理,修改了一些我这个版本跑不通的地方,多加了一个模型保存部分而已。整理后用于之后使用。原作者大佬文章地址:Python实现多元线性回归Python多元线性回归数据集数据分布数据分析数据拆分数据建模模型保存模型调用数据集TV radio newspaper sales230.1 37.8 69.2 22.144.5 39.3 45.1 10.417.2 45.9 69.3 9.3151.5 41.3 58.5 18.5180.8 1

2020-09-20 01:02:46 11868 2

原创 Python实现一元线性回归

总目录:Python数据分析整理本文基本是对文章的整理,修改了一些我这个版本跑不通的地方,多加了一个模型保存部分而已。整理后用于之后使用。原作者大佬文章地址:Python实现多元线性回归Python一元线性回归数据分析数据拆分数据建模模型保存模型调用数据分析import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pandas import DataFrame, Seriesfrom sklear

2020-09-19 19:02:03 8873 1

原创 Linux下使用tail查看日志文件

总目录:Linux操作整理Linux下使用tail查看日志文件使用tail查看日志文件使用tail查看日志文件在Linux运行python文件中使用xshell在后台运行了bilibili.py并且实时保存日志my_out.log。现在使用tail命令对日志进行查看。(base) root@sayasora-linux:/home/test_python# tail my_out.logINFO:root:22:28:16 bilibili 169INFO:root:22:28:

2020-09-12 22:36:08 977

原创 在Linux运行python文件

总目录:Linux操作整理Linux运行python文件运行python文件运行python文件(base) root@sayasora-linux:/home/test_python# nohup python -u bilibili.py > bilibili22.log 2>&1 &[1] 19464首先找到py文件的位置,由于我已经移动到了bilibili.py所在的目录,上述代码会在后台运行当前目录的bilibili.py程序。程序的输出不会显示在命

2020-09-12 22:05:28 909

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除