小徐老师_xiho-CSDN博客

原创 VAR模型(三)FDI和湖南省GDP对就业人数的影响实证分析

本文探讨FDI、湖南省GDP对就业人数的影响，取2000年-2019年20年年度数据。

2024-04-13 21:14:43 427

原创基于R语言某地区谷物产量与降雨量实证分析

本文利用对某地区过去38年谷物产量进行时间序列分析，得到较好的模型，并对其此后五年进行预测分析。再对谷物产量和降雨量进行二元时间序列分析，探究其长期发展关系。

2024-04-13 21:13:02 1008

原创 [闲聊统计]之参数估计是什么？(下)

我们在前面说了一下参数估计中的点估计，接下来，我们来讲一下区间估计。区间估计——在点估计的基础上，给出总体参数估计的一个估计区间，该区间由如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值，5%的区间不包含总体参数的真值，那么，用该方法构造的区间称为置信水平为95%的置信区间。也就是说，我现在有100个总体，现在随机抽取20个作为样本，那么这样的样本就会有很多个。

2024-04-10 21:02:59 334

原创 [闲聊统计]之参数估计是什么？(上)

参数估计是推断统计的重要内容之一。它是在抽样及抽样分布的基础上，根据样本统计量来推断所关心的总体参数。

2024-04-10 21:02:13 569

原创基于R语言的选举数据的模型建立与预测分析

本文利用选举数据，通过K-近邻、支持向量机、人工神经网络等三类分类算法，利用R语言统计软件，实现选举数据的模型建立与预测分析。并对三个模型的预测结果进行对比分析，从而选择最优分类策略，进而为选举提供有效、有力的数据支持。

2024-04-09 09:34:54 602

原创基于R语言的影视评分影响因素实证分析(二)

在某网站抓取了百条数据，试图通过对这些数据的分析，找出电影受欢迎的因素。本案例共获取100条数据。

2024-04-09 09:33:46 535

电影票房电影自从1895年在法国巴黎公开售票放映以来，至今已有百余年的历史。电影以其独特的艺术魅力和无与伦比的视听效果，深深地吸引了亿万观众。在各种文化娱乐、艺术样式中，电影是最受人民群众欢迎的。近年来，我国的电影市场总的趋势是疲软的，虽然靠进口大片与国产大片、新片赢得一时的热闹景象，但这只是虚假的繁荣。那什么样的电影才深受人们喜爱？是喜剧片、惊悚片、谍战片、家庭伦理片，亦或其他？在某网站抓取了千条数据，试图通过对这些数据的分析，找出电影受欢迎的因素。本案例共获取1810条数据。

2024-04-09 09:33:05 796

原创 VAR模型(二)结婚率的影响因素分析

本文研究分析了普通本专科毕业人数、城乡居民人民币储蓄存款年底余额对结婚率的影响。以计量经济学中VAR模型为主要分析模型，建立了结婚率的多元回归模型。分析了普通本专科毕业人数、城乡居民人民币储蓄存款年底余额和结婚率现状。并且对未来结婚率进行了预测。

2024-04-08 18:17:03 905

原创面板数据回归模型(二)房价的影响因素分析

利率的系数为0.03095，说明利率对房价有正向影响，但其系数检验P值大于0.1，说明结果不显著，即利率对房价无显著正向影响。货币供应量的系数为-0.4538，说明货币供应量对房价有负向影响，其系数检验P值小于0.1，说明结果显著，即货币供应量对房价有显著负向影响。选取2002-2018年的数据，共17组数据，由于数据的自然对数变换不改变原有的协整关系，并能使其趋势线性化，消除时间序列中存在的异方差现象，所以对所有数据取其自然对数值，以增强数据线性化趋势消除异方差，同时便于考察各变量对房价的敏感性。

2024-04-08 18:15:41 1110

原创 ARIMA模型之AQI预测

具有如下结构的模型称之为求和自回归移动平均模型：简记为ARIMApdqARIMApdq模型，式中∇d1−Bd;ΦB1−ϕ1B−⋯−ϕpBp为平稳可逆模型ARMApqARMA(p,q)ARMApq的自回归系数多项式；

2024-04-04 21:49:51 959

原创 [闲聊统计]之假设检验是什么？(上)

统计学主要分为描述性统计和推断性统计。描述性统计是通过总结和展示数据来描述数据的特征和规律。它主要使用平均值、中位数、标准差等指标来描述数据的分布和趋势。而推断性统计则是通过对样本数据进行分析和推断来对总体进行推断。它主要使用假设检验、置信区间等方法来对总体参数进行估计和推断。假设检验是统计学中常用的一种方法，用于验证关于总体参数的假设。在实际应用中，假设检验被广泛应用于医学研究、市场调查、质量控制等领域。通过假设检验，我们可以对研究对象进行科学的验证和分析，从而提高决策的准确性和可靠性。

2024-04-04 21:48:20 1052

原创 [闲聊统计]之相关性分析是什么？

相关性是一个重要的概念，用来描述两个或多个事物之间的关联程度。在许多领域，相关性被用来帮助人们理解数据之间的关系，以便做出更好的决策。相关性不仅可以帮助我们发现事物之间的联系，还可以帮助我们预测未来的趋势和结果。因此，了解和分析相关性是非常重要的。通过深入研究相关性，我们可以更好地理解世界，做出更明智的选择。小编在这里只讨论两个变量之间的相关性。我们在课本里面讲过的相关性分析就是一个皮尔逊相关系数，当然这是计算两个数值变量之间的相关性分析。

2024-04-04 21:46:01 386

原创 [闲聊统计]之数据预处理是什么？

数据预处理是数据分析中一个至关重要的步骤。在进行数据分析之前，通常需要对原始数据进行清洗、转换和整理，以便更好地应用各种分析技术和算法。数据预处理的目的是去除数据中的噪声、填补缺失值、处理异常值，并将数据转换为适合分析的格式。数据预处理包括数据清洗、数据转换、数据集成和数据规约等步骤。数据清洗是指识别和纠正数据中的错误、缺失值和异常值。数据转换涉及将数据转换为适合分析的形式，如标准化、归一化、离散化等。数据集成是将多个数据源合并为一个统一的数据集，以便更好地进行分析。

2024-04-04 21:45:30 697

原创 [闲聊统计]之数据类型有哪些？

统计数据类型的选择取决于研究的目的和所需的分析方法。在进行统计分析时，必须确保选择合适的数据类型，以确保分析的准确性和可靠性。通过对不同类型的数据进行正确的分类和处理，可以更好地理解数据的含义和趋势，从而为决策和预测提供有力的支持。在做数据分析和模型之前，首先就得搞清楚数据的类型。下面小编聊一聊数据的类型。

2024-04-04 21:44:40 903

原创 pdf中图片爬取并与excel中姓名对应,压缩保存

爬取pdf中图片，并按照身份证号与excel中姓名匹配，并压缩存放。# coding=gbkimport osimport osimport zipfileimport osfrom PIL import Imageimport numpy as nppath = r'E:\excel' #存放姓名的excel所在文件夹位置count = 1for file in os.listdir(path): new_file = file.replace(".xlsx", ".zip"

2021-05-09 14:14:42 349 1

原创牛客网华为算法练习题-Python编写

#HJ1 计算字符串最后一个单词的长度，单词以空格隔开。"""word = input("请输入单词，并以空格间断:")new_word = word.split(' ')print(len(new_word[-1]))"""#HJ2 写出一个程序，接受一个由字母和数字组成的字符串，和一个字符，然后输出输入字符串中含有该字符的个数。不区分大小写。"""str_word = "asdfwereqqwdc"check_word = 'e'sum_num = 0for i in str_w

2021-05-09 14:06:18 551

原创 python爬取简历

import zipfileimport refrom win32com import client as wc #导入模块import osimport pymysql#将doc转化为docx.因docx为压缩包，自带html文件def doc_to_docx(file): word = wc.Dispatch("Word.Application") # 打开word应用程序 doc = word.Documents.Open(file) #打开word文件 doc

2021-05-09 14:03:01 865

原创基于VAR模型出国留学人数增加的影响因素分析

一、理论模型本文选择向量自回归模型，简称VAR模型，是一种常用的计量经济模型，加粗样式1980年由克里斯托弗·西姆斯（Christopher Sims）提出。VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。VAR模型用来估计联合内生变量的动态关系，而不带有任何事先约束条件。它是AR模型的推广，此模型目前已得到广泛应用。　向量自回归(VAR)是基于数据的统计性质建立模型，VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型，从而将单变量自回归模型推广到由多元

2021-05-09 13:46:18 3261 1

原创 Python爬虫——简书首页文章信息

运用Python对简书首要进行简书首页的文章信息进行爬取。具体包括：文章标题、文章id、用户昵称、用户id、总浏览量、评论数、点赞数、赞赏量。以及文章插图和用户头像的下载。并对以上数据进行excel的存储，首先进行文件是否存在的判断，不存在，则创建。再比较pandas包方法存储和xlwt方法。网页分析首先对简书首页网页进行分析。在查看网页源代码中按下ctrl+F键搜索“做人，不要自作多情，生...

2020-04-20 11:18:04 433 1

原创 Eviews面板数据回归过程解析——以在企业现金流量和盈利质量上的应用为例

一、变量描述变量名称变量变量表示变量解释因变量净利润Roe自变量经营活动产生的现金流量净额Ocf自变量投资活动产生的现金流量净额Icf自变量筹资活动产生的现金流量净额Fcf控制变量企业规模Size资产总额本文由于选择变量的数值范围较大。故将每个变量减小100000000倍。二、单位根检验本文选取时间为2008...

2019-12-24 10:45:07 26047 9

qq_43286898的博客