自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 资源 (5)
  • 收藏
  • 关注

原创 用tkinter实现一个简单的登录页面

首先,本例利用了label,entry和button控件label1=tk.Label(window,text='User name:',width=20,height=3)label2=tk.Label(window,text='Password:',width=20,height=3)entryVar1=tk.StringVar()entry1=tk.Entry(window,textvariable=entryVar1)entryVar2=tk.StringVar()entry2=tk.E

2021-08-30 10:33:46 1604

原创 用tkinter编写一个GUI:计算器

目前,在看书自己学习GUI的框架,今天实现一个简单的计算器的界面首先,上成品图:代码:主要用grid布局from tkinter import *window=Tk()window.title("计算器")window.geometry("200x150+200+200") ##设置窗口尺寸和位置names=['7','8','9','÷','AC','C','4','5','6','x','(',')','1','2','3','-','√','x²','0','.','%','+','

2021-08-30 10:22:56 289

原创 PyQt5的第一个小项目:登录跳转页面

首先创建一个主窗口,命名为Login.py注:这一步可以通过QTDesigner工具来画出图形,然后生成.py文件,再做修改如何生成.py文件的过程已在上一篇博客发布,谢谢关注from PyQt5 import QtCore, QtGui, QtWidgetsclass Ui_MainWindow(object): #定义一个建立UI界面的函数 def setupUi(self, MainWindow): MainWindow.setObjectName("MainW.

2021-08-27 10:07:53 1149 1

原创 PyQt开发环境搭建

在自己尝试学习PyQt的时候遇到很多问题,做个简单的记录,免得日后踩坑哈哈!!!pycharm环境我之前一直用的IDE是spyder,但是对于项目搭建来说还是pycharm更方便些,所以决定开始学习用pycharm了首先,为了学习GUI,我新建了一个项目MyPython,我用的是Anaconda的开发环境,在里面建立一个虚拟环境venv,用的是python3.6因为项目采用不同版本的python,所依赖的库的版本也不一样,为了避免版本冲突,为每一个项目每个python版本创建一个虚拟环境,环境

2021-07-03 12:47:20 538 1

原创 用tushare数据自定义期货大宗商品指数(3)

先把tushare获取的行情数据存入本地,再进行读取,这样如果更换数据源的话也可以直接利用定义读取行情数据的函数,并根据交易时间选择数据时间段#######定义读取行情数据函数def read_file(path,file_name,start_date,end_date): try: r=open(path+file_name,encoding='utf-8-sig') data=pd.read_csv(r) data=data.sort_

2021-06-11 22:33:57 250

原创 用tushare数据自定义期货大宗商品指数(2)

通过tushare 获取股票日线行情和期货主力合约数据及定义指数所用相关数据###获取股票上市公司基础信息def get_code(): df=api.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date') codes=df.ts_code.tolist() return codes,df####上市公司日线行情codes,df=get_co

2021-06-11 20:14:34 291

原创 用tushare数据自定义期货大宗商品指数(1)

备注: tushare ID–435904感谢tushare提供的积分权限,本篇博文分享一下我在筛选大宗商品的关联股票分析时所用的代码,欢迎大家交流互相学习!后面会继续分享我的实现自定义大宗商品指数的代码!!!获取股票基础信息def get_code(): df=api.stock_basic(exchange='', list_status='L', fields='ts_code,symbol,name,area,industry,list_date') codes=df.t

2021-05-31 22:37:33 430

原创 创建新的文件夹

python在指定目录下创建新的文件夹def mkdir(path): # 去除首位空格 path=path.strip() # 去除尾部 \ 符号 path=path.rstrip("\\") # 判断路径是否存在 # 存在 True # 不存在 False isExists=os.path.exists(path) # 判断结果 if not isExists: # 如果不存在则创建目录

2021-05-19 10:26:58 72

原创 在字符串特定位置加入指定字符

在字符串特定位置加入指定字符##查找字符串中某字符出现第n次的位置def findSubStrIndex(substr, str, time): times = str.count(substr) if (times == 0) or (times < time): pass else: i = 0 index = -1 while i < time: index = str.fi

2021-05-15 19:38:45 264

原创 卡方拟合性检验

1.卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。2.这一类检验称为拟合性检验。 其自由度通常为分类数减去1,理论次数通常根据某种经验或理论。3.总而言之,卡方拟合度检验用于判断不同类型结果的比例分布相对于一个期望分布的拟合程度。卡方拟合性检验适用于变量为类别型变量的情...

2020-04-08 08:51:47 6348

原创 卡方列联表的独立性检验

1.列联表是按两个或多个特征分类的频数数据,一般以表格形式组成。2.判断两个或多个属性之间有无关联,即判别属性之间是否独立。3.检验步骤建立原假设H0: 两属性相互独立H1: 两属性之间不独立计算自由度计算卡方统计量拒绝域对照卡方分布的临界值表,找到对应的卡方值,判断是否在拒绝域内列联表独立性检验的python实现'''(1)假设检验重要知...

2020-04-07 14:25:10 6350

原创 方差齐性检验

哈特利检验Hartley’s test又称最大r比法,是检验多 个方差的齐性的方法。它只能用于等测定次数所得到的方差 齐性的检验。检验统计量Fm。、=S2Amax- S nax}smm。式中,5 max是被 检验的。个方差5了中最大的方差。当由样本值计算的 Fmax值大于哈特利检验临界值表中约定显著性水平和相应自 由度时的临界值时,判 S.,。与其余的方差之间在统计土有显 著性差异。仅适用于样...

2020-04-02 17:26:20 5116

原创 自定义双因素方差分析

####双因素方差分析,可进行有交互作用与无交互作用 def f_twoway(df_c,col_fac1,col_fac2,col_sta,interaction=False): df=df_c.copy() list_fac1=df[col_fac1].unique() list_fac2=df[col_fac2].unique() r=len(list...

2020-04-02 10:35:53 230

原创 statsmodels双因素方差分析

'''1.正态性2.方差齐性3.独立性'''#双因素方差分析import pandas as pdimport numpy as npfrom statsmodels.formula.api import olsfrom statsmodels.stats.anova import anova_lmdata = pd.DataFrame([[1, 1, 32], ...

2020-04-02 10:23:36 1184

原创 scipy.stats单因素方差分析

###调包进行单因素方差分析import numpy as npfrom scipy import stats'''###第一种数据形式type=numpy.recarraydata = np.rec.array([('Pat', 5),('Pat', 4),('Pat', 4),('Pat', 3),('Pat', 9),('Pat', 4),('Jack', 4),('...

2020-04-02 10:09:11 1739

原创 自定义单因素方差分析

定义总平方和分解公式:利用检验统计量F定义检验方法:'''实现单因素方差分析'''# 导入相关包import pandas as pdimport numpy as npimport mathimport scipyfrom scipy import stats # 自定义函数 def SST(Y): sst = sum(np.power(Y - np.mea...

2020-04-02 09:37:06 246

原创 正态总体方差的检验

1.单个正态总体方差的卡方检验python实现:#备择假设sigma2>0.016from scipy import statsdef ka2(n,s2,sigma2): k_value=(n-1)*s2/sigma2 p_value=1-stats.chi2.cdf(k_value,n-1) return p_valueka2(25,0.025,0.0...

2020-03-30 17:32:35 2175

原创 正态总体均值假设检验

单个正态总体均值的检验(1)sigma已知的u检验(Z检验)#######Z检验'''Z检验条件1.样本量大于302.数据之间彼此独立3.数据正常分布4.样本量应该相等'''#单正态总体,方差已知from scipy import statsfrom statsmodels.stats import weightstats as stestsdef test_z_s...

2020-03-30 10:48:50 1792

原创 正态性检验

1.散点图+直方图import numpy as npimport pandas as pdimport matplotlib.pyplot as plt% matplotlib inlines = pd.DataFrame(np.random.randn(1000)+10,columns = ['value'])print(s.head())# 创建随机数据fig = plt....

2020-03-27 15:45:43 723

原创 EDA 实例化

基于之前的EDA数据探索性分析,本篇博客把之前的函数实例化,数据和之前的相同import mathimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltclass EDA:# def __init__(self,file_path):# self.file_path=file_...

2020-03-24 17:29:10 748

转载 机器学习:XGBoost和GBDT的区别

xgboost是一种集成学习算法,属于3类常用的集成方法(bagging,boosting,stacking)中的boosting算法类别。它是一个加法模型,基模型一般选择树模型,但也可以选择其它类型的模型如逻辑回归等。xgboost属于梯度提升树(GBDT)模型这个范畴,GBDT的基本想法是让新的基模型(GBDT以CART分类回归树为基模型)去拟合前面模型的偏差,从而不断将加法模型的偏差降低。...

2020-03-12 17:32:26 457

原创 机器学习:集成算法的原理

集成学习是指将若干弱分类器组合之后产生一个强分类器。 集成算法的目的是为了让ML效果更好,单个分类行不行就采用多个(换而言之,它是通过组合几种模型来提高机器学习的效果。与单一模型相比,该方法可以提供更好的预测结果),它是对于训练集数据,我们通过训练若干个个体学习器,通过一定的结合策略,就可以最终形成一个强学习器,以达到更好的效果。集成算法本身不是一个单独的机器学习算法,而是通过构建并结合多个机...

2020-03-12 16:12:17 603

原创 EDA探索性数据分析(2)

读取mysql数据库的数据表,了解数据的分布情况、了解分析方向、排除该单个变量的异常值 ,只需给定表名或视图名称。import mathimport sqlalchemyimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport pymysqlclass EDA: def __init...

2020-03-12 14:36:41 164

原创 EDA数据探索性分析

读取数据,输出每个有效变量的数据分布图:import mathimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltclass EDA:# def __init__(self,file_path):# self.file_path=file_path #获得数据 ...

2020-03-12 13:25:47 211

原创 SQLAlchemy向数据库添加数据报错

1.在创建连接的位置设置字符编码mysql = 'mysql+pymysql://root:@localhost:3306/test?charset=utf8mb4'tableName = 'persons1' engine = create_engine(mysql,encoding='utf8')2.修改Mysql编码格式show variables like 'cha...

2020-03-05 10:28:40 419

原创 使用FileInput对象读取文件

读取一个非常大的文件,使用readlines函数会占用太多内存,因为该函数会一次性将文件所有的内容都读到文件列表中,列表中的数据都需要放在内存中,所以非常占用内存。1.for 循环readlines逐行读取2.fileinput 模块的input函数读取input 方法返回一个FileInput 对象,使用的是缓存机制,并不会一次性读取文件的所有内容。所以比readlines更节省内存资源...

2020-03-03 17:33:01 366

原创 通过新闻预测股市涨跌

constant.py定义数据位置,在主文件中调用raw_text_csv_file = './dataset/Combined_News_DJIA.csv'cln_text_csv_file = './cln_text.csv'tools.py把主文件需要数据处理的步骤模块化,分别定义为函数进行调用,代码更加清晰from nltk.tokenize import Rege...

2020-02-29 20:38:27 853 2

原创 pycharm中运行文件调包

首先所有.py文件需要在同一文件夹下在同文件夹下添加一个空的__init__.py文件在控制区域添加系统路径import syssys.path.append(r'C:\Users\LHL\Desktop')4.如果不能立即读取当前文件夹,则需要先声明此代码及数据的所在路径再进行调用import osos.chdir(r'C:\Users\LHL\Desktop')...

2020-02-28 14:33:52 495

原创 主成分分析

主成分:PCA的图像特征提取:import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import load_digitsdigits = load_digits()X_digits, y_digits = digits.data, digits...

2020-02-28 10:08:47 155

原创 SQL: 创建存储过程

存储过程就是一条或多条 SQL 语句的集合,可视为批文件,但是其作用不仅限于批处理。存储程序可以分为存储过程和函数。存储过程要用 CALL 语句来调用,并且只能用输出变量返回值。可使用CREATE PROCEDURE语句创建存储过程:语法格式如下:CREATE PROCEDURE <过程名> ( [过程参数[,…] ] ) <过程体>[过程参数[,…] ] 格...

2020-02-23 10:39:34 2507

原创 SQL:数据清洗

检查数据完整性在完整性这里,我们需要重点检查字段数值是否存在空值,在此之前,我们需要先统计每个字段空值的个数。在 SQL 中,我们可以分别统计每个字段的空值个数,比如针对 Age 字段进行空值个数的统计,使用下面的命令即可:SELECT COUNT(*) as num FROM titanic_train WHERE Age IS NULL当然我们也可以同时对多个字段的非空值进行统计:...

2020-02-23 10:14:12 1477

原创 Flask-Login 用户登录

Flask-Login提供Flask的用户会话管理。它处理登录,注销和记住用户会话的常见任务。它会:1.将活动用户的ID存储在会话中,让您轻松登录和注销。2.让您将视图限制为已登录(或已注销)用户。3.处理通常令人毛骨悚然的“记住我”功能。4.帮助保护您的用户会话免遭Cookie小偷窃取。5.稍后可能与Flask-Principal或其他授权扩展集成。但是,它不会:1.对您强加特定...

2020-02-17 16:38:21 2014 1

原创 机器学习预测股票涨跌

量化策略建模:1.建立训练集:X:t时刻之前的特征因子(价格、价格衍生特征、文本特征等)Y:t时刻之前对应的标签(价格、买卖交易)2.建立测试集t时刻之后的特征/因子3.常用的featureTime Lags:将滞后期(时间窗口)前的数据样本的指标作为特征direction_pred_main.py创建滞后序列from __future__ import print_fun...

2020-02-12 17:05:44 3945 1

原创 flask项目:静态文件(实例)

静态文件是为网页添加不需要动态生成的文件css文件:定义页面样式,可自由修改(创建时需定义文件后缀.css)/* 页面整体 */body { margin: auto; max-width: 580px; font-size: 14px; font-family: Helvetica, Arial, sans-serif;}/* 页脚 */foot...

2020-02-03 14:35:32 535

转载 flask项目:SQLite

参考链接:https://www.cnblogs.com/xuwei1/p/11206324.html#home%E4%B8%BB%E9%A1%B5结果展示:在浏览器中访问http://localhost:5000/点击添加学生信息:点击submit:go back to home page之后再点击查看学生信息,则会显示已添加记录:...

2020-01-22 14:46:05 328

原创 flask项目:文件上传

在Flask中处理文件上传非常简单。它需要一个HTML表单,其enctype属性设置为“multipart / form-data”,将文件发布到URL。URL处理程序从request.files[]对象中提取文件,并将其保存到所需的位置。每个上传的文件首先会保存在服务器上的临时位置,然后将其实际保存到它的最终位置。目标文件的名称可以是硬编码的,也可以从request.files[file]对...

2020-01-21 16:11:02 455 1

原创 flask项目Session(会话)

Cookie是存储在客户端的,而Session是存储在服务端的,也可以将Session称为服务端的Cookie.因为Cookie和Session的使用方式都和字典一样,通过key存储和获取值。服务端会为每一个客户端浏览器创建一个Session对象。也就是说,客户端浏览器不仅仅可以在本地将数据保存在Cookie中,还可以将大量的数据存储到服务端的Session对象中。在flask中使用Sessi...

2020-01-21 14:07:42 310

原创 flask项目cookie设置

Cookie的定义:如果单单从数据结构的角度来说,它可以被理解成用来保存数据的一个dictionary,由一组组键值对组成.如果从作用上来说,我们知道Http协议是一种无状态的协议.什么叫无状态呢,就是本次的客户端请求不会保留上一次客户端请求的状态,简单点说就是这样会要求我们每次在浏览器中点开一个网站的链接都会输一次账户和密码.cookie就是用来解决这个问题的.Cookie的主要目的是跟踪...

2020-01-21 11:08:51 895

原创 flask项目Web表单(2)

简单的表单组件:Flask-WTF扩展支持很多表单组件,例如:文本输入组件、输入整数组件、输入日期组件、输入多行文本组件等创建一个表单组件:flask_form.pyfrom flask import Flask,request,render_templatefrom flask_wtf import FlaskFormfrom wtforms import TextField,In...

2020-01-20 15:37:56 147

原创 flask项目Web表单(1)

Flask-WTF拓展:Flask-WTF拓展是Flask的一个模块,用于处理Web表单。Web表单用于通过HTTP GET或HTTP POST请求向服务端提交数据。Flask-WTF扩展的主要功能如下:1. 生成表单组件的HTML代码2. 后台验证3. 向Web端返回错误信息4. 在Web页面上显示错误信息5. 防止跨域访问使用Flask-WTF之前需要在运行环境下安装:因为我...

2020-01-20 14:03:09 151

方差分析-自定义数据.xlsx

本excel文档是我在测试自定义的单因素方差分析时自己做的简易数据,测试后可得到明显的结果,证明此检验代码有效

2020-04-02

Data_analysis.py

数据分析的分步骤代码,仅供参考,需要请自行下载。

2020-03-03

Data_Preprocess.py

本资源为大数据分析工具的数据预处理部分,完整的描述了数据清洗与处理的过程,仅供参考。数据预处理从数据输入到清洗处理,去除异常值,常数列的一系列操作。

2020-03-02

titanic_train.xlsx

练习SQL数据处理的经典titanic数据,数据缺失值查看,数据缺失值填充,数据唯一性检查,比较典型的可练习数据预处理,数据分析及建模的数据

2020-02-23

app_sql.py

sqlAlchemy的完整代码

2020-02-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除