自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(101)
  • 收藏
  • 关注

原创 【无标题】放大放大放大

我完全不知道你现在消耗多大,法院给到你的6万多,加上我转的和你自己原有的,好像不足3个月就已经不够用了。争论不休的的根源是,我们都对自己应该做什么没有清晰的认识,都是说了自己干了一件具体的事情,就好像已经干了所有的事情。3、家庭作为一个最小的组织,是要靠双方共同努力的,不是一个人要给对方什么生活,一个人要给对方找个工作,如果没有,那就可以自己随便来,这样的说法,是自贬身价的。1、首先是对于责任的共识。别人的热闹都是别人的,别人最多要你给个围观,我们没有能力,不能给别人带来收益,是没人要真和你一起合作的。

2023-11-07 09:39:06 84

原创 循环for处理数据

一种循环取数的方法

2022-11-09 10:04:08 330

原创 把两个毫不相关dataframe中的字段合并在一起

df_target = pd.DataFrame(df_pct[(df_pct.ts_code == code)].sort_values(by=['date'],ascending=False)) df_xiang = pd.DataFrame(df_target['ts_code'].head(1)) df_hebing = pd.merge(df_pct,pivot_df,on=['date'],how='inner') df_hebing = df_hebing[:-...

2022-04-03 21:54:15 481

原创 组内排序 python和sql

#生成rownumdf1 = df1.sort_values(by=['ts_code','trade_date'],ascending=True)df1['rownum'] = df1['trade_date'].groupby(df1['ts_code']).rank(ascending=False)#tscode组内排序,按日期降序SELECT t_time, code, name, CL, row_number(...

2022-03-12 10:23:07 2180

原创 卫裤选择标准

卫裤还是85%的棉的好,不起球

2022-03-02 22:30:52 546

原创 打印机设置

1、从控制面板 进入 插看设备和打印机2、选中一个打印机,查看打印服务器属性,在安全选项卡中,把管理服务器权限的√去掉3、则此时,端口和驱动程序下的添加、删除、配置等按钮变灰,无法安装打印机,重新把√选中则可以恢复...

2022-02-28 09:11:08 6930

原创 时间序列 fbprophet

第一天占比多少总额趋势:Profit 月效应一、1月总消费金额:方法:2年的数据,增长率为主。二、计算趋势H2o:输入18年每一天的消费金额,日期,日期的属性,周几,是否节假日,间隔几天 ,得到1月每天的消费金额,你会计算占比,然后来调整。Facebookprofit模型:输入变量,有节假日参数, 输出的结果很准,月末的几天就会高一些。三、不是客户级的,可用lightgbm来计算客户级的,但是都误差大, 合起来。...

2022-02-17 09:35:11 325 1

原创 lightgbm调参后人工修改的结果记录20220216

761688clf = LGBMClassifier(reg_alpha=0.15,reg_lambda=10,num_leaves=60,max_depth=7,n_estimators=1500, learning_rate=0.01,bagging_fraction=0.7,bagging_freq=10,max_bin=150, min_data_in_leaf=30,feature_fraction=0.7,r...

2022-02-16 21:10:50 604

原创 布林线的python定义

#布林线相关指标,shift(-1),向上移动1格,也就当前行变成下一行,在这里就是未来的某一天,+1就是向下移动,就是过去的一天df1['upper_BBANDS'],df1['mid_BBANDS'],df1['lower_BBANDS'] = ta.BBANDS(df1['close'].values,timeperiod=5,nbdevup=2,nbdevdn=2,matype=0)df1['mid_BBANDS_xielv'] =ta.LINEARREG_SLOPE(df1['mid_BBA

2022-02-11 09:50:52 998

原创 shapley

import lightgbm as lgbimport shapmodel = lgb.LGBMClassifier().fit(X,y)explainer = shap.Explainer(model)shap_value = explainer(X)shap.plots.waterfall(shap_value[100],max_display=40)shap.plots.bar(shap_value,max_display=30)

2022-02-10 22:36:32 290

原创 完善一些内容

#################开始训练模型###########################train_data = df4.loc[(df1['rownum_W']>=sst) & (df1['rownum_W']<=101)]train_data = train_data.fillna(0)#处理以下target的字段类型,不然后面有问题train_data['target'] = train_data['target'].astype('int')data_

2022-01-27 16:05:07 1363

原创 一些错误的修复笔记

第10行df1['c_ma30'] = TA.SMA(df1,30,column='close')#原来的跟21重合了,搞错了第13#21日均线的斜率是否大于0,来判断是否盘整等df1['ma21xielv_d0_flag'] = np.where(df1['ma21xielv']>=0,1,0)df1['d21_0_count'] = ta.SUM(df1['ma21xielv_d0_flag'], timeperiod=15)#盘平df1['d21_0_count'] =

2021-12-30 15:13:08 627

原创 学习笔记 select的用法

#####对当日涨跌进行分段df1['pct_chg_cate'] = np.select([((df1['pct_chg']>=4.9999)), ((df1['pct_chg'] <4.9999) & (df1['pct_chg']>=1.5001)), ((df1['pct_chg'] <(1.5001)) & (df1['pc...

2021-12-29 11:23:56 172

原创 一些更正的东西

第13行#是否长上影,绝对长度和相对长度都有要求df1['K_l_up_flag'] = np.where((df1['shiti_up']>50) & (df1['shiti_up_len']>3),1,0)#是否长下影df1['K_l_low_flag'] = np.where((df1['shiti_low']>50) & (df1['shiti_low_len']>3),1,0)#是否上下影都长df1['K_l_lu_flag'] = np.wh

2021-12-28 09:47:24 72

原创 python盘整之路

#以今天的上线浮动12%,看是否盘整df1['c_up_12per'] = df1['close'].shift(14)*1.12df1['c_down_12per'] = df1['close'].shift(14)*0.88df1['c_shitf1_nei_flag'] = np.where((df1['close'].shift(1)> df1['c_down_12per']) & (df1['close'].shift(1)< df1['c_up_12per']),1..

2021-12-27 17:13:00 855

原创 var——ok

var_ok = list(set(['shizi_panzheng_count','zhenfu_count_W','l30_c_xielv_W','l30_c_xielv_count_W','h30_c_xielv_count_W','RSI_2_W','bian_2_UP_count_W','yuanhu_count_W','h30_c_xielv_W','suoliang_flag_count_W','fangliang_flag_count_W','xie_l_up_count_W','hengc

2021-08-19 00:07:57 79

原创 特征选取的boruta

# X=X.values# y=y.values#更改为bor特征选择器# import sklearn# from lightgbm.sklearn import LGBMClassifier# from sklearn.ensemble import RandomForestClassifier# from boruta import BorutaPy# rf = LGBMClassifier(num_leaves=60,max_depth=7,n_estimators=1200,lea

2021-08-08 00:20:02 487

原创 mysql启动错误10061

原因: 没有启动MySQL服务------------更多是删除某个文件库表时导致的错误解决方案:以管理员身份打开cmd命令行窗口,使用cd命令将目录切换为你MySQL的bin目录下,输入 net start mysql 启动MySQL服务即可解决此问题!!!电脑中搜索服务找到MySQL服务,启动它!管理员身份命令行窗口打开Windows快捷键: Win + X + A如果找不到MySQL服务,需要安装MySQL服务。解决的方法是用管理员的方式打开mysql安装目录bin。执行mysqld.e

2021-08-07 18:40:50 243

原创 一些股票代码的留存

#提前缩小数据量df_t = df1.loc[(df1['rownum_W'] <= (sst+25))]t = df_t.groupby(['rownum_W'],as_index=False).ts_code.count()row_liu = t['rownum_W'].loc[t.ts_code>12000]df1 = pd.DataFrame()for row in row_liu: df_for = df_t[df_t.rownum_W==row] df1 ...

2021-08-01 16:28:00 87

原创 红绿flag

df1['honglv_flag'] = np.where(df1['close']>=df1['open'],1,0)df1_week_hong = pd.DataFrame(df1.groupby(['ts_code','year','week'],as_index=False).honglv_flag.sum())df_weekv = pd.merge(df_weekv,df_week_hong,how = 'inner',on=['ts_code','year','week'])

2021-07-29 11:37:48 55

原创 日basic恢复

#基础信息,主要要用到换手率\PE\PB等sqlcmd2 = "select * from a_hisdata.basic order by ts_code,trade_date ASC"df2 = pd.read_sql(sqlcmd2, dbconn)df2 = df2.sort_values(by=['ts_code','trade_date'],ascending=True)#填充空值df2 = df2.fillna(value=9999)df2['trade_date'] = df2[

2021-07-27 15:50:49 77

原创 在sst=11时

20210716结束后在sst=11时 group1 在0.9 group2 在0.6在sst=10时 group1 在0.6 group2 在0.2在sst= 9时 group1 在0.6 group2 在0.3在sst= 8时 group1 在 group2 在在sst= 7时 group1 在 group2 在在sst= 6时 group1 在 group2 在在sst= 5时 grou...

2021-07-20 10:03:58 46

原创 按日期或某个分组变量循环取数,同时考虑是否数量足够

data=df_gn[df_gn.trade_date==‘20210427’].sample(50)for i in list(set(df_gn.trade_date))[1:2]:print(i)dd=df_gn[(df_gn.trade_date==i) & (data.vol>=20000)].sample(50)data=data.append(dd)

2021-07-14 21:38:31 57

原创 删除的东西

日的#逐行检查后决定删除的变量df1 = df1.drop([ 'open', 'high', 'low', 'close', 'pre_close', 'change', 'vol', 'amount', 'trade_date_1', 'index_x', 'pe', 'pb', 'total_share', 'total_mv', 'index_y', 'macd', 'macd_hist', 'macd_bidaxiao', 'macd_jincha', 'macd_jc_5count', '

2021-07-09 08:41:46 478

原创 变量归类的方法

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import mean_squared_errorimport mathfrom math import sqrtfrom datetime import datetimeimport copynp.ra...

2021-06-23 17:11:00 406

原创 时间,把字符串改成日期是原样,数字则从1970开始

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import mean_squared_errorimport mathfrom math import sqrtfrom datetime import datetimeimport copynp.ra...

2021-06-21 16:37:59 196

原创 2021-03-11 python保留和删除

from sklearn.feature_selection import RFE, RFECVfrom sklearn.svm import LinearSVCfrom sklearn.datasets import load_irisfrom sklearn import model_selectioniris = load_iris()X, y = iris.data, iris.target## 特征提取estimator = LinearSVC()selector = RFE(.

2021-06-18 09:43:29 241

原创 求日期的年和该年的第几周,用于合并周数据

# 数据,来自数据库,指定日期第一段sqlcmd1 = "select * from a_hisdata.hisdata_week order by ts_code,trade_date ASC"df1 = pd.read_sql(sqlcmd1, dbconn)df1 = df1.sort_values(by=['ts_code','trade_date'],ascending=True)df1['trade_date'] =pd.to_datetime(df1['trade_date']).

2021-05-26 22:33:24 58

原创 照片识别

import exifreadimport reimport jsonimport requestsimport os#转换经纬度格式def latitude_and_longitude_convert_to_decimal_system(*arg): """ 经纬度转为小数, param arg: :return: 十进制小数 """ return float(arg[0]) + ((float(arg[1]) + (float(arg[2].spl...

2021-05-13 18:02:27 169

原创 python保存和调用模型

2.创建文件目录,保存模型import osfrom sklearn.externals import joblib# 创建文件目录dirs = 'testModel'if not os.path.exists(dirs): os.makedirs(dirs) # 保存模型joblib.dump(LR, dirs+'/LR.pkl')3.读取模型# 读取模型LR = joblib.load(dirs+'/LR.pkl')test = np.array([[3,4...

2021-03-27 22:57:58 1380 1

原创 loc选取数据的实质是按index

loc选取数据,实际上是对index标注true和false,把true的留下来#-*- coding: utf-8 -*-import pandas as pddf1 = pd.read_excel('testdf.xlsx')print(df1)df2 = df1print(df2)df3 = df1.loc [df1['kemu2']>80]print(df3)df4 = df1.loc [df2['kemu2']>80]print(df4)print.

2021-03-26 09:01:14 213

原创 选取上市超过一定天数的,关于日期8位数标准格式

#想删掉部分上市不久的import tushare as tsts.set_token('79acf3c40ec0f32a2510645fe2f84461900550e3edc36feb5fa289b8')pro = ts.pro_api()import timeimport datetimetoday=datetime.date.today()#oneday=datetime.timedelta(days=1)today=int((today).strftime("%Y%m%d"))#规范

2021-03-25 22:29:22 120

原创 使用stack集成模型的方法之一

import sklearnfrom lightgbm.sklearn import LGBMClassifierclf = LGBMClassifier(num_leaves=90,max_depth=7,n_estimators=1000,learning_rate=0.1,bagging_fraction=0.9,bagging_freq=80,max_bin=250,min_data_in_leaf=31,feature_fraction=0.6)#frac就是选多少特征来训练from skl

2021-03-23 17:23:07 339

原创 过采样的处理方法

#判断正样本比例,及样本均衡import mathzongliang = len(train_data)zhen_1 = train_data['target'].sum()zheng_ratio = zhen_1/zongliang#放量高中低zhen_2 = math.ceil(zongliang*0.3+1)p_zong = np.where(zheng_ratio<0.3,zhen_2,zhen_1)#n_zong = np.where(zheng_ratio>0.7,z

2021-03-23 16:59:33 397

原创 调个参数可好

clf = LGBMClassifier(num_leaves=90,max_depth=7,n_estimators=1000,learning_rate=0.1,bagging_fraction=0.9,bagging_freq=80,max_bin=250,min_data_in_leaf=31,feature_fraction=0.6)#frac就是选多少特征来训练

2021-03-23 14:28:23 51

原创 以时间作为文件名的后缀

import osimport datetimenowTime = datetime.datetime.now().strftime('%m%d_%H_%M') # 现在print(nowTime)df.to_excel('reslut'+nowTime+'.xlsx')

2021-03-18 15:16:47 508

原创 大幅度

df1['lisan_zhangfu'] = ta.STDDEV(df1['pct_chg'].values,period=28)/(df1['c_ma5']+0.00001)

2021-03-12 20:54:04 62

原创 用树模型选择特征变量,可见哪些变量

#-*- coding: utf-8 -*-#提取日历史数据import pandas as pdfrom finta import TA #金融指标库,我这里使用它帮我计算均线值import numpy as npimport matplotlib.pyplot as pltimport seaborn as sns # 这个库可以用来画 heatmap 图import pymysqlimport timeimport datetimeimport sklearnfrom s.

2021-03-12 11:17:03 155

原创 特征选择-可用

特征选取1、删除方差低的特征from sklearn.feature_selection import VarianceThresholdX = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]sel = VarianceThreshold(threshold=(.8 * (1 - .8)))sel.fit_transform(X)#fit相当于建模,并没有应用sel.fit_tra...

2021-03-12 09:16:37 146

原创 决策树的可视化及通过决策树筛选变量

from dtreeviz.trees import dtreevizviz = dtreeviz(clf, iris['data'], iris['target'], target_name='', feature_names=np.array(iris['feature_names']), class_names={0:'setosa',1:'vers.

2021-03-11 16:55:03 1173 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除