sphinxrascal168-CSDN博客

原创【无标题】放大放大放大

我完全不知道你现在消耗多大，法院给到你的6万多，加上我转的和你自己原有的，好像不足3个月就已经不够用了。争论不休的的根源是，我们都对自己应该做什么没有清晰的认识，都是说了自己干了一件具体的事情，就好像已经干了所有的事情。3、家庭作为一个最小的组织，是要靠双方共同努力的，不是一个人要给对方什么生活，一个人要给对方找个工作，如果没有，那就可以自己随便来，这样的说法，是自贬身价的。1、首先是对于责任的共识。别人的热闹都是别人的，别人最多要你给个围观，我们没有能力，不能给别人带来收益，是没人要真和你一起合作的。

2023-11-07 09:39:06 84

原创循环for处理数据

一种循环取数的方法

2022-11-09 10:04:08 330

原创把两个毫不相关dataframe中的字段合并在一起

df_target = pd.DataFrame(df_pct[(df_pct.ts_code == code)].sort_values(by=['date'],ascending=False)) df_xiang = pd.DataFrame(df_target['ts_code'].head(1)) df_hebing = pd.merge(df_pct,pivot_df,on=['date'],how='inner') df_hebing = df_hebing[:-...

2022-04-03 21:54:15 481

原创组内排序 python和sql

#生成rownumdf1 = df1.sort_values(by=['ts_code','trade_date'],ascending=True)df1['rownum'] = df1['trade_date'].groupby(df1['ts_code']).rank(ascending=False)#tscode组内排序,按日期降序SELECT t_time, code, name, CL, row_number(...

2022-03-12 10:23:07 2180

原创卫裤选择标准

卫裤还是85%的棉的好，不起球

2022-03-02 22:30:52 546

原创打印机设置

1、从控制面板进入插看设备和打印机2、选中一个打印机，查看打印服务器属性，在安全选项卡中，把管理服务器权限的√去掉3、则此时，端口和驱动程序下的添加、删除、配置等按钮变灰，无法安装打印机，重新把√选中则可以恢复...

2022-02-28 09:11:08 6930

原创时间序列 fbprophet

第一天占比多少总额趋势：Profit 月效应一、1月总消费金额：方法：2年的数据，增长率为主。二、计算趋势H2o：输入18年每一天的消费金额，日期，日期的属性，周几，是否节假日，间隔几天，得到1月每天的消费金额，你会计算占比，然后来调整。Facebookprofit模型：输入变量，有节假日参数，输出的结果很准，月末的几天就会高一些。三、不是客户级的，可用lightgbm来计算客户级的，但是都误差大，合起来。...

2022-02-17 09:35:11 325 1

原创 lightgbm调参后人工修改的结果记录20220216

761688clf = LGBMClassifier(reg_alpha=0.15,reg_lambda=10,num_leaves=60,max_depth=7,n_estimators=1500, learning_rate=0.01,bagging_fraction=0.7,bagging_freq=10,max_bin=150, min_data_in_leaf=30,feature_fraction=0.7,r...

2022-02-16 21:10:50 604

原创布林线的python定义

#布林线相关指标,shift(-1),向上移动1格，也就当前行变成下一行，在这里就是未来的某一天，+1就是向下移动，就是过去的一天df1['upper_BBANDS'],df1['mid_BBANDS'],df1['lower_BBANDS'] = ta.BBANDS(df1['close'].values,timeperiod=5,nbdevup=2,nbdevdn=2,matype=0)df1['mid_BBANDS_xielv'] =ta.LINEARREG_SLOPE(df1['mid_BBA

2022-02-11 09:50:52 998

原创 shapley

import lightgbm as lgbimport shapmodel = lgb.LGBMClassifier().fit(X,y)explainer = shap.Explainer(model)shap_value = explainer(X)shap.plots.waterfall(shap_value[100],max_display=40)shap.plots.bar(shap_value,max_display=30)

2022-02-10 22:36:32 290

原创完善一些内容

#################开始训练模型###########################train_data = df4.loc[(df1['rownum_W']>=sst) & (df1['rownum_W']<=101)]train_data = train_data.fillna(0)#处理以下target的字段类型，不然后面有问题train_data['target'] = train_data['target'].astype('int')data_

2022-01-27 16:05:07 1363

原创一些错误的修复笔记

第10行df1['c_ma30'] = TA.SMA(df1,30,column='close')#原来的跟21重合了，搞错了第13#21日均线的斜率是否大于0，来判断是否盘整等df1['ma21xielv_d0_flag'] = np.where(df1['ma21xielv']>=0,1,0)df1['d21_0_count'] = ta.SUM(df1['ma21xielv_d0_flag'], timeperiod=15)#盘平df1['d21_0_count'] =

2021-12-30 15:13:08 627

原创学习笔记 select的用法

#####对当日涨跌进行分段df1['pct_chg_cate'] = np.select([((df1['pct_chg']>=4.9999)), ((df1['pct_chg'] <4.9999) & (df1['pct_chg']>=1.5001)), ((df1['pct_chg'] <(1.5001)) & (df1['pc...

2021-12-29 11:23:56 172

原创一些更正的东西

第13行#是否长上影，绝对长度和相对长度都有要求df1['K_l_up_flag'] = np.where((df1['shiti_up']>50) & (df1['shiti_up_len']>3),1,0)#是否长下影df1['K_l_low_flag'] = np.where((df1['shiti_low']>50) & (df1['shiti_low_len']>3),1,0)#是否上下影都长df1['K_l_lu_flag'] = np.wh

2021-12-28 09:47:24 72

原创 python盘整之路

#以今天的上线浮动12%，看是否盘整df1['c_up_12per'] = df1['close'].shift(14)*1.12df1['c_down_12per'] = df1['close'].shift(14)*0.88df1['c_shitf1_nei_flag'] = np.where((df1['close'].shift(1)> df1['c_down_12per']) & (df1['close'].shift(1)< df1['c_up_12per']),1..

2021-12-27 17:13:00 855

原创 var——ok

var_ok = list(set(['shizi_panzheng_count','zhenfu_count_W','l30_c_xielv_W','l30_c_xielv_count_W','h30_c_xielv_count_W','RSI_2_W','bian_2_UP_count_W','yuanhu_count_W','h30_c_xielv_W','suoliang_flag_count_W','fangliang_flag_count_W','xie_l_up_count_W','hengc

2021-08-19 00:07:57 79

原创特征选取的boruta

# X=X.values# y=y.values#更改为bor特征选择器# import sklearn# from lightgbm.sklearn import LGBMClassifier# from sklearn.ensemble import RandomForestClassifier# from boruta import BorutaPy# rf = LGBMClassifier(num_leaves=60,max_depth=7,n_estimators=1200,lea

2021-08-08 00:20:02 487

原创 mysql启动错误10061

原因：没有启动MySQL服务------------更多是删除某个文件库表时导致的错误解决方案：以管理员身份打开cmd命令行窗口，使用cd命令将目录切换为你MySQL的bin目录下，输入 net start mysql 启动MySQL服务即可解决此问题！！！电脑中搜索服务找到MySQL服务，启动它！管理员身份命令行窗口打开Windows快捷键： Win + X + A如果找不到MySQL服务，需要安装MySQL服务。解决的方法是用管理员的方式打开mysql安装目录bin。执行mysqld.e

2021-08-07 18:40:50 243

原创一些股票代码的留存

#提前缩小数据量df_t = df1.loc[(df1['rownum_W'] <= (sst+25))]t = df_t.groupby(['rownum_W'],as_index=False).ts_code.count()row_liu = t['rownum_W'].loc[t.ts_code>12000]df1 = pd.DataFrame()for row in row_liu: df_for = df_t[df_t.rownum_W==row] df1 ...

2021-08-01 16:28:00 87

原创红绿flag

df1['honglv_flag'] = np.where(df1['close']>=df1['open'],1,0)df1_week_hong = pd.DataFrame(df1.groupby(['ts_code','year','week'],as_index=False).honglv_flag.sum())df_weekv = pd.merge(df_weekv,df_week_hong,how = 'inner',on=['ts_code','year','week'])

2021-07-29 11:37:48 55

原创日basic恢复

#基础信息，主要要用到换手率\PE\PB等sqlcmd2 = "select * from a_hisdata.basic order by ts_code,trade_date ASC"df2 = pd.read_sql(sqlcmd2, dbconn)df2 = df2.sort_values(by=['ts_code','trade_date'],ascending=True)#填充空值df2 = df2.fillna(value=9999)df2['trade_date'] = df2[

2021-07-27 15:50:49 77

原创在sst=11时

20210716结束后在sst=11时 group1 在0.9 group2 在0.6在sst=10时 group1 在0.6 group2 在0.2在sst= 9时 group1 在0.6 group2 在0.3在sst= 8时 group1 在 group2 在在sst= 7时 group1 在 group2 在在sst= 6时 group1 在 group2 在在sst= 5时 grou...

2021-07-20 10:03:58 46

原创按日期或某个分组变量循环取数，同时考虑是否数量足够

data=df_gn[df_gn.trade_date==‘20210427’].sample(50)for i in list(set(df_gn.trade_date))[1:2]:print(i)dd=df_gn[(df_gn.trade_date==i) & (data.vol>=20000)].sample(50)data=data.append(dd)

2021-07-14 21:38:31 57

原创删除的东西

日的#逐行检查后决定删除的变量df1 = df1.drop([ 'open', 'high', 'low', 'close', 'pre_close', 'change', 'vol', 'amount', 'trade_date_1', 'index_x', 'pe', 'pb', 'total_share', 'total_mv', 'index_y', 'macd', 'macd_hist', 'macd_bidaxiao', 'macd_jincha', 'macd_jc_5count', '

2021-07-09 08:41:46 478

原创变量归类的方法

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import mean_squared_errorimport mathfrom math import sqrtfrom datetime import datetimeimport copynp.ra...

2021-06-23 17:11:00 406

原创时间，把字符串改成日期是原样，数字则从1970开始

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import mean_squared_errorimport mathfrom math import sqrtfrom datetime import datetimeimport copynp.ra...

2021-06-21 16:37:59 196

原创 2021-03-11 python保留和删除

from sklearn.feature_selection import RFE, RFECVfrom sklearn.svm import LinearSVCfrom sklearn.datasets import load_irisfrom sklearn import model_selectioniris = load_iris()X, y = iris.data, iris.target## 特征提取estimator = LinearSVC()selector = RFE(.

2021-06-18 09:43:29 241

原创求日期的年和该年的第几周，用于合并周数据

# 数据，来自数据库,指定日期第一段sqlcmd1 = "select * from a_hisdata.hisdata_week order by ts_code,trade_date ASC"df1 = pd.read_sql(sqlcmd1, dbconn)df1 = df1.sort_values(by=['ts_code','trade_date'],ascending=True)df1['trade_date'] =pd.to_datetime(df1['trade_date']).

2021-05-26 22:33:24 58

原创照片识别

import exifreadimport reimport jsonimport requestsimport os#转换经纬度格式def latitude_and_longitude_convert_to_decimal_system(*arg): """ 经纬度转为小数, param arg: :return: 十进制小数 """ return float(arg[0]) + ((float(arg[1]) + (float(arg[2].spl...

2021-05-13 18:02:27 169

原创 python保存和调用模型

2.创建文件目录，保存模型import osfrom sklearn.externals import joblib# 创建文件目录dirs = 'testModel'if not os.path.exists(dirs): os.makedirs(dirs) # 保存模型joblib.dump(LR, dirs+'/LR.pkl')3.读取模型# 读取模型LR = joblib.load(dirs+'/LR.pkl')test = np.array([[3,4...

2021-03-27 22:57:58 1380 1

原创 loc选取数据的实质是按index

loc选取数据，实际上是对index标注true和false，把true的留下来#-*- coding: utf-8 -*-import pandas as pddf1 = pd.read_excel('testdf.xlsx')print(df1)df2 = df1print(df2)df3 = df1.loc [df1['kemu2']>80]print(df3)df4 = df1.loc [df2['kemu2']>80]print(df4)print.

2021-03-26 09:01:14 213

原创选取上市超过一定天数的，关于日期8位数标准格式

#想删掉部分上市不久的import tushare as tsts.set_token('79acf3c40ec0f32a2510645fe2f84461900550e3edc36feb5fa289b8')pro = ts.pro_api()import timeimport datetimetoday=datetime.date.today()#oneday=datetime.timedelta(days=1)today=int((today).strftime("%Y%m%d"))#规范

2021-03-25 22:29:22 120

原创使用stack集成模型的方法之一

import sklearnfrom lightgbm.sklearn import LGBMClassifierclf = LGBMClassifier(num_leaves=90,max_depth=7,n_estimators=1000,learning_rate=0.1,bagging_fraction=0.9,bagging_freq=80,max_bin=250,min_data_in_leaf=31,feature_fraction=0.6)#frac就是选多少特征来训练from skl

2021-03-23 17:23:07 339

空空如也

空空如也