- 博客(5)
- 收藏
- 关注
原创 集训数据竞赛打卡——day4(模型选择)
from __future__ import print_functionimport lightgbm as lgbimport sklearnimport numpyimport hyperoptfrom hyperopt import hp, fmin, tpe, STATUS_OK, Trialsimport coloramaimport numpy as npN_HY...
2020-01-15 23:06:14 140
原创 集训数据竞赛打卡——day3(特征工程)
#核心代码举例# 统计特征 #计算均值 gp = train.groupby(by)[fea].mean() #计算中位数 gp = train.groupby(by)[fea].median() #计算方差 gp = train.groupby(by)[fea].std() #计算最大值 gp = train.groupby(...
2020-01-15 10:08:13 202
原创 集训数据竞赛打卡——day2
#coding:utf-8#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')# GBDTfrom sklearn.ensemble import GradientBoostingRegressor# XGBoostimport xgboost as xgb# LightGBM...
2020-01-15 09:59:35 142
原创 集训数据竞赛打卡——EDA
1拿到数据,先大概看一下数据总体(1)查看数据共有几行几列train_data.shape()(2)查看数据有没有缺失值train_data.isnull().sum()(3)查看数据的前几行train_data.head()注意,查看数据的几行几列和是否有缺失值,每列数据类型是什么,也可以使用train_data.info()。但用shape()和isnull(...
2020-01-07 23:51:48 167
原创 python 利用字典对列表中元素个数计数
方法一:利用字典的get函数,get表示根据字典的key取它的value值,如果该key不存在,则value值会默认为get的第二个参数。values=[1,2,3,2,3,1,4]values_cnt={}for value in values: value_cnt[value]=values_cnt.get(value,0)+1方法三:定义一个新的计数字典,用来放元素及其个...
2019-09-02 21:14:59 35133 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人