- 博客(8)
- 资源 (5)
- 收藏
- 关注
原创 centOS7安装brat的时候遇到的一些小坑——新手友好 centOS基本命令介绍
0.centOS安装brat感谢各位大佬辛苦总结的安装过程(如下1,2,3),在这里我给不熟悉centOS和brat的新手补充一下安装过程中可能遇到的坑。可以直接跳到trouble shooting的部分。本文也会有安装过程中可能用到的centOS命令。1.centos下brat安装使用2.Centos7下安装Brat工具进行中文文本标注3.文本标注工具BRAT的安装与配置我的web使用端口:http://127.0.0.1/brat-1.3p1/启动(/var/www/html/brat-1.
2021-07-09 10:22:42 1224 3
原创 贷款违约行为的ANOVA分析——关于不同抽样方法得到不同结论的分析
Questions:1.不同收入人群在贷款违约行为中是否具有显著差异?2.不同工作年限人群在贷款违约行为中是否具有显著差异?原始数据链接:https://tianchi.aliyun.com/competition/entrance/531830/informationimport pandas as pddata = pd.read_csv('../贷款违约预测/train2021.csv')data id loanAmnt
2021-07-02 17:01:10 322
原创 天池项目笔记-金融风控-贷款违约预测 Task4
Task04_建模与调参 modeling and tuning尝试使用LightGBM、Xgboost和Random Forest三种树模型进行预测和集成1.划分数据集X_data = train_data[feature_columns]Y_data = train_data['isDefault']X_test = test_data[feature_columns]from sklearn.model_selection import train_test_splitfrom skl
2020-09-24 21:37:01 575 2
原创 天池项目笔记-金融风控-贷款违约预测 Task3
Task03_特征工程 features engineering目前只是数据预处理和初步洞察(初步 basic preprocessing)后续更新思路。可以考虑使用评分卡模型对这一问题进行分析。1.时间格式处理1.1 将earliesCreditLine 特征转为日期类型 通过观察原始数据,‘earliesCreditLine’数据为字符串数据,将日期以非结构化形式保存。这一步将这一数据进行结构化处理转为datetime类型,方便模型使用和后续的特征工程构建,记录为’earliesCreditL
2020-09-18 19:08:59 828
原创 天池项目笔记-金融风控-贷款违约预测 Task2
Task02_EDA1.导入数据 load the datatrain_data = pd.read_csv('./train.csv', sep = ',')test_data = pd.read_csv('./testA.csv', sep = ',')2.数据浏览 data overview 在开始使用数据前先对其进行大概的浏览,包括数据的行列、缺失值、重复值与统计信息等。train_data.head()idloanAmntterminterestRateins
2020-09-18 18:37:31 518
原创 天池项目笔记-金融风控-贷款违约预测 Task1
Task01 赛题理解 Understand the tasks ❓1.赛题任务赛题以预测用户贷款是否违约为任务,isDefault = 1 表示违约/isDefault = 0 表示未违约。???? https://tianchi.aliyun.com/competition/entrance/531830/information2.赛题数据总数据量超过120w,包含47列变量信息,其中15列为匿名变量。d为贷款清单分配的唯一信用证标识loanAmnt贷款金额
2020-09-18 18:26:39 470
Python实现简单的区块链
2022-09-15
Python(Request和beautifulsoup)的爬虫程序(破产网)
2020-07-16
数组的增删和排序
2018-04-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人