自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (5)
  • 收藏
  • 关注

原创 Spark调优的几个思想或者角度

spark自身的性能红利、Shuffle操作、单机思维

2022-09-15 16:24:24 101

原创 【面试笔试】 Python3 两数之和TwoSum变体 找出所有组合的下标

两数之和是常见的题目,这里记录一下这类题型的多种变体。

2022-09-15 16:18:36 169

原创 centOS7安装brat的时候遇到的一些小坑——新手友好 centOS基本命令介绍

0.centOS安装brat感谢各位大佬辛苦总结的安装过程(如下1,2,3),在这里我给不熟悉centOS和brat的新手补充一下安装过程中可能遇到的坑。可以直接跳到trouble shooting的部分。本文也会有安装过程中可能用到的centOS命令。1.centos下brat安装使用2.Centos7下安装Brat工具进行中文文本标注3.文本标注工具BRAT的安装与配置我的web使用端口:http://127.0.0.1/brat-1.3p1/启动(/var/www/html/brat-1.

2021-07-09 10:22:42 1224 3

原创 贷款违约行为的ANOVA分析——关于不同抽样方法得到不同结论的分析

Questions:1.不同收入人群在贷款违约行为中是否具有显著差异?2.不同工作年限人群在贷款违约行为中是否具有显著差异?原始数据链接:https://tianchi.aliyun.com/competition/entrance/531830/informationimport pandas as pddata = pd.read_csv('../贷款违约预测/train2021.csv')data id loanAmnt

2021-07-02 17:01:10 322

原创 天池项目笔记-金融风控-贷款违约预测 Task4

Task04_建模与调参 modeling and tuning尝试使用LightGBM、Xgboost和Random Forest三种树模型进行预测和集成1.划分数据集X_data = train_data[feature_columns]Y_data = train_data['isDefault']X_test = test_data[feature_columns]from sklearn.model_selection import train_test_splitfrom skl

2020-09-24 21:37:01 575 2

原创 天池项目笔记-金融风控-贷款违约预测 Task3

Task03_特征工程 features engineering目前只是数据预处理和初步洞察(初步 basic preprocessing)后续更新思路。可以考虑使用评分卡模型对这一问题进行分析。1.时间格式处理1.1 将earliesCreditLine 特征转为日期类型​ 通过观察原始数据,‘earliesCreditLine’数据为字符串数据,将日期以非结构化形式保存。这一步将这一数据进行结构化处理转为datetime类型,方便模型使用和后续的特征工程构建,记录为’earliesCreditL

2020-09-18 19:08:59 828

原创 天池项目笔记-金融风控-贷款违约预测 Task2

Task02_EDA1.导入数据 load the datatrain_data = pd.read_csv('./train.csv', sep = ',')test_data = pd.read_csv('./testA.csv', sep = ',')2.数据浏览 data overview​ 在开始使用数据前先对其进行大概的浏览,包括数据的行列、缺失值、重复值与统计信息等。train_data.head()idloanAmntterminterestRateins

2020-09-18 18:37:31 518

原创 天池项目笔记-金融风控-贷款违约预测 Task1

Task01 赛题理解 Understand the tasks ❓1.赛题任务赛题以预测用户贷款是否违约为任务,isDefault = 1 表示违约/isDefault = 0 表示未违约。???? https://tianchi.aliyun.com/competition/entrance/531830/information2.赛题数据总数据量超过120w,包含47列变量信息,其中15列为匿名变量。d为贷款清单分配的唯一信用证标识loanAmnt贷款金额

2020-09-18 18:26:39 470

Python实现简单的区块链

基于区块链的原理,使用Python实现了简单的区块链。 代码的组成如下: test_sha256.py简单演示了加密算法,这是区块链的基础。 block.py实现了一个单独的区块对象。 基于区块链的原理,blockchain.py实现了区块链对象 交易数据记录在mempool.py当中,并利用proof_of_work.py演示工作量证明(PoW)算法的过程。 hack_the_blockchain.py演示区块链的安全性,比如区块内容受到恶意篡改会发生什么。

2022-09-15

Python(Request和beautifulsoup)的爬虫程序(破产网)

利用python完成的爬虫示例,使用了request获取网页信息并利用beautifulsoup解析html,利用pandas清洗数据后把破产案件信息整理为csv文件保存。 -支持手动输入案件的时间和要爬取的页码数。 -Selenium版本还在修改

2020-07-16

C#计算闰年和读写等基本操作

压缩包内为代码要求以及实现,包括计算闰年、读写、十位随机数字等实现。

2019-07-06

数组的增删和排序

增删与排序数组!!!!!!!增删与排序数组!!增删与排序数组!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1

2018-04-07

The_Toulmin_Model_of_Argumentation

图尔明模式,对研究演讲教育,理性辩论有很大帮助。通过科学的即兴演讲与劝说性训练,找到有效的说明模式。

2016-02-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除