10 MerciPopo

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 42w+

[Datamining][FinancialRiskControl] Task05: 模型融合

WW

2020-09-27 23:59:24

[Datamining][FinancialRiskControl] Task04: 建模与调参

逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 LightGBM模型 CatBoost模型 模型对比与性能评估: 回归模型/树模型/集成模型; 模型评估方法; 模型评价结果; 模型调参:..

2020-09-24 22:52:00

[Datamining][FinancialRiskControl] Task03:数据分析

1

2020-09-21 23:54:54

[Datamining][FinancialRiskControl] Task02:数据分析

赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约目的: 1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模. 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.为特征工程做准备 2.1 学习目标学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习了解变量间的相互关系、变量与预测值之间的存在关系 完成相应学习打卡任务2.2 内容介绍数据总

2020-09-18 23:56:56

[Datamining][FinancialRiskControl] Task01:赛题理解

竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。分类算法常见的评估指标如下:1、混淆矩阵(Confuse Matrix)(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive ) (2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative ) (3)若一个实例是负类,但是被预测为正类,即为假正类FP(False Positive ) (4)若一个实例是负类,并且被预测

2020-09-15 23:41:33

Task09; 文件与文件系统.md

1. 文件与文件系统打开文件open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)Open file and return a stream. Raise OSError upon failure. file: 必需,文件路径(相对或者绝对路径)。 mode: 可选,文件打开模式 buffering: 设置缓冲 encoding: 一般使用utf8 .

2020-08-09 00:22:21

Task08:模块与datetime模块

模块把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。容器 -> 数据的封装 函数 -> 语句的封装 类 -> 方法和属性的封装 模块 -> 程序文件命名空间命名空间因为对象的不同,也有所区别,可以分为如下几种:内置命名空间(Built-in Namespa

2020-08-07 23:44:56

Task07:类、对象与魔法方法(3天)

类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术 继承:子类自动共享父类之间数据和方法的机制多态:不同对象对同一方法响应不同的行动2. self 是什么?Python 的self相当于 C++ 的this指针。类的方法与普通的函数只有一个特别的区别 —— 它们必须有一个额外的第一个参数名称(对应于该实例,即该对象本身),按照惯例它的名称是...

2020-08-05 23:15:21

Task06:函数与Lambda表达式

1. 函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数 返回值是函数函数的定义函数以def关键词开头,后接函数名和圆括号()。 函数执行的代码以冒号起始,并且缩进。 return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。2. 函数参数Python 的函数具有非常灵活多样的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。从简到繁的

2020-08-02 22:36:20

Task 5: 字典、集合和序列

字典1. 可变类型与不可变类型序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。 字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型X是不是可变类型的呢?两种方法:麻烦方法:用id(X)函数,对 X 进行某种操作,比较操作前后的id,如果不一样,则X不可变,如果一样,则X可变。 便捷方法:用hash(X),只要不报错,证明X可被哈希,即不可变,反过来不...

2020-07-31 23:37:00

Task04列表、元组和字符串

https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language1.列表简单数据类型整型<class 'int'> 浮点型<class 'float'> 布尔型<class 'bool'>容器数据类型列表<class 'list'> 元组<class 'tuple'> 字典<class 'dict'>..

2020-07-28 23:49:05

Task 03 异常处理

https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的基类 Exception:常规异常的基类 StandardError:所有的内建标准异常的基类 Arith...

2020-07-25 23:52:52

Task 3: 基于机器学习的文本分类

https://github.com/datawhalechina/team-learning-nlp/blob/master/NewsTextClassification/Task3%20%E5%9F%BA%E4%BA%8E%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%9A%84%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB.md1.文本表示方法 Part1文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Emb...

2020-07-25 23:41:16

Task2: 条件语句 循环语句

`学习链接: https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language1.条件语句(1)If 语句if 语句的expr_true_suite代码块只有当条件表达式expression结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。 单个 if 语句中的expression条件表达式可以通过布尔操作符and,or和not实现多重条件判断。(2) if -...

2020-07-24 00:55:53

Task1: 变量、运算符与数据类型

课程地址:https://github.com/datawhalechina/team-learning-program/blob/master/Python-Language/01.%20%E5%8F%98%E9%87%8F%E3%80%81%E8%BF%90%E7%AE%97%E7%AC%A6%E4%B8%8E%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.md1. 注释:(1)单行:#表示注释,作用于整行。(2)多行:''' '''或者""" """表示区...

2020-07-22 23:28:50

Task01 赛题理解

赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类, 典型的字符识别问题。相关资料整理记录:1.Datawhale 零基础入门数据挖掘-Baseline :https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.24.1cd8593aw4bbL5&.

2020-07-21 22:17:54

Task03&04&05 : 要点记录

Task 03: 欠拟合现象:模型无法达到一个较低的误差 过拟合现象:训练误差较低但是泛化误差依然较高,二者相差较大 Task 04:卷积神经网络基础介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。二维卷积层介绍的是最常见的二维卷积层,常用于处理图像数据。...

2020-02-20 12:25:46

Task01&Task02: 线性回归;Softmax与分类模型、多层感知机;文本预处理;语言模型;循环神经网络基础

1.线性回归的基本要素:模型、数据集、损失函数2.优化函数优化函数的有以下两个步骤:(i)初始化模型参数,一般来说使用随机初始化; (ii)我们在数据上迭代多次,通过在负梯度方向移动参数来更新每个参数。3.矢量计算向量相加的两种方法。向量相加的一种方法是,将这两个向量按元素逐一做标量加法。 向量相加的另一种方法是,将这两个向量直接做矢量加法4. softmax和...

2020-02-14 21:56:40
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。