1 慧安金科

尚未进行身份认证

暂无相关描述

等级
博文 50
排名 6w+

慧安金科机器学习通识(三)| GBDT类算法原理简介

在插播了产品开发工程师的一些实战经验之后,我们回到机器学习的主线上来。上堂课讲到了决策树的一些基本概念和训练方法,本堂课我们介绍一下GBDT类算法的原理。GBDT,英文全称为“GradientBoostDecisionTree”,翻译为梯度提升树,这类算法是有监督业务的核心,主要包括XGBoost、LightGBM和CatBoost等。我们希望通过对这类算法原理的讲解,能够...

2019-05-10 16:48:25

美国2B互联网公司产品开发理念

前两堂课我们讲了机器学习的基本概念和决策树算法的原理,本堂课我们插播关于美国2B企业产品开发的一些实战经验。美国的2B企业规模相对较大,与2C企业的比例可以达到1:1。我们可以随口说出很多美国大型2B企业的名字,比如Workday、Salesforce、ServiceNow,等。然而国内的2B领域却是另一番光景。国内的2B企业和2C企业规模的比例只有大约1:10。而且国内大部分2B...

2019-04-26 13:50:40

慧安金科机器学习通识(二)| 决策树的基本概念和训练方法

上一堂课我们讲了机器学习的基础知识和基本概念,这一堂课我们讲一种具体的算法——决策树。决策树是一种比较简单基础、应用较广的算法。决策树,顾名思义,就是利用树结构来做决策的机器学习模型。它的特点是比较简单、容易理解、可解释性强。Whatisadecisiontree我们以下面这张图为例,简单介绍一下决策树:我们采集了一群人的许多信息,包括年龄、性别、职业…...

2019-04-04 16:35:39

慧安金科机器学习通识(一)

1.什么是机器学习机器学习就是为了完成某项任务,加入了一些数据和经验来进行处理,从而可以更好地完成这些任务,也就是说程序从数据中学到了东西。机器学习的主要内容,就是程序怎么样从这些数据中学到有用的知识,来更好地完成任务。有人说,机器学习就是统计学习,就是用统计学的知识来解决一些问题。模型就是从这批数据或经验中学到的结果,把它存储下来可以帮助你更好地完成任务。2.机器学...

2019-03-22 16:38:05

成为大数据工程师需要哪些技能?(一文秒懂大数据)

2008年,维克托·迈尔-舍恩伯格编写的《大数据时代》开启了科学技术的一个新的篇章,让“大数据”一词变得家喻户晓,人人都在谈论大数据,各科技公司也纷纷引入大数据技术。那么,到底什么是大数据?大数据(bigdata),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新的处理模式才能获得更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。在《大数据时...

2018-11-29 09:35:20

FinTech领域的风险控制——策略篇

金融市场与风险相互依存,理清金融科技背景下可能面临的风险之后,我们应当积极寻找有效的防范方法和途径。首先,借助信息工具规制金融风险,尤其是互联网金融风险。金融中介服务于资金供给者和资产提供者,金融风险的产生、交易或资产服务都要通过金融中介来完成。因此,金融中介是风险管理和交易的主体。由于金融市场准入门槛高、风险集中、价格形成过程难以预测、监管失灵等问题都源于信息不对称,而区块链、大数据和云计算...

2018-10-19 16:30:25

FinTech领域的风险控制——风险篇

随着移动互联网、人工智能、大数据、云计算、区块链等技术的高速发展,资金的需求方和提供方得以建立更为便捷和紧密的联系,出现了十分丰富的金融业态。这改善了国内小微企业和征信白户在传统金融机构融资难的困境,改变了投资门槛高、小额投资渠道匮乏的现状,也为实现普惠金融起到了巨大的推动作用,推进了供给侧结构性改革。然而,金融科技在快速发展的过程中也不可避免地积累了一些问题和风险,这对金融风控和监管都提出了新的...

2018-10-17 11:32:25

如何构建健全的信用评估体系

信用,就是因为履行诺言而取得的信任,是指依附在人与人之间、单位之间、商品交易之间的一种相互信任的生产关系和社会关系。因为信用的存在,双方得以自觉、自愿地反复交往,消费者甚至愿意付出更多的钱来延续这种关系。信用调查,是指信用机构接受委托后,按照委托事项与目的对相关组织和个人的信用信息进行征集、分类、分析的工作。信用调查是信用评级的基础,信用评级是信用调查的进一步延伸。我国的信用调查体系尚不完...

2018-10-15 15:33:10

小贷公司的风险成因及应对策略——策略篇

小贷公司要以审慎稳健为原则,实现企业与政府的良好互动,有效地防范风险,最终达到社会效益与经济效益双赢的效果。针对风险篇中提到的小贷公司存在的风险,本文总结了相关的应对策略,帮助小贷公司实现稳定健康发展。赋予明确的身份性质小贷公司应明确定位,监管部门应尽快修订政策法规,赋予小贷公司明确合法的金融机构身份,让小贷公司的发展有法可依、有章可循。为此,制定更加权威、详细的法律法规才能明确小贷公司的...

2018-10-11 13:39:04

小贷公司的风险成因及应对策略——风险篇

小贷公司的出现在很大程度上弥补了金融机构信贷的资金缺陷,增加了对中小企业以及农村金融需求的有效供给。但是,由于各方面的原因,小贷公司自诞生起就存在着多种风险。身份定位模糊不清小贷公司作为信贷行业中的新生命正处于摸索阶段,它的身份定位属于“准金融机构”,不过既不能享有金融机构的相关优惠政策,却还会受到金融政策限制以及相关部门的监管。这就导致小贷公司身份模糊、市场定位不明,严重制约了小贷公司的...

2018-10-09 15:27:16

黑产肆虐,AI如何扛起反欺诈大旗

时下,金融欺诈主要来源于网络黑产。据统计,网络黑产的直接从业者已超过40万,上下游人员总计超过170万,黑产手里握有的身份证约有1000万张,造成的欺诈金额每年正以40%的比例增长着。面对肆虐的黑产,金融界最看好的反欺诈手段,就是AI。那么,AI如何利用先进的技术对抗黑产呢?无论是传统反欺诈的方式,还是当下备受关注的AI技术,要想有效地对抗黑产,就必须先搞明白一点,那就是黑产究竟是如何骗贷...

2018-09-29 10:22:38

什么是KNN算法?

 KNN(K-NearestNeighbor)算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类,也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。KNN算法的思想非常简单:对于任意n维输入向量,分别对应于特征空间中的一个点,输出为该特征向量所对应的类别标签或预测值。KNN算法是一种非常特别的机器学习算法,因为它没有一般意义上的学习过程。它的工作原理是利用训练数据...

2018-09-27 10:19:25

深度学习的最新研究进展(三)

本文我们将简要讨论其他深度架构,它们使用与深度神经网络类似的多个抽象层和表示层,也称为深度生成模型(deepgenerateModels,DGM)。Bengio(2009)解释了深层架构,例如Boltzmannmachine(BM)和RestrictedBoltzmannMachines(RBM)及其变体等。Goodfellow等(2016)详细解释了深度生成模型,如受限和非受限的玻...

2018-09-25 15:09:01

深度学习的最新研究进展(二)

神经网络的功能与人脑相似,它们主要由神经元和连接组成。当我们说深度神经网络时,我们可以假设有相当多的隐藏层,可以用来从输入中提取特征和计算复杂的函数。Bengio(2009)解释了深度结构的神经网络,如卷积神经网络(CNN)、自编码器(AE)及其变体等。Deng和Yu(2014)详细介绍了一些神经网络架构,如AE及其变体。Goodfellow等(2016)对深度前馈网络、卷积网络、递归网络及其改进...

2018-09-19 14:11:24

深度学习的最新研究进展(一)

深度学习是机器学习和人工智能领域的最新趋势之一,为计算机视觉和机器学习带来了深刻的变革。新的深度学习正在不断诞生,甚至已经超越了最先进的机器学习技术。近年来,全世界在深度学习领域取得了许多重大突破。“深度学习”的由来“深度学习”(DeepLearning)一词最初于1986年被引入机器学习概念,2000年时又被用于人工神经网络。深度学习由多个层组成,以学习具有多个抽象层次的数据特征。深度...

2018-09-13 16:26:22

贷前调查必须采集的十大客户信息

贷前调查是信贷风控的第一道防线,信息采集的充分与否将直接决定了信贷机构放款的风险,包括信用风险、市场风险、操作风险等等。那么,贷前调查中,哪些信息是必须采集的呢?本文梳理了贷前调查必须采集的十大客户信息如下:1.客户背景每家企业的成立都有一定的背景、动机和条件,如创始人具备一定的从业经验、拥有某项专业技术、掌握行业的产品市场资源、行业利润较高等。如果这些条件不成熟,盲目创业投资时的成功率...

2018-09-11 14:02:36

反欺诈之路——黑卡、养卡的识别

许多公司都需要一个商用设备来群发短信,比如邮电局、税务局、海关、银行、证券商、各类交易所、期货经纪公司、工商局以及各类信息呼叫中心等,这台设备就像一个能插入多张手机卡的简易手机,你可以把它理解为“n卡n待”,这种设备,就是猫池。你可以把大量的手机SIM卡插入猫池,通过这台设备来接收短信。根据端口数量的不同,猫池可以插入不同数量的手机SIM卡,少则8张,多则64张。当你把猫池连接电脑,电脑就变成...

2018-09-07 11:21:17

风控的进化——从传统风控到智能风控

对于金融企业来说,风控模型和风控体系需要非常有经验的金融从业人士进行把控。比如,银行风控模型的出发点主要是衡量借款方的还款能力,一般来讲,模型包含了两部分的评判,即客观性的和主观性的。客观性的评判主要依据是可以量化的数据,如公司的年度审计财务报告、银行流水、缴税金额等,这些数据放在已设定好的模型里就能计算出分数或等级,作为参考。但是,光靠客观数据还不够,比如说公司所在的行业是落后的将被淘汰的行...

2018-09-05 13:57:11

机器学习的“进化”

机器学习是一种可以自动建立模型的数据分析方法。它是人工智能的一个分支,其核心思想是系统可以从数据中学习、进行模式识别,并在极少人为干预的情况下进行决策。机器学习起源于模式识别,核心思想是计算机可以摆脱被动执行编程任务的模式,可以主动地从数据中学习。然而,机器学习并不是一门新的科学,而是一门获得了新动力的科学。机器从先前的计算中学习,产生可靠的、可重复利用的决策和结果。同时,机器学习不断迭代...

2018-09-03 11:41:12

风控体系的一般架构

谈到互联网金融,风控体系是绕不开的一个话题。那么,什么是风控体系?简单地说,风控体系就是能够达成风险管理量化目标、边界清晰、结构清楚、动态持续的风险管理体系。量化目标:逾期率、坏账率可控是基本要求,检验风控体系有效性需要几个完整的信贷周期,结合公司盈利目标确定逾期率和坏账率的合理区间。边界清晰:所有因风险存在而产生的环节和流程都需要纳入风控体系来进行量化动态管理,风控体系的边界就是风险...

2018-08-31 09:59:57
奖章
  • 领英
    领英
    绑定领英第三方账户获取
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。