13 李元乐

尚未进行身份认证

我要认证

山高李维峰

等级
TA的排名 4w+

网贷风控体系之-概论

网贷风控体系之-概论

2020-08-02 17:37:07

网贷风控体系之-风控模型

网贷风控体系之-风控模型

2020-08-02 17:41:33

网贷风控体系之-决策引擎

网贷风控体系之-决策引擎

2020-08-02 17:40:15

网贷风控体系之-系统架构

网贷风控体系之-系统架构

2020-08-02 17:38:47

连接物理和数字世界,以数据驱动企业持续增长

数字化转型变得重要且紧急数据驱动型企业的概念以数据生产要素驱动经营管理,实现持续增长和创新发展从农业经济到工业经济,生产要素经历了由土地、劳动力向资本、技术及管理等的演进。数字经济时代催生了以大数据为代表的新型生产要素,企业的经营管理离不开海量数据的支撑。相较于传统生产要素的有限增长和供给,数据具有可复制、可共享、无限增长和供给的特性,可以通过连接物理世界和数字世界,驱动企业向数字化转型升级,进而实现持续增长和创新发展。需要注意的是,数字化转型强调的是运用数字技术,而数据驱动强调是以数据作为关键生产要

2020-07-18 16:30:37

时代的数据魔法:ETL

时代的数据魔法:ETLDT时代,如何高效地把数据转换为信息、知识,已经成为企业亟待解决的关键问题,ETL作为数据分析、数据挖掘的基础,已成为提高核心竞争力的重要技术手段。什么是ETL如果把数据仓库的模型设计比作是一座大厦的设计蓝图,那么数据就是构成大厦的一砖一瓦,而ETL就是建设大厦的过程。时代的数据魔法:ETL图:典型BI系统结构图,来源于网络根据典型BI系统结构图我们可以看出,ETL(Extraction-Transformation-Loading)是数据仓库获取高质量数据的关键环节,也

2020-07-18 16:20:49

数据挖据---机器学习平台之H2O架构/接口/实践

上一章介绍了H2O的使用,这次来学习学习H2O架构接口和实践。1,H2O架构关于H2O架构,很多资料也有说明,这里我们一起来看看官网上的介绍。最上面的是客户层,即接口交互层,H2O支持JavaScript,R,Python,Excel,Tableau,Flow等多种形式的外部交互。下面那个可以理解为H2O的关键引擎层,JVM Components,每个JVM进程被分为三层:语言,算法,核心架构,负责执行引擎,算法引擎,数据引擎,任务处理引擎:Rapids Expression Evaluatio

2020-05-24 11:00:02

方差、协方差和协方差矩阵

上次写了相关系数,其实很类似的一个概念是协方差。要说协方差,先复习下基本的统计内容1. 均值2.方差(标准差、标准方差) 或者写为: 简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。如果是样本...

2015-08-18 10:17:49

数据挖掘---AutoML平台之H2O

关于AutoML在机器学习ML的实践中,参数是其中一个很重要的环节,学习的初始阶段参数怎么给,是默认值,随机值,还是有特点规律的参数,学习过程中,参数怎么调整,参数规模等等一序列的问题,是ML绕不过去的坑,也是机器学习当中很重要的很乏味很无赖的一个课题。怎么解决这些痛点,怎么能够自动优化参数,减少人工调整参数,对机器学习也是一个不小的挑战。AutoML应运而生,一般是指尽量不通过人来设定超参数,...

2019-08-03 17:33:46

数据挖掘---深度学习之TensorFlow(三)

深度学习之TensorFlow学习(三)1,CNN2,RNN3,GANTODO

2019-08-03 16:04:51

数据挖掘---深度学习之TensorFlow(二)

深度学习之TensorFlow学习(二)重要概念复习:激活函数(Activation Functions)卷积函数(Convolution)池化函数(Pooling)损失函数(Losses)TODO

2019-08-03 16:01:52

数据挖掘---深度学习之TensorFlow(一)

TensorFlow学习(一)TensorFlow安装TensorFlow基本概念TensorFlow简单例子数学公式TensorFlow安装在centos上面体验,使用的是Anaconda的方式,里面自带了很多默认的学习工具包,不需要在下载,当然没有搞GPU(以前旧版本的python要小心,由于墙的原因,很多在线下载的都用不了,找到下面这个合适的) wget ht...

2018-06-10 12:42:37

人工智能漫谈

人工智能漫谈最近人工智能的话题也是相当的火热,看了一些书之后,自己总结了一些看法和思考,记下来备忘。三次浪潮知识表示发展方向种种疑虑人工智能三次浪潮一般认为,人工智能发展是随着现代计算机发展而出现的新学科。随着人们对效率的追求,人们急切的盼望计算机能够代替人来做很多工作,将人类解放出来。第一次计算机浪潮是20世纪50-60年代,计算机在解决“推理和搜索”问题上吸引了人...

2018-03-15 16:11:15

数据处理-Spring Batch Scaling and Parallel Processing

承蒙各位抬爱,鄙人的一篇关于Spring Batch的博客《Spring Batch之进阶》有很多人浏览。说明有很多人工作中用到这个spring batch框架进行批量任务处理,也说明对这个框架还有不少不熟悉的地方,鄙人也是。That is to say,我们有必要加强学习,不然三天不学习,赶不上×××。这里就来继续说说Spring Batch Scaling and Parallel Proce

2018-02-07 17:19:17

数据处理---那些年遇到的SQL汇总

那些年遇到的SQL问题真的不少,各种类型的,有面试的时候遇到的SQL,有开发的时候遇到的,有性能优化的时候遇到的,还有在网上看到的各种资料的,林林总总,问题不少,这里做个汇总,从以下几个方面说下:1,各种SQL语句;2索引和SQL性能Explain;3 JOIN相关,为了忘却的的纪念:1,各种常见SQL语句各种Join:内联接,外联接(LEFT OUTER JOIN,RIGHT...

2018-01-09 11:43:48

数据处理-Spark Worker工作流程图启动Driver源码解读

Spark Worker原理和源码剖析解密:Worker工作流程图、启动Driver源码解密。转载自:https://jingyan.baidu.com/article/f96699bbdeafbd894f3c1b7a.html方法/步骤1Worker中Driver和Executor注册过程Worker本身核心的作

2018-01-05 09:47:18

数据存储---Mysql双机互为热备方案实践

Mysql作为一个流行的数据库,对于怎么样构建高性能、高可用、可扩展的MySQL集群,的确是一个讨论很多的话题。方案多种多样,看到知乎上面的https://www.zhihu.com/question/21307639,这些方案应该说都有道理,但是都有缺点,由于CAP的原因,很难鱼和熊掌前的兼得。把二楼的回答稍作修改摘录如下: 1. 做读写分离,关于这方面的原因解释太多次数(增...

2018-01-03 13:15:19

Keepalived+Nginx高可用配置

很久就想试试Keepalived+Nginx高可用怎么配置,一直没有动手。正所谓纸上得来终觉浅,绝知此事要躬行。So let's go, step by step.主要需要Keepalived+Nginx+Apache,所以要安装这几个。我用的centos7的虚拟机。IP和端口规划如下:作用IP端口web192.168.37.1288828

2017-12-27 14:53:06

数据存储---GreenPlum实践

GreenPlum作为一个很好的开源的数据仓库,一直想体验一把,最近装了一个.关于安装,网上资料介绍也多了不少,至少越来越多,不过真正装一把才知道还是有各种坑的,不是那么一帆风顺的.       Greenplum在线安装文档 http://gpdb.docs.pivotal.io/500/install_guide/prep_os_install_gpdb.html#topic8

2017-10-06 22:14:35

数据存储---REDIS cluster

好久没有写了,还是慢慢拾起来吧。前面很早就说过要搞个redis cluster,这次我们就来一个。下面记录下我的操作。一,基本操作1,新建用户groupadd zookeeperuseradd -g zookeeper -G zookeeper -d /home/zookeeper zookeeperpasswd zookeepergroupadd redisuseradd -g redis -G...

2017-09-01 15:13:41

查看更多

勋章 我的勋章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。