自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 Vintage、滚动率、迁移率的应用(转载)

转载于:http://mp.weixin.qq.com/s?__biz=MzIyNDk2MzQ1NQ==&mid=2247484124&idx=1&sn=eec18c836806b8803845716195fae061&chksm=e807bcccdf7035da8b5ca7fe81f0a7e2185e2ed37b93eeea2dc992457e10781c0dfe6c27cb48&scene=21#wechat_redirect一、Vintage ...

2020-06-17 15:10:07 637

原创 leetcode Python编码练习

贪心算法:1.环形路上有n个加油站,第i个加油站的汽油量是gas[i]. 你有一辆车,车的油箱可以无限装汽油。从加油站i走到下一个加油站(i+1)花费的油量是cost[i],你从一个加油站出发,刚开始 的时候油箱里面没有汽油。 求从哪个加油站出发可以在环形路上走一圈。返回加油站的下标,如果没有答案的话返回-1。思路:剩余油量gis[i]-cos[i],如果大于等于0,终点就往后移,直到最后终点又跑到了起点的位置;如果小于0,起点往前移# @param gas int整型一...

2020-05-21 15:03:55 189

转载 缓存问题及解决方案

目前的IO设备远不能满足互联网应用海量的读写请求。于是便出现了缓存,利用内存的高速读写性能来应付海量的查询请求。然而内存资源非常宝贵,将全量数据存储在内存中显然是不切合实际的。因此目前采用内存和IO结合的方式,内存只存储热点数据,而IO设备存储全量数据。 缓存的设计包含很多技巧,设计不当将会导致严重的后果。本文将介绍缓存使用中常见的三大问题,并给出相应的解决方案。1. 缓存穿透在大...

2019-11-07 14:24:55 241

原创 notepad++删除行到某个字符串之前或之后的正则表达式

删除s之后的所有字符用:s.*$删除s 之前的所有字符用:^.*s

2019-09-25 11:42:00 4811 1

原创 Centos切换图形界面

要进入图形界面,首先要安装。所以应该先执行yum groupinstall "X Window System" -yyum groupinstall "Desktop" -y接着,敲命令:startx 或 init 5

2019-09-24 17:59:55 151

原创 Superset报错

安装时:运行"pip install superset -i https://pypi.douban.com/simple"命令后,geohash包安装不成功。尝试安装对应的whl格式文件还是报错。安装c++对依赖包进行编译,"yum install gcc","yum install -y gcc-c++"运行时:过cd命令进入 Superset 安装目录( ...\Anaconda3\...

2019-09-23 12:02:31 1115

原创 lgbm模型使用问题

使用lgbm模型中,遇到过几个问题:1.Estimator not fitted, call `fit` before exploiting the model. 训练模型时,创建了多个estimator(参数合集),最终生成pkl文件时,参数版本紊乱。2.No module named 'pandas.core.indexes 训练模型和模型部署运行的环境不一致,py...

2019-07-16 10:49:18 3302 2

原创 金融风险控制

金融和风险挂钩,一般而言,风险越大,金融收益越高。对于抵押贷款公司来说,期望的就是在把控风险的前提下,获得最大的经济收益。贷款公司一般从两方面控制风险,一方面在信审阶段,通过家访以及风控模型,尽可能阻挡可能发生坏账的“坏人”;另一方面,在贷后阶段,根据逾期情况,尽可能的对抵押物进行保值。 信审阶段的风险把控,主要通过采集人的信息,例如居住、收入、工作等,加上第三方平台信息,如央行...

2019-06-28 14:38:58 16 1

原创 Kettle循环分批执行Rest client请求

业务需求,首先取到数据库中进件单号列表,发送Rest client请求,获取java执行的结果,根据结果更新数据库中进件信息。每次发送的进件单号过多的话,返回的信息量太大,代码报错。所以采用循环,将进件单号分批 执行。整体如下:javaScript代码如下: var currPage = parent_job.getVariable("CURR_PAGE");// 从job获取当...

2019-05-29 11:52:35 4951

原创 kettle spoon.bat启动时闪退

经历的闪退,两种方式可以尝试一下:1.编辑spoon.bat文件,里面java对应的内存改小。2.删除C:\Users\Administrator中的.kettle目录中的文件

2019-05-22 18:40:57 916

转载 模型常见问题排查

模型问题排查问题关键2个环节:环节1:因子分布异常缺失率异常 均值异常 极值异常 方差异常 因子时间趋势性变化出现以上现象需要进行2个分析:成因分析和影响分析,完毕之后再形成解决方案。 环节2:模型输出 PSI异常:PSI公式参考:https://www.zhihu.com/question/24490261/answer/229524690(1) 均匀尺度评分表...

2019-02-22 10:36:55 930

转载 数据处理方向

1.目标和目的清晰明确数据处理的目的和目标,而后才有针对目的和目标的方法和路径。2.设计正确的处理方案,方案需要考虑以下问题:(1)正确性:数据执行结果准确无误,需要做case检查和统计检查;(2)稳定性和鲁棒性:数据能够稳定的执行,处理过程需要考虑完整的异常处理机制和措施;(3)可运营数据处理过程能够监控到处理的过程和阶段性结果;(4)可快速恢复或重构出现...

2019-02-22 10:34:17 395

原创 java解析数据库某列数组元素

没找到用sql解析数组列的语句,最后用java实现。代码和postman如下:java代码:public static void parseArray(String param) throws UnsupportedEncodingException {        String url= params.get("body").replaceAll("%(?![0-9a-fA-F]...

2019-02-22 10:05:52 439

转载 机器学习 评分卡

转:https://blog.csdn.net/weixin_41363820/article/details/78834012 机器学习简介什么是机器学习如果一个系统能够通过执行某个过程改变它的性能,这就是学习(什么是学习)不用编程去指定机器做什么,而是让机器有能力自己学习首先定义任务T,经验E,表现P,如果机器有一个任务T,随着经验E的增多,表现P也会变好,则表示机器正在经验E中学...

2018-12-10 18:05:55 745

转载 数据挖掘模型中的IV和WOE详解

转:https://blog.csdn.net/kevin7658/article/details/507803911.IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用...

2018-12-10 16:31:57 177

原创 python在windos系统下用type查看文件的方法

在Linux访问文件是用:!cat ch06/ex1.csv,在Windows命令行中使用:!type ch06\ex1.csv需要注意的是:1.Windows与Linux不同的是win用的“\”添加子目录,而Linux使用“/”添加;2.win下也可以使用绝对路径进行访问,在所在目录下安如图操作方式进行复制,此时需加引号进行使用:!type “C:\Users\Burette\pyd...

2018-09-10 11:07:50 702

转载 Anaconda使用清华镜像报错

Windows利用Anaconda创建虚拟环境时报错:Fetching package metadata ...CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://www.lfd.uci.edu/~gohlke/pythonlibs/win-64/repodata.json>Elapsed: -An HTT...

2018-09-04 09:55:18 7477 3

转载 conda命令使用

conda测试指南在开始这个conda测试之前,你应该已经下载并安装好了Anaconda或者Miniconda 注意:在安装之后,你应该关闭并重新打开windows命令行。一、Conda测试过程:使用conda。首先我们将要确认你已经安装好了conda 配置环境。下一步我们将通过创建几个环境来展示conda的环境管理功能。使你更加轻松的了解关于环境的一切。我们将学习如何确认你在哪个环...

2018-09-03 17:19:12 552

转载 利用matlab求三种相关系数

在多元分析中我们经常要用到相关系数。常用的相关系数有三种:Pearson相关系数,Kendall相关系数和Spearman相关系数。一、Pearson相关系数Pearson相关系数是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。按照大学的线性数学水平来理解, 它比较复杂一点,可以看做是两组数据的向量夹角的余弦. Pearson相关系数用来衡量两个数据集合是否在一条线...

2018-08-27 15:57:26 109009 1

转载 Sql语句中IN和exists的区别及应用

   表展示    首先,查询中涉及到的两个表,一个user和一个order表,具体表的内容如下:    user表:        order表:       in    确定给定的值是否与子查询或列表中的值相匹配。in在查询的时候,首先查询子查询的表,然后将内表和外表做一个笛卡尔积,然后按照条件进行筛选。所以相对内表比较小的时候,in的速度较快。    ...

2018-07-27 10:14:52 120

转载 mysql安装问题及修改密码

在安装mysql时总是会遇到这样那样的问题,每次重新安装都会花很多时间来排查。在网上其实有很多相关的文章,但很多都只讲了方法,但没讲具体细节问题,导致无法解决问题。其实有时候知道问题的原因,但总是因为一些细节问题没有注意到,反复的尝试,浪费了很多时间。现在把我安装过程中遇到的问题以及该注意的问题记录下来。环境:windows7mysql版本升级后报错:mysql error:Table...

2018-07-06 09:32:19 139

原创 java代码中时间插入数据库丢失时分秒

Java在向数据库中插入时间的时候,常常遇到时、分、秒丢失的情况,这种情况的发生一般是由于时间日期对象使用错误造成的。java.util.Date需要转换为java.sql.Date,常规的方式转换过来只可以得到年月日,如若要取得时分秒,可以用Date的子类Timestamp。java.util.Date是不能直接插入数据库中的,虽然它包含了日期和时分秒。java.sql.Date可以直接插入数据...

2018-07-04 12:02:31 3285

原创 获取当前日期字符串

Calendar cal=Calendar.getInstance();cal.add(Calendar.DATE, 0);String today = new SimpleDateFormat("yyyyMMdd").format(cal.getTime());//20180625

2018-06-26 10:35:22 1817

原创 从数据库获取json组成的某一列并获取json中的值

Postman提交:{"tableName":"(表名)","field":"(列名)","where":"(查询条件)","DBJson":{"url":"jdbc:(数据库地址)?characterEncoding=UTF-8" ,"username":"","passwo

2018-06-12 16:21:28 7365

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除