2 棒子皮蹦蹦床

尚未进行身份认证

这个世界可能并不需要我,但我需要这个世界

等级
TA的排名 2w+

《商业数据分析》读书笔记(一)

这本书重点在于讲解商业数据分析背后的重点原则。帮助人形成一套科学的应用数据分析的流程。对于有数据分析基础知识的人来说,可以作为一种融会贯通的思维练习。前言1.介绍:数据分析思考数据机会的普遍存在案例:法国飓风案例:预测客户流失数据科学,工程,和数据驱动决策制定数据处理和“大数据”从大数据1.0到大数据2.0作为战略资产的数据和数据科学能力数据...

2019-01-07 11:10:24

PCA 理解

一篇非常好的解释PCA原理和实现过程的文章!主成分分析(Principal components analysis)-最大方差解释 在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做...

2019-10-08 09:23:45

Mac打开应用提示已损坏怎么办 Mac安装软件时提示已损坏怎么办

相信很多升级了最新Mac系统的用户在打开一些应用的时候都会出现“应用XX已损坏”的系统提示,安装这些应用的时候总是提示“已损坏,移至废纸篓”这类信息,根本无法打开应用,那么Mac打开应用提示已损坏怎么办?Mac安装软件时提示已损坏怎么办?一起来了解一下!  Mac打开应用提示已损坏的解决办法:  打开应用提示已损坏是因为新系统的原因。新的系统为了加强安全机制,默认不允许用户自行下...

2019-08-24 21:20:23

Python HTMLParser处理HTML转义字符

Python HTMLParser处理HTML转义字符抓网页数据经常遇到例如>或者这种HTML转义符,抓到字符串里很是烦人。比方说一个从网页中抓到的字符串:html = '<abc>'用Python可以这样处理:import HTMLParser html_parser = HTMLParser.HTMLPa...

2019-08-15 19:24:00

通过deepin_wine为ubuntu安装windows典型应用

来源:Linux系统QQ、微信最佳解决方案——wine篇国内某讯鹅厂的*q和*信确实便捷了人们生活工作中的交流沟通,对于国内程序员来说,特别是广大的以Linux(deepin发行版排除在外)作为主力操作系统的程序员来说,电脑上没有这两款软件是一件非常烦人的事。当然没什么是难得住神通广大的程序员的,十几年来的摸索,为Linux上面的qq和微信问题提供了多种多样的解决方案,也勉强凑合够用。那我今天...

2019-05-09 07:35:22

动态规划算法专题学习

参考:https://www.cnblogs.com/linshuhui/p/9680146.html为什么要学习基础的数据结构和算法?1.掌握计算机思维才能和计算机对话2.程序优化,避免浪费性能什么是动态规划(Dynamic programming,简称DP):DP是一种非常适合计算机的思维方法,它试图将复杂的总决策拆解为多个子决策,各个子决策之间存在某种关系。...

2019-05-06 08:51:23

我的学习方法论

学习某个东西的过程大概分为三个步骤:一:构建知识框架(克服学习过程中的不安全感)二:目标导向性学习(在实践中发现问题,找到感觉和思路)三:专题研习(加深理解,目的是举一反三)学习的心态:知识本身就是好的,哪怕是为了单纯理解一个东西也有意义;虚荣功利享乐之心只能无端消耗精神力,毫无意义;抱定这样的信念:没有什么是不可理解的,没有什么是不可想象的,一切都是时间问题;...

2019-05-04 21:46:37

基于LendingClub数据的信贷分析和建模报告

一:课题分析二:数据获取三:数据探索3.1主要特征含义理解3.2特征分布3.2.1目标特征分布3.2.2分类变量的分布3.2.3连续数值特征分布3.2.4时序特征分布3.2.5文字特征分布3.2.6两两特征的协方差四:数据预处理4.1数据集划分4.2特征缺失值识别与处理4.2.1严重缺失值的处理4.2.2缺失值填充4.3同值性特...

2019-04-24 10:31:57

讲讲共线性问题

文章来源:讲讲共线性问题多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能;后者干脆假定变量之间是相互独立的,因此从表面上看,也没有多重共线性的问题。但是对于回归算法,不论是一般回归,逻辑回归,或存活分析,都要同时考虑多个预测因子,因此多重共线性是不可避免需要面对的...

2019-04-18 21:57:31

余文建:利用"替代性数据"提升小微企业首次获贷能力

来源:余文建:利用"替代性数据"提升小微企业首次获贷能力  新浪财经讯 12月8日消息,以“探索金融与科技融合发展之道”为主题的2018第二届中国互联网金融论坛今日在京召开,中国人民银行金融消费权益保护局局长余文建出席并发表演讲。   他表示,小微企业融资难实际上体现在首贷难。小微企业融资问题根源在于银企之间信息不对称,因此金融机构需要依据征信记录进行信贷决策,而小微企业在传统征信里是“薄...

2019-04-16 10:39:27

《如何阅读一本书》——程浩的读书笔记

作者:程浩链接:https://www.zhihu.com/question/20631409/answer/16758482来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。这是一本非常优秀的书籍。最近杂事缠身,没有时间详细回答了,简单地贴一个读书笔记给大家。《如何阅读一本书》读书笔记读书四问:1、这本书的主题?讲述阅读的四种层次,以及每...

2019-04-07 14:26:19

如何锻炼出强悍的分析能力?

数据分析的本质还是分析能力,本文总结了知乎中如何锻炼出强悍的分析能力?这一问题的回答。其中,要特别感谢何明科和陈思炜的用心回答。强悍的分析能力都是建立在强大的逻辑思维能力上的,而强大的逻辑思维能力是需要知识储备支撑的。三者相互关联,更需要日积月累的经验加成和不断练习,非一日之功。主要途径是:1.构建结构化的知识储备2.特征辨识能力(从纷繁的信息中找到主要信息特征)3....

2019-04-06 16:27:59

风控之乱

来源:一本财经(yibencaijing)本文经授权转载!感谢原作者的辛勤创作!金融的核心是什么?严谨的金融从业者,答案必是风控。“中国目前互联网金融的风控从业者大概是十几万,真正懂风控的,也就一两千人”,催单侠CEO李晓炜称。人才缺口巨大,还不是风控行业面临的最大危机。一本财经通过调查发现,很多毫无经验的风控人员,只需要跳槽3次,就能升到总监职位,年薪50万起;除了浑水摸...

2019-03-27 10:09:12

金融行业大数据用户画像实践

1. 金融业用户画像的目的1)寻找目标用户2)参考用户画像,设计产品或者营销活动2. 金融行业用户画像的原则1)人口信息和信用信息为主2)保留强相关特征,忽略弱相关特征(金融行业主要考虑与收入、消费能力有关的特征)3)将定量特征归类为定性特征(如年轻人、中青年、高收入人群等),便于快速定位目标人群,指导业务有效开展3. 用户画像的主要维度1)人口属性:能定位到用户是谁的信息。包...

2019-03-21 12:18:14

市场主流的风控模型简要学习总结

转载自:互联网金融学习总结(5)——市场主流的风控模型简要学习总结一、市场调研目前市面主流的风控模型1、互联网金融前10名排行榜(数据截止日期2017-09-12)互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和网易理财。1.1 蚂蚁金服1.1.1 大数据技术对接第三方征信公司芝麻信用分,通过用户信用历...

2019-03-21 12:05:01

大数据风控的九种维度

转载自:互联网金融学习总结(4)——大数据风控的九种维度前言在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场。那么,大数据风控到底是怎么一回事呢?与传统风控相比,它又是怎样来进行风险识别的呢?大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联...

2019-03-21 11:59:27

在做了N个金融产品的设计后,我对互联网金融产品的设计思考

互联网金融是近年来的热门词,刚进入2017,腾讯金融、蚂蚁金融、百度金融就吹响了新的冲锋号:腾讯推出黄金红包,小马哥亲自站台指导;蚂蚁金服并购美国Money Gram并谋求上市;李彦宏在内部讲话中将金融列为2017年的四大主攻方向之间。作为一名金融市场部架构下的交互设计师,在做了N个金融产品的设计后,对互联网金融产品也有些自己的设计思考,在此抛砖引玉,希望和感兴趣的小伙伴一起探讨。一、什么是互...

2019-03-21 09:23:00

LendingClub信贷风控建模

在本项目中,目标就是利用申请人基本信息,信用卡使用交易,征信信息等数据构建甄别用户的机器学习模型。使用的数据是国际著名的p2p信贷平台lendingclub官网开放的2016年第三季度借贷人数据。数据来源:https://www.lendingclub.com/info/download-data.action该数据链接中除了有具体的信用数据,还有信用数据词典,用来解释各个特征含义,对于理...

2019-03-16 12:02:03

各种数据类型取众数的方法总结

待续!

2019-03-13 11:34:34

Python time strptime()方法

描述Python time strptime() 函数根据指定的格式把一个时间字符串解析为时间元组。语法strptime()方法语法:time.strptime(string[, format])参数string -- 时间字符串。 format -- 格式化字符串。返回值返回struct_time对象。说明python中时间日期格式化符号:%y 两位...

2019-03-12 14:28:22

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。