自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python数据科学

专注数据科学,分享数据分析,数据挖掘博文。

  • 博客(82)
  • 资源 (1)
  • 收藏
  • 关注

原创 再见,可视化!你好,Pandas!

来源:Python数据科学作者:东哥起飞用Python做数据分析离不开pandas,pnadas更多的承载着处理和变换数据的角色,pands中也内置了可视化的操作,但效果很糙。因此,大家在用Python做数据分析时,正常的做法是用先pandas先进行数据处理,然后再用Matplotlib、Seaborn、Plotly、Bokeh等对dataframe或者series进行可视化操作。但是说实话,每个可视化包都有自己独特的方法和函数,经常忘,这是让我一直很头疼的地方。好消息来了!从最新的pand..

2020-10-16 09:43:44 371

原创 从机械转行数据科学,吐血整理了这些白嫖的学习网站

作者:东哥起飞Python数据科学大家好,我是东哥。前方高能,准备开启收藏夹吃灰模式。本篇东哥分享几个数据科学入门的学习网站,全部免费资源,且内容优质,是小白入门的不二选择。东哥当年从机械转行也从这些学习网站收获很多。下面开始进入正题。一、Kaggle什么是Kaggle?kaggle是全球最先也是目前规模最大的数据科学竞赛组织了。之所以这么受欢迎,是因为很多大的公司奉献出自家真实的数据给kaggle,提出真实业务场景面临的痛点,需要数据科学上的解决方案。我个人觉得是非常有意思的,因为.

2020-06-20 09:42:54 1768

原创 太香了!墙裂推荐 6 个Python数据分析神器!!

作者:xiaoyu,数据爱好者Python数据科学用Python处理数据大家都不陌生了,属常规操作,但常规之下还是也有些暗藏技巧的,本篇东哥分享6个好玩高效的操作,帮助大家提高效率。一、Pandas ProfilingPandas Profiling提供数据的一个整体报告,是一个帮助我们理解数据的过程。它可以简单快速地对Pandas的数据框数据进行探索性数据分析。其实,Pandas中df.describe()和df.info()函数也可以实现数据探索过程第一步。但它们只提供了对数据非常基本的概.

2020-06-14 18:50:31 1177

原创 太赞了!分享一个数据科学利器 PyCaret,几行代码搞定从数据处理到模型部署

作者:xiaoyu,数据爱好者Python数据科学出品学习数据科学很久了,从数据探索、数据预处理、数据模型搭建和部署这些过程一直有些重复性的工作比较浪费时间,尤其当你有个新的想法想要快速尝试下效果的时候,效率很低。东哥最近发现一个开源的Python机器学习库,名字叫PyCaret,这个轮子正好可以为了解决我刚才所描述的困扰,它的特点是以low-code低代码量来快速解决从数据预处理到模型部署的整个流程。用了一下感觉确实有点香,因此也和大家分享一下。PyCaret是什么?PyCaret是一个.

2020-06-07 20:27:55 2562 6

原创 Python初学者福音!每30秒学会一个Python小技巧,Github星数4600+

作者:xiaoyu,数据爱好者Python数据科学出品很多学习Python的朋友在项目实战中会遇到不少功能实现上的问题,有些问题并不是很难的问题,或者已经有了很好的方法来解决。当然,孰能生巧,当我们代码熟练了,自然就能总结一些好用的技巧,不过对于那些还在刚熟悉Python的同学可能并不会那么轻松。本次给大家推荐一个学习这些技巧的很好的资源 30-seconds-of-python,所有技...

2020-05-03 20:57:51 1752 1

原创 还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法

作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析师前言当大家谈到数据分析时,提及最多的语言就是Python和SQL。Python之所以适合数据分析,是因为它有很多第三方强大的库来协助,pandas就是其中之一。pandas的文档中是这样描述的:“快速,灵活,富有表现力的数据结构,旨在使”关系“或”标记“数据的使用既简单又直观。”我们知道pandas的...

2019-02-12 20:19:56 5798 1

原创 入门Python数据分析最好的实战项目(二)建模篇

作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析上一篇和大家分享了一个入门数据分析的一个小项目 北京二手房房价分析,链接如下:数据分析实战—北京二手房房价分析文章在sf发布之后看到有不少感兴趣的朋友给我点了赞,感谢大家的支持了。本篇将继续上一篇数据分析之后进行数据挖掘建模预测,这两部分构成了一个简单的完整项目。结合两篇文章通过数据分析和挖掘的方...

2018-12-25 16:24:33 9085 8

原创 入门Python数据分析最好的实战项目(一)分析篇

作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析非经作者允许,禁止任何商业转载。目的:本篇给大家介绍一个数据分析的初级项目,目的是通过项目了解如何使用Python进行简单的数据分析。数据源:博主通过爬虫采集的链家全网北京二手房数据(公众号后台回复 二手房数据 便可获取)。目录数据初探数据可视化分析总结数据初探首先导入要使用...

2018-12-24 14:51:15 19255 18

原创 【机器学习笔记】:一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC

作者:xiaoyu微信公众号:Python数据科学知乎:python数据分析非经作者允许,禁止任何商业转载。ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是好多朋友都遇到了一个相同的问题,那就是:每次看书的时候都很明白,但回过头就忘了,经常容易将概念弄混。还有的朋友面试之前背下来了,但是一紧张大脑一片空白全...

2018-10-14 12:27:38 19754 16

原创 转行数据分析的亲身经历

作者:xiaoyu微信公众号:Python数据科学知乎:Python数据分析最近生活上确实有点忙,不过后续将恢复正常。今天和大家聊一个非技术性的话题:转行。全篇无代码,但是我想对于这个话题,很多朋友都非常感兴趣,毕竟工作伴随着我们的一生,也是主要的收入来源,谁不想找一份高薪又有前景的工作呢? 是否要转行?    有些朋友对于是否该转行一直抱有迟疑态度,转行会不会有风险啊,转行以...

2018-07-28 18:38:31 20216 5

原创 给Python初学者的最好练手项目

作者:xiaoyu微信公众号:Python数据科学知乎:Python数据分析有很多朋友问我学习了Python后,有没有什么好的项目可以练手。其实,做项目主要还是根据需求来的。但是对于一个初学者来说,很多复杂的项目没办法独立完成,因此博主挑选了一个非常适合初学者的项目,内容不是很复杂,但是非常有趣,我相信对于初学者小白来说是再好不过的项目了。这个项目中,我们将要建立一个比特币价格的提...

2018-05-01 23:12:32 15967 2

原创 风控迁徙率报表逻辑和开发(Python)

什么是迁徙率呢?我们说,一个账户现在处于某一逾期状态(比如M1),一个月后,这个账户要么从良为M0状态,要么恶化为更坏的下一个逾期状态M2。迁徙率表示上一个阶段有多少比例的逾期金额会向下一个逾期阶段继续转化,它描述了逾期状态向后恶化的程度。一般用 M(n-1)-M(n) 的形式表示,例如:M0-M1 = 当月进入M1的贷款余额 / 上月末M0的贷款余额M1-M2 = 当月进入M2的贷款余额 / 上月末M1的贷款余额。

2024-04-15 11:05:12 633

原创 Vintage账龄分析表计算底层逻辑(Python实操)

大家好,我是东哥。信贷风控领域中,经常用到账龄Vintage报表,这是入门初学者的难点之一,因为它涉及到用户还款、逾期等多种行为以及业务上的多种统计口径,因此很多朋友一直无法将逻辑梳理清楚。本次来给大家详细介绍Vintage报表的底层计算逻辑是什么样的。出品人:东哥起飞原创:👉原创大数据风控课程《

2024-03-16 10:20:43 1166

原创 CART决策树暴力生成风控规则(Python代码)

上一篇我们介绍了决策树节点信息更新的方法,以辅助我们制定风控规则,可视化的方法比较直观,适合做报告展示,但分析的时候效果没那么高。本篇我们介绍一种通过决策树自动挖掘规则的方法。出品人:东哥起飞原创:👉原创大数据风控课程更新100期以上。

2024-03-16 10:12:25 940

原创 风控规则决策树可视化(升级版)

上一篇我们介绍了如何通过交叉表来生成规则,本篇我们来介绍一种可以生成多规则的方法,决策树。除了做模型以外,也可以用来挖掘规则,原理是一样的。下面通过sklearn的决策树方法来实现风控规则的发现,同时分享一种可以更新决策树节点信息的方法,以辅助制定风控规则。出品人:东哥起飞原创:👉原创大数据风控课程《

2024-03-10 15:13:10 816

原创 基于交叉表生成风控规则(Python)

大家好,我是东哥。规则是风控策略中最常用的工具之一,生成、筛选、监控、调优,几乎每天都在打交道,本篇来介绍如何基于交叉表来生成风控规则,并且如何基于评估指标进行筛选。出品人:东哥起飞专栏:《

2024-03-08 23:26:23 720

原创 风控实战:用Python实现vintage报表

大家好,我是东哥。本篇继续分享风控的内容,关于如何用python实现vintage报表及可视化图的实战。账龄分析(vintage)是风控中非常重要的报表之一,通过它可以将不同月份的资产数据拉齐对比贷后表现,也可以用于指导制定风控模型Y标签的成熟表现期。那么账龄分析是如何做的呢?账龄分析需要客户的还款计划表数据,即客户历史的还款记录,包括放款金额、每期到期日期、每期还款日期、每期应该金额、每期实还金额、期数等等。基于这些数据就可以做出vintage报表,以及相应的可视化图。

2023-12-20 18:33:49 787

原创 pandas 分类数据处理大全(附代码)

大家好,我是东哥。继续更新pandas数据清洗,历史文章:感兴趣可以关注这个话题:pandas数据清洗,第一时间看到更新。所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataSciencecategory是pandas的一种分类的定类数据类型。和文本数据.str.<methond>一样,它也有访问器功能.cat.<method>。本文将介绍:什么是分类数据?分类数据cat的处理方法为什么要使用

2022-03-21 18:37:50 3771

原创 pandas 文本处理大全(附代码)

大家好,我是东哥。继续更新pandas数据清洗,历史文章:pandas 缺失数据处理大全(附代码)pandas 重复数据处理大全(附代码)感兴趣可以关注这个话题pandas数据清洗,第一时间看到更新。所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataScience本次来介绍关于文本处理的常用方法。文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。

2022-02-27 23:02:21 2959

原创 pandas 重复数据处理大全(附代码)

大家好,我是东哥。继续更新pandas数据清洗,上一篇说到缺失值的处理。链接:pandas 缺失数据处理大全(附代码)感兴趣可以关注这个话题pandas数据清洗,第一时间看到更新。所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataScience本次来介绍重复值处理的常用方法。重复值处理主要涉及两个部分,一个是找出重复值,第二个是删除重复值,也就是根据自己设定的条件进行删除操作。定位重复值对于重复值,我们首先需要查看这

2022-02-27 22:59:30 609

原创 pandas 缺失数据处理大全(附代码)

大家好,我是东哥。之前一直在分享pandas的一些骚操作:pandas骚操作,根据大家反映还不错,但是很多技巧都混在了一起,没有细致的分类,这样不利于查找,也不成体系。利用闲暇之余将有关数据清洗、数据分析的一些技能再次进行分类,里面也包含了我平时用到的一些小技巧,此次就从数据清洗缺失值处理走起,链接:pandas数据清洗,关注这个话题可第一时间看到更新。所有数据和代码可在我的GitHub获取:https://github.com/xiaoyusmd/PythonDataScience如有帮助,

2022-01-10 22:40:52 2819

原创 一文读懂异常检测 LOF 算法(Python代码)

大家好,我是东哥。本篇介绍一个经典的异常检测算法:局部离群因子(Local Outlier Factor),简称LOF算法。一、背景Local Outlier Factor(LOF)是基于密度的经典算法(Breuning et. al. 2000), 文章发表于 SIGMOD 2000, 到目前已经有 3000+ 的引用。在 LOF 之前的异常检测算法大多是基于统计方法的,或者是借用了一些聚类算法用于异常点的识别(比如 ,DBSCAN,OPTICS)。这些方法都有一些不完美的地方:基于统计的方法

2021-12-21 23:55:18 4615 1

原创 一文读懂层次聚类(Python代码)

大家好,我是东哥。本篇想和大家介绍下层次聚类,先通过一个简单的例子介绍它的基本理论,然后再用一个实战案例Python代码实现聚类效果。首先要说,聚类属于机器学习的无监督学习,而且也分很多种方法,比如大家熟知的有K-means。层次聚类也是聚类中的一种,也很常用。下面我先简单回顾一下K-means的基本原理,然后慢慢引出层次聚类的定义和分层步骤,这样更有助于大家理解。层次聚类和K-means有什么不同?K-means 工作原理可以简要概述为:决定簇数(k)从数据中随机选取 k 个点作为质心将所

2021-11-21 21:24:54 11400 3

原创 pandas GUI 神器 D-Tale,可视化操作自动转代码

大家好,我是帅东哥。关于pandas的GUI工具,我之前介绍过pandasgui。可以说,有了GUI可视化界面,操作就和Excel一样简单,本次再介绍一款功能强大的GUI神器:D-Tale。这个库的名字为啥要D-Tale呢?东哥还信还去查了下,它是detail的谐音,初衷是要提供数据的所有详细信息。下面介绍下如何使用它。关于pandas精选的系列内容,可以看看我的专栏:pandas骚操作系列启动、数据加载D-Tale支持多种文件格式,包括CSV、TSV、XLS、XLSX。它是一个以Flask 为后

2021-11-13 14:15:23 1142

原创 JupyterLab 出 Windows 桌面版了!

大家好,我是东哥。Jupyter最近迎来了一个劲爆的更新:JupyterLab 发布了桌面APP版本!知道后第一时间码字来告诉大家。要知道之前都是在网页上的,这次直接发布了桌面版,对于我这个爱好者来说,简直是YYDS!JupyterLab AppJupyterLab App是JupyterLab的一个跨平台的独立应用,前端捆绑JupyterLab,后端捆绑conda作为JupyterLab App的server服务,然后打包成一个Electron应用。因此,它是需要conda环境依赖的。原理实现上

2021-09-28 00:00:28 840 4

原创 LightGBM+OPTUNA超参数自动调优教程(附代码框架)

大家好,我是帅东哥。原创系列持续更新,欢迎微信搜一搜「 Python数据科学」阅读机器学习系列文章。最近在kaggle上有一个调参神器非常热门,在top方案中频频出现,它就是OPTUNA。知道很多小伙伴苦恼于漫长的调参时间里,这次结合一些自己的经验,给大家带来一个LGBM模型+OPTUNA调参的使用教程,这对可谓是非常实用且容易上分的神器组合了,实际工作中也可使用。关于LightGBM不多说了,之前分享过很多文章,它是在XGBoost基础上对效率提升的优化版本,由微软发布的,运行效率极高,且准确度不降

2021-09-12 13:51:55 4775 5

原创 再见 CSV,速度提升 150 倍!

大家好,我是东哥。前几天有个粉丝留言,说pandas的100个骚操作系列为什么只有21个啊?这里和大家说一下,这个系列「pandas100个骚操作」还在持续更新中。由于平时工作较忙,更新稍慢,不过还是在一直更新的。我的原计划是输出100个,目前来看可能最终不一定会到100个,但每个都是超实用且平时经常会遇到的问题。pandas的用法太多了,如果不熟练,平时是需要经常网上查找的,这个系列可以帮助大家快速回忆用法。或者万一平时遇到问题查不到无法解决,也可以过来看下,毕竟某度上是查不到微信文章的。该系列预

2021-09-10 00:34:35 1113 1

原创 20 个短小精悍的 pandas 骚操作

大家好,我是东哥啊。本次为大家准备了一个pandas实用操作的大集合,共25个功能,个个短小精悍,一次让你爱个够。系列内容,请看???? pandas骚操作系列1. ExcelWriter很多时候dataframe里面有中文,如果直接输出到csv里,中文将显示乱码。而Excel就不一样了,ExcelWriter是pandas的一个类,可以使dataframe数据框直接输出到excel文件,并可以指定sheets名称。df1 = pd.DataFrame([["AAA", "BBB"]], colum

2021-08-07 11:24:19 846 2

原创 Toad:基于 Python 的标准化评分卡模型

大家好,我是东哥。在信贷的风控模型中最常用、最经典的可能要属评分卡了,所谓评分卡就是给信贷客户进行打分,按照不同业务场景可为贷前、贷中、贷后和反欺诈,一般叫做ABCF卡。模型得到分数,通过设置cutoff阈值给出评估结果,结果可直接用于通过或拒绝,或者用于策略应用。区别于xgb等机器学习模型,评分卡使用逻辑回归,之所是还在使用时因为它属于广义线性回归,在特征的解释性上非常的强。本次和大家分享一个开源的评分卡神器toad。从数据探索、特征分箱、特征筛选、特征WOE变换、建模、模型评估、转换分数,都做了完

2021-07-31 18:34:57 7048 2

原创 好习惯!pandas 8 个常用的 index 索引设置

大家好,我是东哥呀!本篇是pandas100个骚操作系列的第 18 篇:8个常用的index设置系列内容,请看上面专栏,或者订阅????「pandas100个骚操作」在数据处理时,经常会因为index报错而发愁。不要紧,本次来和大家聊聊pandas中处理索引的几种常用方法。1.读取时指定索引列很多情况下,我们的数据源是 CSV 文件。假设有一个名为的文件data.csv,包含以下数据。date,temperature,humidity07/01/21,95,5007/02/21,94,55

2021-07-31 17:42:19 2902 1

原创 2021斯坦福大学计算机系完整课程列表

大家好,我是东哥呀。这次要和大家推荐个良心学习资源:斯坦福公开课。这所名校想必也不用我过多介绍了,CS专业相当的强悍,之所以能够成为公开课,是因为无论从师资,教学方法,还是课程质量都已经足够优秀了,公开出来可以帮助更多没有学习机会的人。因此,如果你没有机会去名校学习,也在从事相关工作,不如看看它的公开课。下面这份列表是知乎@成为文艺复兴人从 Hackernews 上看到一份比较完整的 stanford 的计算机课程列表,共 88 门课,包括人工智能、编程、计算机系统、计算机网络、数据库、算法、机器人、

2021-07-14 23:35:37 3093 8

原创 微软太良心,这次对机器学习下手了!

大家好,我是东哥。不得不说,微软的开源太给力了。从我的角度来看,VScode让我非常之爱,用着不要太香。还有很多开源的神器,包括自动化、可视化、机器学习、深度学习。。等等,不断输出。当然以上都是工具类的,关于课程类的也有很多,比如之前微软对Python就开源过学习课程,链接如下:https://docs.microsoft.com/zh-cn/windows/python/而这次微软的矛头终于指向了机器学习,最近又开源了一个非常棒的课程:面向初学者的机器学习课程(ML-For-Beginners

2021-07-11 16:39:13 295

原创 基于 Python 的 8 种常用抽样方法

大家好,我是东哥。今天来和大家聊聊抽样的几种常用方法,以及在Python中是如何实现的。抽样是统计学、机器学习中非常重要,也是经常用到的方法,因为大多时候使用全量数据是不现实的,或者根本无法取到。所以我们需要抽样,比如在推断性统计中,我们会经常通过采样的样本数据来推断估计总体的样本。上面所说的都是以概率为基础的,实际上还有一类非概率的抽样方法,因此总体上归纳为两大种类:概率抽样:根据概率理论选择样本,每个样本有相同的概率被选中。非概率抽样:根据非随机的标准选择样本,并不是每个样本都有机会被选

2021-06-26 22:50:58 5201 5

原创 pandas100个骚操作七:8 个常用的 set_option 设置方法

大家好,我是东哥。本篇是pandas100个骚操作系列的第 17 篇:8个常用的set_option系列内容,请看????「pandas100个骚操作」通过pandas的使用,我们经常要交互式地展示表格(dataframe)、分析表格。而表格的格式就显得尤为重要了,因为大部分时候如果我们直接展示表格,格式并不是很友好。其实呢,这些痛点都可以通过pandas的option来解决。短短几行代码,只要提前配置好,一次设置好,全局生效,perfect!# 使用方法import pandas as pd

2021-06-22 10:28:06 1212

原创 详解贝叶斯学派与频率学派的区别和联系

大家好,我是东哥。要说贝叶斯和频率学派,那简直太有意思了。为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战。我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习下来,说实话感觉有点懂了,但又感觉没理解透。后面我一直是带着这种似懂非懂的状态继续肝机器学习。但随着不断深入学习我发现很多理论其实都有出现两个学派的身影,而且在模型算法层面结合两派不断琢磨对我的理解有了很大帮助,经常有茅塞顿开的感觉(那段日子真的进步的飞起)。虽说我有点笨,但好在经过时间

2021-06-06 00:13:53 10095 2

原创 爱了,吹爆这个高颜值的流程图工具!

大家好,我是东哥。说起流程图可能大家第一个想到Viso,功能是很强大,但也有一些弊端:需要付费无法跨平台使用之前东哥就分享过一些在线的流程图软件了,比如draw.io和processon,功能上丝毫不比商业软件差,而且更加便捷、不占据硬盘空间,同时支持团队协同。本次再给大家分享一个强大的流程图工具 Excalidraw,可以把它当作一个虚拟的白板,风格更偏向于手绘,通过简单地“托拉拽”即可完成流程图。下面我们一起看下Excalidraw的功能:1、手绘草图Excalidraw 是web上在

2021-06-03 16:00:13 876

原创 Bokeh可视化图表使用教程

大家好,我是东哥。本篇是关于如何使用 Bokeh 的快速教程,首发于公众号:Python数据科学。Python交互式可视化库Bokeh在现代web浏览器中支持大型数据集的高性能可视化表示。Bokeh 的目标是使用 D3.js 样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能。Boken 可以快速的创建交互式的绘图,仪表盘和数据应用。绘图界面以两个主要组件为中心–数据和符号。开始前,先欣赏下bokeh图形之美:化学元素周期表物理洛伦茨吸引子数学正弦曲线生物细菌极坐标图

2021-05-31 15:57:14 1728

原创 数据挖掘实战:个人信贷违约预测

大家好,我是东哥。本次分享一个数据挖掘实战项目:个人信贷违约预测,此项目对于想要学习信贷风控模型的同学非常有帮助,本文首发于公众号:Python数据科学,作者云朵君。一、个人征信预测模型1、项目背景当今社会,个人信贷业务发展迅速,但同时也会暴露较高的信用风险。信息不对称在金融贷款领域突出,表现在过去时期借款一方对自身的财务状况、还款能力及还款意愿有着较为全面的掌握,而金融机构不能全面获知借款方的风险水平,或在相关信息的掌握上具有明显的滞后性。这种信息劣势,使得金融机构在贷款过程中可能由于风险评估与实

2021-05-26 15:27:54 4044 2

原创 新编辑神器nbterm,可以在终端运行 Jupyter Notebook

脾气有点爆,干货有点多,微信搜索【Python数据科学】关注这个自学转行数据分析的程序员。本文由作者东哥起飞原创,未经授权禁止转载。嗨,大家好,我是东哥。在我初学Python的时候,一直惯用着安装式的编辑器软件,比如PyCharm和Spyder。并且,一直以为编辑器都是这种形式的,有的区别只是体验和功能上的差异。直到我后来遇到了Jupyter Notebook,发现它是基于web来运行代码的,并且可以还写markdown的文本,打破我对编辑器的认识。然而,最近发现了一个新的Jupy...

2021-05-09 08:28:43 710 1

原创 该死!B 站上这些 Python 视频真香!

脾气有点爆,干货有点多,微信搜索【Python数据科学】关注这个自学转行数据分析的程序员。本文由作者东哥起飞原创,未经授权禁止转载。嗨,大家好,我是东哥。无论什么时候,都有初学者存在找不到学习资源的困惑。其实呢,一般通过百度、知乎估计也都能找到个的结果,不过质量可能就会层次不齐了。像知乎上有些回答还是蛮良心的,推荐一些好的书籍或者学习链接,百度的话。。广告多不说,而且很多时候搜索出来的结果都不专业或者重复率极高,需要很长时间去甄别。所以这里不得不再次提一下b站了,真的是越来越香了,...

2021-04-16 17:06:36 2363

P2P金融评分卡模型.pdf

产品定价:按照模型计算的通过率给申请信息定价 • 流程简化:通过模型分类,降低审核人员的工作量 • 精准营销:通过分析信贷员的准过率,同样类型的信息优先推荐 给放款审核宽松的信贷员 • 商业模式拓展:对通过率高的客户,可直接推荐给B端,放款收 佣金 • 上述策略的应用基础建立在模型精准的基础上,现有的模型需要 新的数据迭代验证和迭代开发。

2020-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除