自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 银行流失用户分析及预测模型

自学的一个银行流失客户预警的小项目0.引言-银行流失用户分析银行客户流失是指银行的客户终止在该行的所有业务,并销号。但在实际运营中,对于具体业务部门,银行客户流失可以定位为特定的业务终止行为。商业银行的客户流失较为严重,流失率可达20%。而获得新客的成本是维护老客户的5倍。因此,从海量客户交易数据中挖掘出对流失有影响的信息,建立高效的客户流失预警体系尤为重要。客户流失的主要原因有:...

2018-08-24 22:20:08 43976 15

原创 数据分析入门--数据科学框架的搭建--05数学建模

本文基于kaggle入门项目Titanic金牌获得者的Kernel翻译而来,并对其代码进行注解原文链接https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy5.数学建模数据科学是数学(即统计学、线性代数等)、计算机科学(即程序设计语言、计算机系统等)和企业管理(即通信、主题知识等)之间的多学...

2018-06-23 11:05:30 1662

原创 数据分析入门--数据科学框架的搭建--04数据的统计性初探

        本文基于kaggle入门项目Titanic金牌获得者的Kernel翻译而来,并对其代码进行注解    原文链接https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy    现在,我们清理好数据。将应用描述性统计与图形统计探索我们的数据与总结我们的变量。在这个阶段,你将对特征进...

2018-06-23 11:05:10 364

原创 数据可视化函数-seaborn.FacetGrid

API:https://seaborn.pydata.org/generated/seaborn.FacetGrid.htmlFacetGrid用于绘制各变量之间的关系图FacetGrid画图特点:    1.具有多个轴,各个轴的变量相同    2.随着某些变量的变化,轴变量关系的变化情况。    3.可展示三个变量的条件关系,将其中的变量赋值给网格的行和列,并使用不同颜色的绘图元素。FacetG...

2018-06-14 11:06:47 3911

原创 python数据分析包:sklearn.metrics.confusion_matrix

API:http://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html计算交叉矩阵以评估分类的准确度所定义交叉矩阵C为Cij在i组中观察的观测值数量在j组的值在二进制分类中,正确的负值为C0,0,错误预测的负值为C1,0,错误的正值为C0,1,正确的正值为C1,1看个例子API里面的:&g...

2018-06-10 20:46:26 3462

原创 数据分析入门--数据科学框架的搭建--03数据预处理

本文基于kaggle入门项目Titanic金牌获得者的Kernel翻译而来,并对其代码进行注解 原文链接https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy

2018-06-08 21:18:13 490

原创 数据分析入门--数据科学框架的搭建--01、02数据科学简介

本文基于kaggle入门项目Titanic金牌获得者的Kernel翻译而来,并对其代码进行注解原文链接https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy

2018-06-08 15:53:07 373

原创 Ubuntu中安装XGboost(基于Anaconda)

https://mirror.tuna.tsinghua.edu.cn/help/anaconda/给anaconda添加国内的源,增加一下网速https://blog.csdn.net/familyshizhouna/article/details/68490068参照该文章添加命令3.在pycharm中导包File-Settings-project interpreter选择+号搜xgboos...

2018-05-29 19:44:07 1021

原创 小白数据分析准备第2.5弹---在Ubuntu中安装Anaconda

数据分析包实在是太多且难以管理,只有求助于Anaconda了1.下载安装包https://www.anaconda.com/download/#linux注意计算机位数、ubuntu安装python的版本相一致2.将下载好的脚本文件Anaconda3-5.1.0-Linux-x86_64.sh复制到ubuntu中(我安装的是虚拟机).......3.打开终端,进入安装脚本所在目录输入命令:sudo...

2018-05-28 21:31:16 479

原创 Ubuntu中VMwareTools失效导致无法复制粘贴

虚拟机强制重启后,VMware又失效了!难受想哭.........网上的教程总是这么教的.........http://blog.sina.com.cn/s/blog_5e8c26990102wh6m.html但是.............第一步:sudo apt-get autoremove open-vm-tools就告诉我,我没安装open-vm-tools所以..............就...

2018-05-28 21:13:00 9227 2

原创 小白数据分析准备第二弹-python及IDE安装

安装python3、pycharm1.首先更新一下ubuntu的源 参考https://blog.csdn.net/paincupid/article/details/52895676    是为了让以后下载东西更快一些    用的清华大学的源,听说比较好用2.python3安装    本身ubuntu是带python2的,因为我一直觉得Python2麻烦,并且python3目前是大势,所以安装一...

2018-05-25 10:56:43 573

原创 小白数据分析准备第一弹--虚拟机安装linux Ubuntu

零基础入门数据分析,大家一起进步1.已安装VMware2.新建虚拟机3.安装客户端操作系统--选择稍后安装操作系统4.选择客户端操作系统-->选择的ubuntu/ubuntu645.命名虚拟机--下一步 --处理器配置 --下一步 -- 内存设置 --自己选(我选择的默认)6.设置网络类型7.选择I/O处理器类型--下一步--选择磁盘类型--下一步--指定磁盘容量--选择将虚拟磁盘存储为单个...

2018-05-23 11:11:54 1030

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除