自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Udacity-A/B TEST

这个是之间在Udacity参与数据分析课程的项目之一。完成了有一阵子了,想着发上来以后方便复习。一.项目说明在进行此试验时,优达学城当前的主页上有两个选项:“开始免费试学”和“访问课程资料”。如果学生点击“开始免费试学”,系统将要求他们输入信用卡信息,然后他们将进入付费课程版本的免费试学。14天后,将对他们自动收费,除非他们在此期限结束前取消试用。若学生点击“访问课程材料”,他们将能够观看视频和免...

2018-04-30 10:30:14 2603

原创 GiveMeSomeCredit——信用评分卡模型

如今在银行、消费金融公司等各种贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。评分卡分为三类分别为:A卡(Application score card)申请评分卡B卡(Behavior score card)行为评分卡C卡(Collection score card)催收评分卡评分机制的区别在于:1.使用的时间不同。分别侧重贷前、贷中、贷后;2.数据要求不同。A卡...

2018-04-28 13:41:44 16096 4

原创 爬取拉勾网进行数据分析

首先用scrapy框架来写爬虫。这个爬虫代码基本是参照这里这个博主写的,我只是添加了middlewaves的部分。其实关于爬虫还有很多不明白的地方,只是了解基本原理和scrapy框架,但毕竟不是爬虫工程师,有时间再慢慢补充吧。数据获取爬虫代码如下Items:import scrapyfrom scrapy.item import Item, Fieldclass Lagou2Item(sc...

2018-04-23 22:42:34 613

原创 Kaggle-房价预测

一. 数据观察又是一道Kaggle的经典题目。首先观察一下数据:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn import ensemble, tree, linear_modelfrom sklearn.ensemble impo...

2018-04-22 15:02:00 1684

原创 泰坦尼克—逻辑回归

趁着周末比较闲,做一个几乎所有人都会做的入坑项目——大名鼎鼎的Kaggle泰坦尼克。数据地址我就不放了,Kaggle上自己翻吧。数据包括:PassengerId => 乘客IDSurvive => 乘客是否生还(仅在训练集中有,测试集中没有)Pclass => 乘客等级(1/2/3等舱位)Name => 乘客姓名Sex => 性别Age => 年龄SibSp =...

2018-04-16 22:27:03 4991 3

原创 多元线性回归分析-Python&SPSS

原始数据在这里1.观察数据首先,用Pandas打开数据,并进行观察。import numpy import pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinedata = pd.read_csv('Folds5x2_pp.csv')data.head() 会看到数据如下所示:这份数据代表了一个循环发电厂,每个数据有...

2018-04-15 00:09:49 9372 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除