自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 房价模型构建实战(四)——模型选择

我们使用GridSearch对xgboost进行调参。首先先导入我们需要使用的包。from sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import KFold, cross_val_scoreimport xgboost as xgb我们通过以前主观判断和以前的经验来挑选出一些重要的参数...

2020-01-15 23:21:01 330

原创 task05 字符串

1.无重复字符的最长子串def MaxSubStringLength(self,string): start = 0 maxlen = 0 maxsubstring = {} for i in range(len(string)): cur = string[i] if cur in maxsubstring.keys(): ...

2020-01-14 23:48:32 162

原创 Task04:队列

模拟银行服务完成程序代码。目前,在以银行营业大厅为代表的窗口行业中大量使用排队(叫号)系统,该系统完全模拟了人群排队全过程,通过取票进队、排队等待、叫号服务等功能,代替了人们站队的辛苦。排队叫号软件的具体操作流程为:1.顾客取服务序号当顾客抵达服务大厅时,前往放置在入口处旁的取号机,并按一下其上的相应服务按钮,取号机会自动打印出一张服务单。单上显示服务号及该服务号前面正在等待服务的人数。...

2020-01-13 22:53:39 234

原创 初级算法梳理(三)——逻辑回归

理论部分1.逻辑回归与线性回归的联系与区别2.模型建立:逻辑回归原理、逻辑回归模型3. 学习策略:逻辑回归损失函数、推导及优化4.算法求解:批量梯度下降5.正则化与模型评估指标6.逻辑回归的优缺点7.样本不均衡问题8.sklearn参数详解import numpy as npimport pandas as pdimport matplotlib.pyplot as plt...

2020-01-13 22:34:46 199

原创 房价模型构建实战(三)——特征工程

1.1 特征合并1.2 计算统计特征1.3 groupby方法生成统计特征1.4 聚类方法1.5 log平滑2.1 相关系数法2.2 Wrapper2.3 Embedded2.4 基于树模型的特征选择法...

2020-01-12 23:45:14 220

原创 初级算法梳理(二)——线性回归

1、线性回归线性:输入和输出变量之间的关系为一次方函数,即在空间上是一条直线。回归:在模型(函数、关系式、映射关系等)中输入数据,输出的结果是连续的值,这个过程叫回归。ps:回归是典型的监督学习。线性回归:在N维空间中使用直线方程拟合数据的过程。2、损失函数损失函数(Loss Function):度量单样本预测的错误程度,损失函数值越小,模型就越好。代价函数(Cost Function...

2020-01-11 21:59:58 768

原创 Task03:栈与递归

1. 栈的定义与操作1.1 栈的定义插入(入栈)和删除(出栈)操作只能在一端(栈顶)进行的线性表。即先进后出(First In Last Out)的线性表。1.2 栈的操作入栈操作:将数据元素值插入栈顶。出栈操作:移除栈顶的数据元素。是否为空:判断栈中是否包含数据元素。得到栈深:获取栈中实际包含数据元素的个数。清空操作:移除栈中的所有数据元素。获取栈顶元素。1.3 栈的实...

2020-01-10 22:05:11 309

原创 房价模型构建实战(二)——数据清理

1.缺失值处理    缺失值的处理手段大体可以分为:删除、填充、映射到高维(当做类别处理)。    根据任务一,直接找到的缺失值情况是pu和pv;但是,根据特征nunique分布的分析,可以发现rentType存在"–“的情况,这也算是一种缺失值。    此外,诸如rentType的"未知方式”;houseToward的"暂无数据"等,本质上也算是一种缺失值,但是对于这些缺失方式,我们可以把...

2020-01-09 22:05:11 171

原创 Task02 顺序表和链表

1、合并两个有序链表将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例:输入:1->2->4, 1->3->4输出:1->1->2->3->4->4def mergetwoLists(self, l1, l2): if l1 is None: ret...

2020-01-08 22:14:37 124

原创 初级算法梳理(一)——机器学习综述

机器学习概述1.机器学习分类1.1 监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。监督学习的训练集要求包括输入和输出,主要应用于分类和预测。1.2 非监督学习:从数据集中发现隐含的某种结构,获得样本数据的结构特征,判断哪些数据比较相似。1.3半监督学习监督学习和非监督学习的结合,其在训练阶段使用的是未标记的数据和已标记的数据,...

2020-01-08 21:32:18 301

原创 房价模型构建实战(一)——赛题分析

认识数据在构建模型前或者在数据分析前需要对数据有个清楚的认识,无论是对于数据竞赛还是企业项目,对于数据的认识往往是第一位的,这直接影响到最终的结果。本文是利用一个竞赛向大家进行介绍的,故根据比赛背景介绍如何对数据进行认识。了解比赛的背景、知道你要构建的模型种类。比赛要求参赛选手根据给定的数据集,建立模型,预测房屋租金。数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户...

2020-01-07 20:33:33 445

原创 Task01:数组

理论部分理解数组的存储与分类。 实现动态数组,该数组能够根据需要修改数组的长度。练习部分1. 利用动态数组解决数据存放问题编写一段代码,要求输入一个整数N,用动态数组A来存放[2,N]之间所有5或7的倍数,输出该数组。示例:输入:N = 100 输出:5 7 10 14 15 20 21 25 28 30 35 40 42 45 49 50 55 56 60 63...

2020-01-06 23:53:30 179

原创 对最大子列和的深度研究

对于最大子列和的问题,大家应该都很熟悉了。用DP算法能很快速简便的求出SUM的问题,但对于子列的开头和结尾,还是一个值得深究的问题。   一、不要求开头,结尾序号 ,只要求值的情况  以PTA上的测试点为例:  其实难点在于数列全为0、全为负、0与负混合的三种情况。若全0,则输出为0 0 0;若全为负,则 0 a[0],a[n-1]若0负混合,则 0 0 0。那么我们很自然想到

2017-10-26 20:56:20 163

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除