自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习学习笔记3---感知机

感知机一、感知机(perceptron)模型这里先讲一些题外话,机器学习其实就是建立模型,通过一部分数据也就是所谓的训练集来构造函数模型,构造好就可以对新的输入实例进行直接分类,感知机模型自然也不例外。1.感知机是神经网络和支持向量机的基础。     感知机属于分类模型,感知机模型其实就是对数据进行分类。所以,依据什么来分类?这是一个最关键的问题,感知机模型最重要的就是建立这个

2017-11-06 15:44:21 975

原创 机器学习学习笔记2---k邻近算法的实现

k近邻算法的实现一.k近邻算法的内容k近邻算法(k-nearest neighbor,k-NN)   作用:用来基本分类和实现回归   内容:给定一个训练数据集,对新的输入实例,在整个训练数据集中找到与该输入实例最近的k个实例,这k个实例的最多数属于哪个类,就把该输入实例分为这个类。   三要素:1.距离度量:何为最近?距离最近,如何确定距离最近?生活中最常使用的是欧式距离,另

2017-10-28 09:35:37 311

原创 机器学习学习笔记1

1支持向量机:这个名字强调了此类学习器的关键是如何从支持向量构建出解,同时也暗示其复杂度与支持向量的个数有关。2支持向量机的一个重要性质:训练完成后,大部分的训练样本都不需保留,最终模型仅与支持向量有关。

2017-10-10 15:47:44 222

原创 数据挖掘概念与技术第三版 范明 孟晓峰译 第四章习题答案

4.1查询驱动的方法需要复杂的信息过滤和集成处理,这种方法是低效的,并且对于频繁的查询,开销可能很大。而更新驱动将来自多个异构源的信息预先集成,并存储在数据仓库中,供直接查询和分析,并且还支持复杂的多维查询,优势明显,因此更获得工业界的青睐。     很明显,当异构数据库数量较少时,查询开销本来就不大,查询驱动的方法就很容易进行查询分析,而构建数据仓库的代价依然很大,再使用更新驱动就得不偿失了

2017-10-05 17:11:21 9902

原创 数据挖掘概念与技术第三版 范明 孟晓峰译 第四章 数据仓库与联机分析处理学习笔记

1.数据仓库:一个数据集合,四个特点:面向主题的(指面向具体应用)、集成的(指是多个数据库数据集成在一起)、时变的(数据来自历史多个时间范围)、非易失的(分离存放数据,不需要事务处理,数据不容易丢失)。2.联机事务处理(OLTP)与联机分析处理(OLAP)的最原始区别:  OLTP面向顾客,主要用于对单条数据的增删改查操作;OLAP面向市场,主要是对集中的大量数据进行分析处理。3.元数

2017-10-04 15:04:06 1213

原创 数据挖掘概念与技术第三版 范明、孟晓峰译 第三章习题答案

3.1 例子:相对于一个80%地址正确的数据库,市场分析人员要使用数据进行目的营销,对数据的准确性总体上还能接受;但对于销售人员来说,要利于数据进行一对一推销,对这样的数据则完全不能接受。       可信性:反映用户信赖的数据规模;       可解释性:反映数据是否容易理解。3.2 处理元祖属性缺失值的方法:1忽略此元祖:适合于多属性缺失;2人工填写缺失值:数据量较小时;3使用一个

2017-10-03 08:53:21 8036 1

原创 阿里的味道

前一段时间,刚刚参加了阿里的笔试,真心说选择题不太难,感觉他们最重要看重的是逻辑分辨能力,

2016-04-30 17:59:02 465

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除