- 博客(5)
- 收藏
- 关注
原创 【Datawhale第25期组队学习】Task04:基于相似度的方法
文章目录一、概念二、基于距离的度量1.基于单元的方法2.基于索引的方法三、基于密度的度量1. k-距离(k-distance(p))2. k-邻域(k-distance neighborhood)3. 可达距离(reachability distance)4. 局部可达密度(local reachability density)5. 局部异常因子 一、概念 专注于有价值的异常值。 主要思想:异常点的表示与正常点不同。 二、基于距离的度量 基于最近邻距离来定义异常值。 此类方法不仅适用于多维数值数据,在其他
2021-05-20 23:06:52 95
原创 【Datawhale第25期组队学习】Task03:线性模型
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录一、原理二、使用步骤1.引入库2.设定参数3.初始化检测器4.打印结果总结 一、原理 通过***一系列自变量去预测一个特殊因变量的值***。 真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的相关性分析。 一类相关性分析试图通过其他变量预测单独的属性值,另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归,后者
2021-05-17 22:25:28 73
原创 【Datawhale第25期组队学习】Task02:基于统计学
异常检测的统计学方法的一般思想是:学习一个拟合给定数据集的生成模型,然后识别该模型低概率区域中的对象,把它们作为异常点。即利用统计学方法建立一个模型,然后考虑对象有多大可能符合该模型。 文章目录一、概述二、参数方法2.1 基于正态分布的一元异常点检测2.2 多元异常点检测三、非参数方法四、基于角度的方法五、HBOS 一、概述 根据如何指定和学习模型,异常检测的统计学方法可以划分为两个主要类型:参数方法和非参数方法。 参数方法假定正常的数据对象被一个以 为参数的参数分布产生。该参数分布的概率密度函数 给出
2021-05-14 21:42:56 96
原创 【Datawhale第25期组队学习】Task01:异常检测概念和方法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、异常检测的基本概念1.异常类别2.任务分类&难点二、异常检测方法1. 基于统计学的方法2.线性模型3.基于邻近度的方法4.集成方法5.机器学习 前言 第一次写学习笔记,因为作业堆积有些匆忙。 正文没有全部照搬,只摘抄自己新get到的。 刚好下周该我分享论文了,所以想正好分享个跟异常检测有关的论文,结果发现论文大都是cv方向或者金融里的fraud detection,结果搜了好长时间也没找到满意的,(自己能看懂,且
2021-05-11 22:07:55 173
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人