1 今天你DEBUG了吗

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 18w+

【转载】增长黑客思维导图

2020-10-21 10:57:43

数据挖掘-理论与算法(公开课笔记二)

目录6.1 Clustering 聚类6.1.1 Unsupervised Learning 无监督学习6.2.1 Clustering Algorithm 聚类算法6.3.1 EM Method 期望最大法6.4.1 Density/Hierarchical Based Methods 密度与层次7 Assocation Role 关联规则7.1.1 Assocation Role 关联规则7.2.1 Support&Confidence of Association Role 支持度 置信度7.

2020-08-17 15:41:09

数据挖掘-理论与算法(公开课笔记一)

目录2 Data Preprocessing 数据预处理2.1.1 Data Cleaning 数据清洗2.2.1 Outliers & Duplicate detection 异常值与重复检测2.3.1 Type conversion & sampling 类型转换与采样2 Data Preprocessing 数据预处理2.1.1 Data Cleaning 数据清洗获取的数据可能不可用,存在缺数据、数据错误、噪音等问题,这些都会导致程序无法运行。因此在处理之前要进行清洗等操作。

2020-08-11 18:22:46

有序/无序分类变量的统计推断

有序/无序分类变量的统计推断1 有序分类变量的统计推断——非参数检验1.1 非参数检验概述1.2 两个配对样本的非参数检验1.3 两个独立样本的非参数检验1.4 多个独立样本的非参数检验1.5 多个配对样本的非参数检验2 无序分类变量的统计推断——卡方检验2.1 卡方检验概述2.2 单样本案例:考察抽样数据的性别分布2.3 两样本案例:不同收入级别家庭的轿车拥有率比较2.4 一致性检验与配对卡方检验2.5 分层卡方检验1 有序分类变量的统计推断——非参数检验1.1 非参数检验概述如果想要检验两个正..

2020-08-04 19:22:47

连续变量的统计推断

连续变量的统计推断1 t检验1.1 t检验概述1.2 成组设计两样本均数的比较1 t检验1.1 t检验概述在针对连续变量的统计推断方法中,最常用的有t检验和方差分析两种,其中t检验是最基本的检验方法。对于X‾\overline{X}X - μ 仅看这一个数字很难判断出这种差异究竟是大是小。为此需要找到某种方式对这一差值进行标准化。标准化的思路是将该差值除以某种表示离散程度的指标。标准化变换:其中,样本均数X‾\overline{X}X的分布规律为正态分布n(μ,σ2/N),U检验看上去虽然很好

2020-08-03 19:19:40

分布类型的检验

分布类型的检验1 假设检验的基本思想1.1 假设检验的标准步骤1.2 假设检验的两类错误2 正态分布检验2.1 K-S 检验的原理2.2 案例3 二项分布检验3.1 二项分布检验的原理3.2 案例4 游程检验4.1 游程检验原理4.2 案例5 蒙特卡罗方法5.1 蒙特卡罗方法原理1 假设检验的基本思想1.1 假设检验的标准步骤小概率事件(发生概率很小,如P<=0.05)小概率反证法原理:对于一个小慨率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试..

2020-08-01 15:58:00

连续变量的统计描述与参数估计

连续变量的统计描述与参数估计1 连续变量的统计描述1.1 集中趋势的描述指标1.2 离散趋势的描述指标1.3 正态分布的描述指标2 连续变量的参数估计2.1 正态分布2.2 参数的点估计2.3 参数的区间估计3 Bootstrap方法1 连续变量的统计描述1.1 集中趋势的描述指标算数平均数中位数截尾均数1.2 离散趋势的描述指标全距/极差方差或标准差百分位数、四分位数和四分位间距百分位数Px是一种位置指标,Px将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-..

2020-07-31 15:24:59

《数据挖掘与数据化运营实战》(第13章)

《数据挖掘与数据化运营实战》(第13章)13 漏斗模型和路径分析13.1 网络日志和布点13.2 漏斗模型与路径分析的主要区别与联系13.3 漏斗模型的主要应用场景13.4 路径分析的主要应用场景13.5 路径分析的主要算法13 漏斗模型和路径分析在互联网数据化运营实践中,有一类数据分析应用是互联网行业所独有的,那就是漏斗模型和路径分析的应用。漏斗模型通常是对用户在网页浏览中一些关键节点的转化程度所进行的描述,比如从浏览到实际购买产品都需要经历三个步骤:浏览商品、将商品加入到购物车、将购物车的东..

2020-07-27 19:02:04

《数据挖掘与数据化运营实战》(第11-12章)

《数据挖掘与数据化运营实战》(第11-12章)11 用户特征分析的典型应用和技术小窍门11.1 用户特征分析所适用的典型业务场景11.2 用户特征分析的典型分析思路和技术11.3 特征提炼后的评价体系12 运营效果分析的典型应用和技术小窍门12.1 为什么要做运营效果分析12.2 统计技术在数据化运营中最重要最常见的应用12.2.1 为什么要进行假设检验?12.2.2 假设检验的基本思想12.2.3 T检验12.2.4 方差分析12.2.5 多个样本组的非参数检验12.2.6 卡方检验12.2.7 控制..

2020-07-27 17:21:44

《数据挖掘与数据化运营实战》(第10章)

《数据挖掘与数据化运营实战》(第10章)10 预测响应(分类)模型的典型应用和技术小窍门10.1 神经网络10.2 决策树技术10.3 逻辑回归技术10.4 多元线性回归技术10.5 模型过拟合及对策10.7 预测响应模型的应用步骤10 预测响应(分类)模型的典型应用和技术小窍门预测响应模型是数据挖掘中最常见的应用模型,最直接的涉及的精细化运营的客户分层以及随后的个性化区别对待。预测响应模型涉及的几种算法:神经网络、决策树、逻辑回归、多元线性回归。10.1 神经网络神经网络是一组互相连接的输入..

2020-07-26 18:10:57

《数据挖掘与数据化运营实战》(第9章)

《数据挖掘与数据化运营实战》(第9章)9 聚类分析的典型应用和技术小窍门9.1 聚类分析的典型应用场景9.2 主要聚类算法的分类9.2.1 划分方法9.2.2 层次方法9.2.3 基于密度的方法9.2.4 基于网格的方法9.3 聚类分析在实践应用中的重点注意事项9.3.1 处理数据噪声和异常值9.3.2 数据标准化9.3.3 聚类变量少而精9.4 聚类分析的扩展应用9.4.1 聚类的核心指标与非聚类的业务指标相辅相成9.4.2 数据的探索和清理工具9.4.3 个性推荐的应用9.5 聚类分析的优势和缺点9..

2020-07-26 15:40:53

《数据挖掘与数据化运营实战》(第8章)

《数据挖掘与数据化运营实战》(第8章)8 常见的数据处理技巧8.1 数据的抽取要正确反映业务需求8.2 数据抽样8.3 分析数据的规模有哪些具体的要求8.4 如何处理缺失值和异常值8.4.1 缺失值的常见处理方法8.4.2 异常值的判断和处理8.5 数据转换8.6 筛选有效的输入变量8.6.1 为什么要筛选有效的输入变量?8.6.2 筛选的思路8.6.3 R平方8.6.4 卡方检验8.6.5 IV和WOE8.6.6 部分建模算法自身的筛选功能8.6.7 降维的方法8.7 共线性问题8.7.1 如何发现共..

2020-07-25 19:08:30

《数据挖掘与数据化运营实战》(第4-7章)

《数据挖掘与数据化运营实战》(第4-6章)4 数据化运营是跨专业、跨团队的协调与合作6 数据挖掘项目完整应用案例演示4 数据化运营是跨专业、跨团队的协调与合作在线运营团队需具有的与数据相关的基本技能要求:提出业务分析需求并且能胜任基本的数据分析提供业务经验和参考建议策划和执行精细化运营方案跟踪运营效果、反馈和总结6 数据挖掘项目完整应用案例演示项目流程:项目背景和业务分析需求的提出数据分析师参与需求讨论制定需求分析框架和分析计划抽取样本数据、熟悉数据、数据清洗和摸底按计划初步

2020-07-24 17:47:03

《数据挖掘与数据化运营实战》(第3章)

《数据挖掘与数据化运营实战》(第3章)3 数据化运营中常见的数据分析项目类型3.1 用户特征分析及用户分层模型3.2 目标客户的预测(响应、分类)模型3.3 运营群体的活跃度定义3.4 用户路径分析3.5 交叉销售模型3.6 信息质量模型3.7 服务保障模型3.8 信用风险模型3.9 商品推荐模型3.9.1 Apriori算法3.9.2 协同过滤算法3.10 数据产品3.11 决策支持3 数据化运营中常见的数据分析项目类型3.1 用户特征分析及用户分层模型不同于过去的粗放式运营,在精细化运营的要求..

2020-07-23 17:17:10

《数据挖掘与数据化运营实战》(第1-2章)

《数据挖掘与数据化运营实战》读书笔记1 什么是数据化运营1.1 从4P到4C再到3P3C1.2 数据化运营的主要内容1.3 数据化运营的原因及必要条件2 数据挖掘概述2.1 统计分析与数据挖掘的主要区别2.2 数据挖掘的主要成熟技术以及在数据化运营中的主要应用2.2.1 决策树2.2.2 神经网络2.2.3 回归1 什么是数据化运营1.1 从4P到4C再到3P3C4P指的是Product(产品)、Price(价格)、Place(渠道)和Promotion(促销)。Product:表示注重产品功能

2020-07-23 14:46:39

[Machine Learning] 图片文字识别(Application Example: Photo OCR)

点Ta16 Application Example: Photo OCR(图片文字识别)16.1 Problem Description and Pipeline16.2 Sliding Windows16.3 Getting Lots of Data and Artificial Data16 Application Example: Photo OCR(图片文字识别)16.1 Problem Description and Pipeline图像文字识别应用所作的事是,从一张给定的图片中识别文字..

2020-07-22 15:53:23

[Machine Learning] 大规模机器学习(Large Scale Machine Learning)

点Ta15 Large Scale Machine Learning(大规模机器学习)15.1 Learning With Large Dataset15.2 Stochastic Gradient Descent(随机梯度下降法)15.3 Mini-Batch Gradient Descent(小批量梯度下降)15.4 Stochastic Gradient Descent Convergence(随机梯度下降收敛)15.5 Online Learning15.6 Map Reduce and Dat..

2020-07-22 14:52:23

[Machine Learning] 推荐系统(Recommender Systems)

点Ta14 Recommender Systems(推荐系统)14.1 Problem Formulation14.2 Content Based Recommendations14.3 Collaborative Filtering(协同过滤)14.4 Vectorization_ Low Rank Matrix Factorization(向量化:低秩矩阵分解)14.5 Implementational Detail_ Mean Normalization14 Recommender System..

2020-07-21 16:22:57

[Machine Learning] 异常检测(Anomaly Detection)

点Ta13 Anomaly Detection(异常检测)13.1 Problem Motivation13.2 Gaussian Distribution(高斯分布)13.3 Algorithm13.4 Developing and Evaluating an Anomaly Detection System13.5 Anomaly Detection vs. Supervised Learning13.5 Choosing What Features to Use13.7 Multivariate ..

2020-07-21 14:51:32

[Machine Learning] 降维(Dimensionality Reduction)

点Ta12 Dimensionality Reduction(降维)12.1 Motivation I_ Data Compression12 Dimensionality Reduction(降维)12.1 Motivation I_ Data Compression第二种无监督学习问题,称为降维。使用降维可以实现数据压缩,数据压缩不仅压缩数据,因而使用较少的计算机内存或磁盘空间,但它也让我们加快我们的学习算法。但首先,让我们谈论降维是什么。作为一种生动的例子,我们收集的数据集,有许多,许多特征

2020-07-20 15:23:18

查看更多

勋章 我的勋章
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 原力探索
    原力探索
    参与《原力计划【第二季】——打卡挑战》的文章入选【每日精选】的博主将会获得此勋章。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。