7 nbszg

尚未进行身份认证

暂无相关简介

等级
TA的排名 14w+

数据分析系列:绩效(效率)评价与python实现(层析分析、topsis、DEA)

当分析一个项目是否可行,或多个决策中挑选出最优的一个进行执行,对以往的项目或人员进行绩效评价时,我们需要对一项业务或人员的绩效(效率)进行打分。这就是绩效(效率)评价的目标。假设有下面一个案例,我们对一个进行产品进行用户增长的广告投放,假设我们有多个广告承接商可以选择。具体的我们应该选择哪一个广告承接商?这就可以用一些绩效评价的方法解决,可用户绩效(效率)评价的方法非常多,这里只介绍层析分析法,...

2020-04-26 20:01:46

用户增长:增长黑客——Growth Hacking

Growth Hacking(以下简称GH)指的是通过非正常手段(一些技术手段)增加产品用户做法。其中Growth说的是用户增长,这是产品发展的重要目标,Hacking指的是一些技术手段,包括产品迭代、A/B test、落地页设计、邮件触达等手段,其最主要特点是不需要再获取用户上投放大量成本。特别是初创公司来说,在没有广告预算、市场营销活动以及市场推广专员的情况下,Growth Hacking 也...

2020-04-23 15:32:03

数据分析系列:《精益数据分析》读书笔记和理解

这本书很符合分析中的二八定律,前面20%的内容,蕴含了整本书80%的内容。在数据的时代,我们希望我们的产品发展和用户增长都是数据驱动的。确保产品服务和营销有依据可寻。依据数据分析和数据挖掘的产品迭代在理论上是不断变优的。具体的,我们的数据分析结果需要深入,全面,并且最好符合认知才能正确的指导产品发展。一、什么指标是好的数据指标衡量一个指标的好坏的重要标准,是指标是可以比较的,并且简单易懂。...

2020-04-22 20:05:43

用Python底层编写进行计量经济分析(四):自相关(原因、结果、检验:DW检验、补救:广义线性回归)

系列前面的文章:1.用Python底层编写进行计量经济分析(一):多元线性回归(参数估计、T检验、拟合优度、F检验)2.用Python底层编写进行计量经济分析(二):多重共线性(原因、结果、检验:条件数/方差膨胀因子、补救:岭回归)3用Python底层编写进行计量经济分析(三):异方差(原因、结果、检验:White检验、补救:广义线性回归)多元线性回归的基本假定:模型符合线性模式XX...

2020-04-17 17:25:08

计量经济分析:计量经济学中的三大检验(LR, Wald, LM)

前面用Python底层编写进行计量经济分析(一):多元线性回归(参数估计、T检验、拟合优度、F检验)写过在多元线性回归时的参数检验方法t检验和方程整体的F检验。在分析中和实际情况中,我们可能会假定因素之间可能存在一定的约束条件。我们在意的不仅是x对y的影响,也关心我们的约束条件是否成立。于是产生了检验线性约束条件是否成立的F检验、似然比检验(LR)、沃尔德检验(Wald)和拉格朗日乘子检验(LM)...

2020-04-16 20:40:45

数据分析系列:如何估计一个产品用户最大量(最大DAU)——附python计算代码

在做产品的时候,我们希望是数据驱动的。**一个产品的用户天花板(最大DAU)是指导产品的重要指标。**问题来了,如何估计一个产品的DAU?给出解决方案,这是本文解决的主要问题。一、估计最大DAU首先,一个产品的活跃用户可以分为两部分,第一部分是当天的新增天用户,第二部分是产品之前的存留用户。这两部分与DAU大致的关系如下:DAU(n)=A(n)+A(n−1)R(1)+A(n−2)R(2)+…...

2020-04-16 11:21:24

数据分析系列:生存分析(生存曲线分析、Cox回归分析)——附生存分析python代码。

上一篇文章写了数据分析系列:归因分析原理、案例和python代码。但是现实中用户所归属的渠道可能很多,比如用户在网上商城的首页点击了一个产品,又在其他公众号的相关推荐点击了此产品,最终进行了下单,那这个产品的订单应该归属于哪个渠道?这就是归因分析中的多渠道归因。对于多渠道归因,有一些启发式的归因方法,比如“最终点击”(将订单归属于最后一个渠道)、“非最终点击”(归属于倒数第二个渠道)、“首次点击...

2020-04-15 11:48:56

数据分析系列:归因分析原理、案例和python代码

本文主要对以下指标的计算和解释进行阐述,并使用案例说明,最后利用python编写代码进行计算:risk ratios and rate ratios(风险比率和比率比率,RR)risk difference and rate difference(风险差异和利率差异, RD)attributable proportion (attributable risk percent) for th...

2020-04-13 18:26:00

《统计学习方法》七:手推“支持向量机”

第七章 支持向量机SVM是二分类模型,它的基本模型时定义在特征空间上的间隔最大的线性分类器。SVM由简至繁可分为:线性可分支持向量机、线性支持向量机、非线性支持向量机7.1.线性可分支持向量机与硬间隔最大化7.1.1.线性可分支持向量机...

2020-04-09 20:29:26

使用Hive的窗口函数进行数据分析——以股票市场分析为例

声明:本文主要是实现利用Hive常用的窗口函数和一些数据分析思维分析数据,只是套用在股票数据的例子上,因此并不适用于提高投资技巧!我们先看一下常用Hive中常用的窗口:PRECEDING:往前FOLLOWING:往后CURRENT ROW:当前行UNBOUNDED:起点(一般结合PRECEDING,FOLLOWING使用)UNBOUNDED PRECEDING 表示该窗口最前面的行(起...

2020-04-09 15:12:44

《统计学习方法》六:手推“逻辑回归与最大熵模型”

第六章 逻辑回归与最大熵模型逻辑回归主要用于二分类问题,与线性回归的核心区别在于,逻辑回归是一个对数线性模型。6.1.逻辑回归模型6.1.1.逻辑分布6.1.2.二项逻辑回归模型6.1.3.模型参数估计6.1.4.多项逻辑回归6.2.最大熵模型6.2.1.最大熵原理最大熵原理是概率学习模型的一个准则。最大熵原理认为,在学习概率模型时,所有可能的概率模型中,熵最大的模型...

2020-03-16 20:14:35

《统计学习方法》五:手推“决策树”

第四章 决策树决策树是一种基本的分类与回归方法,可以认为是if-then的集合。常用的决策树算法有ID3和C4.5以及CART5.1.决策树模型与学习5.1.1.决策树模型决策树定义:分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型。内部结点和叶结点,内部节点表示属性,即建模使用特征。叶节点是一个类,即标签。决策树将一个实例在树上进行查找,最后...

2020-01-21 17:15:37

《统计学习方法》四:手推“朴素贝叶斯法”

第三章 朴素贝叶斯法朴素贝叶斯法是通过学习输入XXX和输出YYY的联合分布P(X,Y)P(X,Y)P(X,Y),对给定的输入xxx,根据贝叶斯理论求出后验概率最大的输出yyy的方法。是一种生成学习方法4.1.朴素贝叶斯算法的学习与分类4.1.1.基本方法4.1.2.后验概率最大化的含义朴素贝叶斯将实例分到后验概率最大的类中,这等价于期望风险最下化。4.2.朴素贝叶斯算法的参数...

2020-01-02 19:51:36

《统计学习方法》三:手推“k近邻法”

第三章 kkk近邻法k-NN是一种基本的分类和回归方法,没有显式的表达过程。3.1.kkk近邻算法

2019-12-30 20:09:54

《统计学习方法》二:手推“感知机”

第一章 感知机感知机是一个二分类问题线性模型。旨在于找到一个超平面将正负样本分开。是支持向量机SVM和神经网络的基础。2.1.感知机模型感知机时一种线性分类模型,属于判别模型。感知机的假设空间是定义在特征空间的所有线性分类模型或线性分类器。具体定义如下:2.2.感知机学习策略2.2.1.感知机的线性可分如果存在一个超平面wx+b可以将正负两类样本完全的划分到超平面两侧,则称该数据...

2019-12-24 18:04:36

用Python底层编写进行计量经济分析(三):异方差(原因、结果、检验:White检验、补救:广义线性回归)

系列前面的文章:1.用Python底层编写进行计量经济分析(一):多元线性回归(参数估计、T检验、拟合优度、F检验)2.用Python底层编写进行计量经济分析(二):多重共线性(原因、结果、检验:条件数/方差膨胀因子、补救:岭回归)模型符合线性模式XXX满秩(无多重共线)零均值价值:E(εi∣Xi)=0E(ε_i|X_i)=0E(εi​∣Xi​)=0(自变量外生)同方差:Var(εi...

2020-04-08 20:03:24

数据分析系列:分布分析法&用户留存分析法

本文部分内容来自数据分析(4):分布分析法&用户留存分析法,并在此基础上加入看了一些自己的理解和看法。一、分布分析法原文总结了几种划分方式,具体的划分还是需要根据所在的业务来考虑。必须我们在考虑支付宝支付的人群,不仅要考虑地域、年龄、等划分。还可以根据使用渠道(扫码、线上购物、线上跳转等渠道)、使用方式(PC, APP等)等其他方式划分。只要能想到的方面,并且该方面对业务改进可以起到作...

2020-04-08 15:14:30

数据分析系列:用户分群和画像分析

本来想自己总结一下关于数据分析的一些东西,包括漏斗分析、存留分析、用户粘性、用户价值(rfm)和用户画像分析等方面的内容。但是网上资料十分多,自知肯定没有那些资深大牛写得好,而且自己写东西时间有限,想多总结一些关于模型和统计方面的东西。所以还是直接转载别人表述的比较清晰的文章吧,在此基础上加入一些自己的理解和注释。一、什么是用户画像?用户画像是通过对用户各类特征进行标识,通过标识给用户贴上各类...

2020-04-08 11:44:33

数据分析系列:漏斗分析

一、漏斗分析漏斗分析是针对产品时间轴上流程上的数据分析方法,这与数据的横向对比存在本质逻辑的不同。漏斗分析希望通过观察每个流程节点上的转化与流失的人数得到出现问题或可以改进的流程节点。比如用户再网上购物时,一个购买用户会经历下面类似的流程链条:首页->搜索浏览->点击详情页->(加入购物车)->提交订单->结算->购买成功再比如,一个网上现金贷业务业务营...

2020-04-07 20:25:03

用Python底层编写进行计量经济分析(二):多重共线性(原因、结果、检验:条件数/方差膨胀因子、补救:岭回归)

上一次对多元线性回归的估计以及参数和方程的显著性进行了python实现。但是这些都是建立多元线性回归的几个假设基础之上的:模型符合线性模式XXX满秩(无多重共线)零均值价值:E(εi∣Xi)=0E(ε_i|X_i)=0E(εi​∣Xi​)=0(自变量外生)同方差:Var(εi∣Xi)=σVar(ε_i|X_i)=σVar(εi​∣Xi​)=σ无自相关:cov(εi,εj)=0cov(ε...

2020-04-05 12:23:06

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。