4 简之

尚未进行身份认证

暂无相关描述

等级
TA的排名 7w+

『统计学』第五部分:方差分析和F检验

『方差分析』第四部分的卡方检验是研究类别变量之间的关系,而这一部分的方差分析则是研究类别型自变量与数值型因变量之间的关系,它在形式上是比较多个总体的均值是否相等。从形式上看,方差分析与之前的t检验或z检验区别不大,都是检验均值是否相等,但在比较多个均值时,t检验需要做多次两两比较的假设检验,而方差分析只需要一次,并且方差分析中是将所有的样本信息结合在一起,增加了分析的可靠性。下面我们仍旧从三...

2019-08-11 16:42:35

『统计学』第四部分:回归分析和卡方检验

回归分析线性回归中的平方误差

2019-08-11 14:58:11

『统计学』第三部分:假设检验

1、假设检验和p值

2019-08-04 12:35:12

『统计学』第二部分:中心极限定理及其应用

请求

2019-07-31 23:54:23

『统计学』第一部分:常用概率分布

期望值其实就是总体的均值只是随机变量的总体是无穷的,无法全部求和然后取平均值,于是我们需要用到频率进行加权平均,这同老式的求平均方法其实没有本质区别。二项分布泊松分布...

2019-07-31 00:03:32

如何改善深层神经网络

对于深度学习,模型训练过程中可能会遇到一些问题,这些问题可能出自训练阶段,也可能出自测试阶段。训练阶段的问题主要是模型可能根本就train不出来,测试阶段的问题主要是过拟合的问题。对于不同的问题,我们采用不同的方法解决,解决方法如下图所示:我们分别就训练阶段和测试阶段来看一下具体问题,及其解决方法:(1)训练阶段:如果训练阶段发现模型根本就train不出来,常见的问题就是梯度消失或梯度爆炸...

2019-05-21 13:25:46

机器学习算法的一般结构

1.算法框架跟把大象放进冰箱里一样,李宏毅老师将机器学习方法总结为三步,如下:总结来说,就是如下三步:Defineasetoffunction(Model)Goodnessoffunction(ObjectiveFunction)Pickthebestfunction(GradientDescent)所有机器学习算法都满足这个架构,所以提到一种算法,我们就...

2019-05-13 17:48:02

SVM的梯度下降解释及其算法比较

首先说明一点,SVM的算法原理和其它机器学习算法是一致的,其中引入了两个最核心的概念就是hingeloss和kerneltrick,这篇本章主要结合这两个部分说明SVM。...

2019-05-13 16:18:27

推荐系统之YouTube推荐算法中的召回策略

YouTube深度学习推荐系统论文

2019-05-08 17:40:32

推荐系统中的常用评测指标

推荐系统中的评价指标有很多,下面来系统的总结一下,这些指标有的适用于二分类问题,有的适用于对推荐列表Topk的评价。1、精确率、召回率、F1值我们首先来看一下混淆矩阵,对于二分类问题,真实的样本标签有两类,我们学习器预测的类别有两类,那么根据二者的类别组合可以划分为四组,如下表所示:上表即为混淆矩阵,其中,行表示预测的label值,列表示真实label值。TP,FP,FN,TN分别表示如下...

2019-05-07 19:11:14

从后验概率到逻辑回归,从逻辑回归到神经网络

从后验概率到逻辑回归,从逻辑回归到神经网络1.后验概率对于给定数据,我们首先假设数据是由某种分布产生的,这样,根据贝叶斯公式我们可以得到后验概率分布,将后验概率最大的类作为xxx的类输出。后验概率计算根据贝叶斯定理进行:(1)P(Y=ck∣X=x)=p(X=x∣Y=ck)P(Y=ck)∑kp(X=x∣Y=ck)P(Y=ck)P(Y=c_k|X=x)={p(X=x|Y=c_k)P(Y=c...

2019-05-07 13:52:07

深度学习中的优化方法

深度学习中的优化方法:以下内容会包括下面几种优化方法:GradientDescentAdagradMomentumRMSProPAdam1.GradientDescent首先,GradientDescent是我们最常用的优化方法,梯度下降的参数更新公式为:(1)θi=θi−1−η∇L(θi−1)\theta^i=\theta^{i-1}-\eta\nabla...

2019-05-06 13:54:07

tf.nn.embedding_lookup函数的工作原理

tf.nn.embedding_lookup函数的工作原理函数定义:tf.nn.embedding_lookup(params,ids,partition_strategy='mod',name=None,validate_indices=True,max_norm=None)官方解释:Thisfunctionisuse...

2019-05-01 15:04:43

libsvm/libffm与dataframe格式相互转换

1.libsvm与dataframe格式相互转换##将libsvm转为dataframefromsklearn.datasetsimportload_svmlight_filefrompandasimportDataFrameimportpandasaspdX_train,y_train=load_svmlight_file("libsvm_data.txt...

2019-04-29 18:23:24

用户画像系统概述

1.用户画像的概念1.1什么是用户画像?用户画像是对现实世界中的用户的数学建模。1.2用户标签画像用户标签画像是用标签标示方法来表示用户。标签是某一种用户特征的符号表示;用户画像是一个整体,各个维度不孤立,标签之间有联系;用户画像可以用标签的集合来表示。1.3用户标签的数学描述:标签是特征空间中的维度。特征空间:每个标签都是特征空间中的基向量;基向量之间有关联...

2019-04-27 15:09:30

Pandas实现Hive中的窗口函数

1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number()OVER(partitionby分组字段ORDERBY排序字段排序方式asc/desc)简单的说,我们使用partitionby后面的字段对数据进行分组,在每个组内,使用ORDERBY...

2019-04-26 12:52:57

git常用操作

git常用操作1、cd进入目录:2、把当前目录变成git可以管理的仓库:gitinit3、添加文件:单个文件:gitaddreadme.md全部文件:gitadd-A4、提交修改:gitcommit-m“一定要写备注”5、查看是否还有未提交任务:gitstatus6、查看最近日志:gitlog7、版本回退操作:回退一个:gitreset-hard...

2019-04-25 16:46:56

论文精读(一)——XGBoost:A Scalable Tree Boosting System

论文精读(一)——XGBoost:AScalableTreeBoostingSystem

2019-04-21 14:36:40

统计学习方法(7)前向分步算法推导AdaBoost的详细过程

由前向分步算法可以推导Adaboost,用定理叙述这一关系:定理:AdaBoost算法是前向分步加法算法的特例。这时,模型是由基本分类器组成的加法模型,损失函数是指数函数。证明:前向分步算法学习的是加法模型,当基函数为基本分类器时,该加法模型等价于AdaBoost的最终分类器:f(x)=∑m=1MαmGm(x)f(x)=\sum_{m=1}^{M}\alpha_{m}G_{m}(x...

2019-04-19 17:25:23

用GBDT构建组合特征

用GBDT构建组合特征

2019-04-13 19:42:28

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。