4 简之

尚未进行身份认证

暂无相关描述

等级
博文 76
排名 8w+

如何改善深层神经网络

对于深度学习,模型训练过程中可能会遇到一些问题,这些问题可能出自训练阶段,也可能出自测试阶段。训练阶段的问题主要是模型可能根本就train不出来,测试阶段的问题主要是过拟合的问题。对于不同的问题,我们采用不同的方法解决,解决方法如下图所示:我们分别就训练阶段和测试阶段来看一下具体问题,及其解决方法:(1)训练阶段:如果训练阶段发现模型根本就train不出来,常见的问题就是梯度消失或梯度爆炸...

2019-05-21 13:25:46

机器学习算法的一般结构

1.算法框架跟把大象放进冰箱里一样,李宏毅老师将机器学习方法总结为三步,如下:总结来说,就是如下三步:Defineasetoffunction(Model)Goodnessoffunction(ObjectiveFunction)Pickthebestfunction(GradientDescent)所有机器学习算法都满足这个架构,所以提到一种算法,我们就...

2019-05-13 17:48:02

SVM的梯度下降解释及其算法比较

首先说明一点,SVM的算法原理和其它机器学习算法是一致的,其中引入了两个最核心的概念就是hingeloss和kerneltrick,这篇本章主要结合这两个部分说明SVM。...

2019-05-13 16:18:27

推荐系统之YouTube推荐算法中的召回策略

YouTube深度学习推荐系统论文

2019-05-08 17:40:32

推荐系统中的常用评测指标

推荐系统中的评价指标有很多,下面来系统的总结一下,这些指标有的适用于二分类问题,有的适用于对推荐列表Topk的评价。1、精确率、召回率、F1值我们首先来看一下混淆矩阵,对于二分类问题,真实的样本标签有两类,我们学习器预测的类别有两类,那么根据二者的类别组合可以划分为四组,如下表所示:上表即为混淆矩阵,其中,行表示预测的label值,列表示真实label值。TP,FP,FN,TN分别表示如下...

2019-05-07 19:11:14

从后验概率到逻辑回归,从逻辑回归到神经网络

从后验概率到逻辑回归,从逻辑回归到神经网络1.后验概率对于给定数据,我们首先假设数据是由某种分布产生的,这样,根据贝叶斯公式我们可以得到后验概率分布,将后验概率最大的类作为xxx的类输出。后验概率计算根据贝叶斯定理进行:(1)P(Y=ck∣X=x)=p(X=x∣Y=ck)P(Y=ck)∑kp(X=x∣Y=ck)P(Y=ck)P(Y=c_k|X=x)={p(X=x|Y=c_k)P(Y=c...

2019-05-07 13:52:07

深度学习中的优化方法

深度学习中的优化方法:以下内容会包括下面几种优化方法:GradientDescentAdagradMomentumRMSProPAdam1.GradientDescent首先,GradientDescent是我们最常用的优化方法,梯度下降的参数更新公式为:(1)θi=θi−1−η∇L(θi−1)\theta^i=\theta^{i-1}-\eta\nabla...

2019-05-06 13:54:07

tf.nn.embedding_lookup函数的工作原理

tf.nn.embedding_lookup函数的工作原理函数定义:tf.nn.embedding_lookup(params,ids,partition_strategy='mod',name=None,validate_indices=True,max_norm=None)官方解释:Thisfunctionisuse...

2019-05-01 15:04:43

libsvm/libffm与dataframe格式相互转换

1.libsvm与dataframe格式相互转换##将libsvm转为dataframefromsklearn.datasetsimportload_svmlight_filefrompandasimportDataFrameimportpandasaspdX_train,y_train=load_svmlight_file("libsvm_data.txt...

2019-04-29 18:23:24

用户画像系统概述

1.用户画像的概念1.1什么是用户画像?用户画像是对现实世界中的用户的数学建模。1.2用户标签画像用户标签画像是用标签标示方法来表示用户。标签是某一种用户特征的符号表示;用户画像是一个整体,各个维度不孤立,标签之间有联系;用户画像可以用标签的集合来表示。1.3用户标签的数学描述:标签是特征空间中的维度。特征空间:每个标签都是特征空间中的基向量;基向量之间有关联...

2019-04-27 15:09:30

Pandas实现Hive中的窗口函数

1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number()OVER(partitionby分组字段ORDERBY排序字段排序方式asc/desc)简单的说,我们使用partitionby后面的字段对数据进行分组,在每个组内,使用ORDERBY...

2019-04-26 12:52:57

git常用操作

git常用操作1、cd进入目录:2、把当前目录变成git可以管理的仓库:gitinit3、添加文件:单个文件:gitaddreadme.md全部文件:gitadd-A4、提交修改:gitcommit-m“一定要写备注”5、查看是否还有未提交任务:gitstatus6、查看最近日志:gitlog7、版本回退操作:回退一个:gitreset-hard...

2019-04-25 16:46:56

论文精读(一)——XGBoost:A Scalable Tree Boosting System

论文精读(一)——XGBoost:AScalableTreeBoostingSystem

2019-04-21 14:36:40

统计学习方法(7)前向分步算法推导AdaBoost的详细过程

由前向分步算法可以推导Adaboost,用定理叙述这一关系:定理:AdaBoost算法是前向分步加法算法的特例。这时,模型是由基本分类器组成的加法模型,损失函数是指数函数。证明:前向分步算法学习的是加法模型,当基函数为基本分类器时,该加法模型等价于AdaBoost的最终分类器:f(x)=∑m=1MαmGm(x)f(x)=\sum_{m=1}^{M}\alpha_{m}G_{m}(x...

2019-04-19 17:25:23

用GBDT构建组合特征

用GBDT构建组合特征

2019-04-13 19:42:28

GBDT(sklearn/lightgbm)调参小结

GBDT(sklearn/lightgbm)调参小结原理参数选择特征重要度

2019-04-13 19:37:36

pycharm通过ssh连接远程服务器

由于想要使用pycharm连接Window子系统Ubuntu进行开发,找了很多教程都不够详细,花了点儿时间,最后配置成功。将pycharm连接Window子系统的配置过程总结如下,连接其它远程服务器的过程相同:一、Ubuntu配置1、首先安装sshserver:>sudoapt-getinstallopenssh-server2、修改sshserver配置:&...

2019-03-18 12:24:54

ubuntu配置git工具

使用ubuntu,如果想从github上clone文件,需要做一些简单的配置,不然会出现如下错误:>gitclone--recursivegit@github.com:lujiaying/MovieTaster-Open.gitPermissiondenied(publickey).fatal:Couldnotreadfromremoterepository....

2019-03-17 16:28:55

关于python中的全局变量、局部变量及递归中的使用

本文主要总结python中的全局变量、局部变量和函数调用时的可变对象的使用:1、关于全局变量和局部变量(1)如果函数内无global关键字,优先读取局部变量,无局部变量则读取全局变量,不能对全局变量重新赋值。name='jack'defchange_name():name='john'print(name)change_name()print(name...

2018-11-22 14:39:26

关于二叉树的相关题目

\qquad二叉树在数据结构中具有十分重要的作用,很多算法题都使用到树的思想。将复杂的算法题转化为简单子问题,并用树的形式表示,可以直观理解划分的过程,有利于分析和写出算法程序。比如:对于递归问题,就可以转化成树的形式,将树的叶节点作为终止条件,将树的生成过程作为迭代公式,根据题目要求使用先序、中序、后序遍历,下面总结有关二叉树的相关题目,二叉树的题目普遍可以用递归和迭代的方式来解:首先写出二叉...

2018-11-20 22:11:11
奖章
  • Github
    Github
    绑定github第三方账户获取
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。