11 falao_beiliu

尚未进行身份认证

这一生看错过很多人 承受过许多背叛也曾经狼狈不堪 可是真的都没关系 只要死不了就还能站起来 别小看我,我没那么脆弱转自九点一刻

等级
TA的排名 1w+

互联网广告系统综述八机器学习与数据

互联网广告系统综述八机器学习与数据写好标题,却迟迟不知道怎么动手,最近机器学习的一个分支——深度学习,真是火得没朋友啊,过去十几年的最热门的核方法,被成功的放到一边去了,整个工业界开始重新聚焦到神经网络这边来了。方法万能论总是那么让人热血沸腾的。可惜经过一段时间的摸爬滚打,脑子总算清醒了一点,也从一个广告算法工程师的角度去看看这个问题吧。也不谦虚了,就打个比方吧,把角色分一下好说话

2014-11-09 00:04:48

互联网广告系统综述七特征

互联网广告系统综述七特征描述完系统,模型等方面,就到了花费互联网广告算法工程师的最大精力的点了,就是特征工程,这是一个持久战斗的点。流程复杂,而且各种机器学习的方法都可以在这里用上,有效果,有产出,有指标。当然,玩砸的也不少,打击总是很多的。前面那么多的工作,都可以在系统搭建完成后,变化都不会特别大,剩下还可以变化的,就是预估ctr的时候的那个x了,这个x就是由特征组成,对ctr预估起

2014-11-08 23:58:23

互联网广告系统综述六模型

互联网广告系统综述六模型经过几个博文的啰啰嗦嗦,又是业务又是定向又是系统架构的,给各位的感觉都是在描述一些外围的东西,真正核心的东西还没说到。对于心急得如干柴烈火的热血青年来说,似乎一直在各种前戏,一直没感受到提抢上阵的快感。就算这么急,这还是得说——在广告算法领域,如果说ctr预估是包子馅的话,前面那些东西就是包子皮,直接吃包子馅,不见得是很正确的吃法。下面就说说大家喜闻乐见的模型吧

2014-11-08 23:48:25

互联网广告系统综述五系统架构

互联网广告系统综述五系统架构 前面几篇博文都说了很多业务架构方面的东西,顺便说了一些用户基础信息的挖掘相关的事情。那些很多都已经被大神们说得淋漓尽致了,除了定向中说的那几个定向方法以外。下面就开始一些跟技术相关的东西了。1.1前言在说了这么多技术无关的东西后,是要来点有技术性的东西了。这系列的博文好像看起来并不能让很多人看的爽,因为没啥公式与技术相关的东西。可以想象到的

2014-11-08 23:35:17

互联网广告系统综述四定向

互联网广告系统综述四定向所谓定向,就是广告算法工程师提供给广告主一些用户属性与条件,供广告主用来找到自己的目标人群的。定向是很重要的,在古代,一个买大饼的武大郎,想必不会把大饼担挑到几十公里见不到人的戈壁滩去吆喝。一个卖草帽的老板,也不会跑到青楼一条街去吆喝。定向就是广告主选择自己的目标人群,避免造成“你喊啊,你喊破喉咙也没人理你”的尴尬场面。这个功能可大可小,随便做做点简单的也许,好

2014-11-08 23:30:56

互联网广告系统综述三业务描述

互联网广告系统综述三业务描述前面说了互联网广告市场发展的一些现状,其中提到了品牌广告和效果广告,也提到了广告平台中涉及的三个利益相关方广告主,用户,广告平台老板。由于本文是利用广告平台的工程师的视角描述的,就聊聊广告平台上的利益相关方的博弈吧。当然,要注意的是,效果广告才有这三方博弈,品牌广告往往只有广告主和平台在博弈,用户方面考虑得比较少。下面说的东西都主要以效果广告的视角描述的

2014-11-08 23:13:34

互联网广告系统综述二业务背景

互联网广告系统综述二业务背景广告一直是无处不在的,在古代,武大郎挑着他的大饼,在街上大喊:“卖大饼咧,又大又圆的大饼啊,只卖一文钱!”这也是做广告的一种方式。到了现代更加多了,电视放到关键时刻,总要来点广告。互联网兴起后,哪里都有了广告了。一.背景1.1前言最近几年,机器学习、数据挖掘的概念风生水起,越炒越热了。很多年轻人浏览了基本数据挖掘相关书籍,就感觉自己会数据挖掘

2014-11-08 22:41:35

LDA入门级学习笔记

LDA入门级学习笔记

2014-09-14 14:25:55

EM算法学习笔记

一.EM算法解决的问题要了解EM算法,就先了解这个算法是干啥的,十大算法之一头衔怎么来的。当然这个头衔是专家们投票得来,只是这个投票跟现在的选秀节目投票不一样,EM是凭借硬实力胜出的,有铁杆粉丝称之为“神的算法”。EM算法之前,先要了解极大似然估计方法,这个在转发的博文《从最大似然到EM算法浅解》里面有讲解了。极大似然估计能解决很大一部分的参数估计问题了,类似逻辑回归,RBM等等,

2014-08-23 15:04:39

深度学习word2vec笔记之应用篇

深度学习word2vec笔记之应用篇声明:1)该博文是Google专家以及多位博主所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人

2014-08-16 13:57:04

深度学习word2vec笔记之算法篇

深度学习word2vec笔记之算法篇

2014-05-25 20:03:33

深度学习word2vec笔记之基础篇

深度学习word2vec笔记之基础篇

2014-05-25 16:00:16

ROC曲线与AUC计算

ROC曲线绘制与AUC计算     致谢多位博主的无私分享。参考文献[1]http://blog.csdn.net/chjjunking/article/details/5933105.chjjunking的博客[2]http://blog.csdn.net/abcjennifer/article/details/735937

2014-04-21 20:42:37

互联网广告综述之点击率特征工程

互联网广告综述之点击率特征工程声明:1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅

2014-02-11 21:44:14

广告点击率的贝叶斯平滑

广告点击率的贝叶斯平滑一.点击率的贝叶斯平滑预估互联网广告的点击率一个重要的技术手段是logisticregression模型,这个模型非常依赖特征的设计。每个广告的反馈ctr作为特征能极大地提升预估的准确性,所以每个广告的反馈ctr非常重要。目前用得比较多的获取反馈ctr的方式是直接计算每个广告的历史ctr,这样的问题就是当该广告投放量比较少的时候(如新广告),历史ct

2014-02-11 21:27:50

互联网广告综述之点击率系统

互联网广告综述之点击率系统声明:1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅,整理总结的

2014-02-08 16:29:53

互联网广告系统综述一生态圈

互联网广告综述之生态圈一.互联网广告行业生态互联网广告是互联网行业最主要的赢利模式,流量变现成为互联网商业产品非常重要的评价标准。随着互联网的发展,互联网的流量也是越来越大,2013上半年互联网广告投放总额达431亿元,可以预计,互联网广告的投放很快就会达到千亿元的标准。如此一个巨大的市场,自然能吸引众多的资本家向往,从而产生了一个互联网广告产业。随着互联网人群定向技术的发

2014-02-08 16:08:23

从广义线性模型到逻辑回归

从广义线性模型到逻辑回归一.广义线性回归回归方式比较常用的有线性回归和logistic回归.基本的形式都是先设定h_θ(x),然后求最最大似然估计L(θ),然后求出l(θ)=logL(θ),然后用梯度上升法或其它方法求出θ,二种回归如此相似的原因就是在于它们都是广义线性模型里的一员。所以为了有个总体上的把握,从广义线性回归说起。1.1指数家族1.1.1定义如

2014-02-08 15:30:21

在线学习算法FTRL

在线学习算法FTRL      优化算法中的LBFGS解法以及GD等解法,是对一批样本进行一次求解,得到一个全局最优解。    实际的互联网广告应用需要的是快速地进行model的更新。为了保证快速的更新,训练样本是一条一条地过来的,每来一个样本,model的参数对这个样本进行一次迭代,从而保证了model的及时更新,这种方法叫做OGD(Onlinegradientd

2014-02-08 11:01:58

OWL-QN算法

OWL-QN算法转自:http://www.cnblogs.com/vivounicorn/archive/2012/06/25/2561071.html一、BFGS算法     算法思想如下:          Step1  取初始点,初始正定矩阵,允许误差0">,令;          Step2  计算;          Step3  计算

2014-02-07 20:50:11

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!