6 Thinkgamer_

尚未进行身份认证

我要认证

ID:Thinkgamer,《推荐系统开发实战》一书作者,「搜索与推荐Wiki」公众号独立作者,信条是持续输出精品系列内容。从事推荐系统相关工作多年,包括但不局限于ML、DL、RL、NLP!

等级
TA的排名 740

从极大似然到对数损失函数和交叉熵损失函数,以及对数损失优化取值范围

本文主要介绍CTR场景中的对数损失函数和交叉熵损失函数,以及对数损失函数的取值范围,如果觉得对你有帮助,文末「分享」「点赞」「在看」来一波,点击「阅读原文」获取精彩比例PDF下载链接。极大似然估计在统计学领域,有两种对立的思想学派:贝叶斯学派和经典学派(频率学派),他们之间最大的区别是如何看待被估计的参数。贝叶斯学派的观点是将其看成是已知分布的随机变量,而经典学派的观点是将其看成未知的待估计的常量。极大似然估计属于经典学派的一种。通俗来说,极大似然估计就是利用已知的样本结果信息,反推最大概率出现这.

2020-08-19 08:17:48

论文|从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考

基于深度学习的召回近些年已经得到了长足的发展,其中双塔模型更是作为经典的深度学习召回模型被各大公司应用,回顾双塔模型的发展可以追溯到2003年微软发布的DSSM模型,本篇文章将会从DSSM开始介绍几篇论文,看一下DSSM模型是怎么发展成为双塔模型并应用在推荐系统中做召回的。DSSMDSSM模型是2013年微软发布的,其论文全称为:Learning Deep Structured Semantic Models for Web Search using Clickthrough Dara(https://

2020-08-12 12:32:40

关于推荐算法工程师大家比较关注的几个问题

今天在《推荐系统开发实战》的读者群里聊天,在探讨技术问题的时候发现也有朋友对一些非技术的问题比较感兴趣,这里进行总结和分享,希望能够帮助到看这篇文章的人。欢迎加我的微信进行技术交流,非技术的人生思考问题也可以进行探讨。我的微信号如下图以下问题,随机排序,不分先后!Q、推荐算法工程师的工资待遇怎么样A:这个问题真的是很直接呀,当然可以理解,毕竟我们工作就是为了赚钱,为了生活。推荐算法工程师和算法工程师的待遇基本差不多,不过不同地方、不同级别的推荐算法工程师待遇肯定是不一样,比如一线的北上广深

2020-07-24 12:00:41

Kaggle宝典|使用Python进行全面的数据探索

算法工程师的日常工作中基础最多的便是数据,但是大多数的算法工程师在使用数据过程中,最缺少的还是对数据的整体把控和分析,更多靠的是业务经验。但是严谨的算法工程师在建模之前是需要对数据进行探索和分析的,以便于在建模过程中能给更快的做出更优的模型。生活中最苦难的事情就是了解自己,建模过程中最苦难的事是了解数据!了解数据是一件非常困难的事情,且非常耗时,因此从事数据科学很容易忽略前期的数据了解,而直接对数据进行应用。本文是一篇非完整的翻译文(在个人理解的基础上进行翻译,个人水平有限,如果文章有误,欢迎在评论.

2020-07-11 11:30:37

传统机器学习和前沿深度学习推荐模型演化关系介绍

本文来自王喆老师《深度学习推荐系统》一书,如果有一定的推荐系统基础的话,建议读一读,当然如果只是初学者的话还是建议从基础的开始学起,比如《推荐系统开发实战》。传统机器学习推荐模型演化简单讲,传统推荐模型的发展主要由以下几部分组成协同过滤算法族即上图中蓝色部分,协同过滤是推荐系统的首选模型,从物品相似度和用户相似角度出发,衍生出了ItemCF和UserCF两种算法。为了使协同过滤衍生出矩阵分解模型(Matrix Factorization,MF),并发展出矩阵分解的各分支模型。逻辑回归模型族.

2020-06-30 08:16:41

独孤九剑:算法模型训练的一般流程

这篇文章主要分享一下模型训练的一般流程,目的是让大家明白做一个算法模型过程中会涉及的流程和数据特征在算法模型中的重要性。作为一名算法工程师训练模型可谓是家常便饭,不管是做推荐中的召回模型、排序模型还是其他领域的分类模型等,都应该有一个规范化的流程,这样在做模型的过程中也会更加清晰,当然也不一定完全遵循这个流程,只是说基本过程应该是一致的。1、总诀式——定义问题What,How,Why。首先要弄清楚自己要干什么,然后调研相关的技术确定怎么解决问题,最后反思自己为什么要用这个方案解决这个问题,有没有更好的

2020-06-29 07:27:36

CTR预估模型中的正负样本定义、选择和比例控制

目前推荐系统中给用户进行推荐大部分都是基于CTR预估来做的,CTR预估中很重要的一环便是正负样本的选择,那么不同业务场景下我们如何定义正负样本、如何控制正负样本的比例、正负样本选择有哪些技巧?虽然这些只是模型训练中的一环,但却也扮演着重要的角色。这篇文章简单聊一下上边提到的问题,如何你对这有什么想法和意见,欢迎在评论区留言,一起沟通。分析业务场景不同业务场景下对应的kpi也是不同的,那么模型训练的目标也是不一致的,比如kpi是点击率,那么模型训练的目的就是增加推荐的准确性,提升用户的准确率;如果k.

2020-06-19 10:02:54

用户网络行为画像知识点纪要

用户画像在推荐系统中扮演着重要的角色,这篇文章主要是阅读《用户网络行为画像》一书的读书摘要,该书较老,感觉更加适合产品经理或者不懂推荐的人看,如果读者本身就是一个推荐从业者的话,只需要看书的前半部分,对用户画像有个本质的理解即可,后半部分可忽略。可以在京东或者当当上购买纸质版图书,也可以购买京东上的电子版,如果想要获取免费的电子版,加我的微信号,备注【book】即可获取用户描述分为三种情况用户画像(User Portrait),更倾向于对同一类用户进行不同维度的刻画用户角色(User .

2020-06-10 17:15:17

基于tensorflow实现稀疏自编码和在推荐中的应用

稀疏自编码自编码器(Auto-Encoder)顾名思义,即可以利用自身的高阶特征编码自己。自编码器也是一种神经网络,他的输入和输出是一致的,他借助稀疏编码的思想,目标是使用稀疏的一些高阶特征重新组合来重构自己。因此他的特征十分明显:期望输入与输出一致希望使用高阶特征来重构自己,而不只是复制像素点自编码器的输入节点和输出节点的数量是一致的,但如果只是单纯的逐个复制输入节点则没有意义,像前面提到的,自编码器通常希望使用少量稀疏的高维特征来重构输入,所以加入几种限制:(1)中间隐含层节点的数量。

2020-05-28 20:45:45

基于DNN的推荐算法

本文为《推荐系统与深度学习》第六章的复习笔记,只记录了一些要点,希望能够快速的进行复习,如果发现哪一个点不明白的话,可以自行展开学习或者加小编微信进行沟通。深度学习在推荐中发挥的作用:能够直接从内容中提取特征,表征能力强容易对噪声数据进行处理,抗噪能力强可以使用循环神经网络对动态或者序列数据进行建模可以更加准确的学习user和item的特征基于DNN的推荐算法推荐系统和通用搜索排序问题共有的一大挑战为同时具备记忆能力和泛化能力。记忆能力可以解释为学习那些经常共同出现的特征,发现历史.

2020-05-27 23:19:36

晓得嘛?混合推荐系统速览和技巧锦囊

本文为《推荐系统与深度学习》第五章的复习笔记,只记录了一些要点,希望能够快速的进行复习,如果发现哪一个点不明白的话,可以自行展开学习或者加小编微信进行技术交流。5.1 什么是混合推荐系统混合推荐系统的含义海量数据推荐系统中通常存在三部分:在线系统(Online)直接与用户进行交互,具有高性能、高可用的特性,通常利用缓存系统,处理热门请求的重复计算近在线系统(Nearline)接受在线系统的请求,执行比较复杂的推荐算法,缓存在线系统的结果,并及时收集用户的反馈,快速调整结果离.

2020-05-20 14:50:09

虽然简单但确不能不会的推荐算法重点回顾

本文为《推荐系统与深度学习》第四章的复习笔记,只记录了一些要点,希望能够快速的进行复习,如果发现哪一个点不明白的话,可以自行展开学习。4.1 基于内容的推荐算法基于内容的推荐算法步骤:特征(内容)提取用户偏好计算内容召回(召回用户偏好的top K)物品排序(可以根据top K中其他用户打分平均值最高的top N推荐给用户,好处是可以考虑其他用户的意见)优点:物品没有冷启动问题(因为物品的内容特征不依赖于用户数据),推荐出的物品也不会存在过于热门的问题能够捕获到用户的特殊偏好原理.

2020-05-11 17:10:05

论文|AGREE-基于注意力机制的群组推荐,含代码(Attentive Group Recommendation)

这篇文章主要分享的论文是2018年被CCF收录的一篇论文:Attentive Group Recommendation(基于注意力机制的群组推荐),第一作者是湖南大学的曹达老师,二作是论文Neural Collaborative Filtering的作者何老师。当然也会结合小编的工作来进行一些补充说明,写的不好,欢迎拍砖!

2020-04-24 11:56:26

论文|组推荐系统及其应用研究

这篇文章主要是普及一下群组推荐系统,众所周知,推荐系统已经应用十分广泛,群组推荐的应用不仅老用户上发挥了极大的作用,在新用户的冷启动上也发挥了很大的作用。由于后续会有一篇文章介绍结合深度学习的群组推荐,所以这里先借用该篇论文,借花献佛,介绍一下群组推荐系统和其应用。本文中所涉及的内容算是比较老了,但在不同公司或者推荐系统的不同阶段仍然有应用,其中群组推荐的思想更是经久不衰,所以本文比较适合以“...

2020-04-13 21:50:16

论文|被“玩烂”了的协同过滤加上神经网络怎么搞?

相信熟悉推荐系统的同学对于协同过滤(Collaborative Filtering)已经熟悉的不能再熟悉了,我也相信很多人心里在想“这么简单的协同,都2020年了,谁还用呀”。俗话说得好,人不可貌相,海水不可斗量!CF作为最早的推荐算法,基于CF的改进在学术界和工业界应用的十分广泛,就在之前介绍的一篇论文里,介绍了腾讯实时ItemCF的实现和应用,所以说可千万别小瞧协同过滤了。本篇论文主要介绍...

2020-03-23 14:34:58

LTR|怎么理解基于机器学习“四大支柱”划分的学习排序方法

Learning to rank(LTR,L2R)也叫排序学习,泛指机器学习中任何用户排序的技术,是指一类监督学习(Supervised Learning)排序算法。 LTR被应用在很多领域,比如信息检索(Information Retrieval)、推荐系统(Recommend System)、搜索引擎(Search Engine)。LTR框架一般来讲,根据机器学习的“四大支柱”,LTR分为...

2020-03-21 14:02:44

2019全球人工智能技术峰会PDF资料拿走不谢

2019 全球人工智能技术峰会PDF资料免费分享,资料内容涵盖各个方面,全部都是一线互联网公司的产业实践。工业实践「百度」源于产业实践的开源深度学习平台飞浆(PaddlePaddle)「易观」如何建设大数据中台(从0到1建设大数据中台)「华为」云边协同,重新定义AI机器学习「网易云」AI算法在音乐推荐中的应用「VIPKID」在线教育行业中视频理解的应用「美团点评」美团外卖...

2019-08-08 12:58:29

你想要的【技术服务】和【商务合作】都在这里了,点击查看详情!

合作范围 Web全栈 数据服务 :-: :-: 论文算法实现 大数据服务 :-: :-: 跟拍摄影 广告接入 全网唯一ID:Thinkgamer,左侧”关于我“关注微信公众号”数据与算法联盟“,可在公众号添加我的微信,本人涉猎范围包括:Python,机器学习,Web开发,大数...

2018-04-03 20:21:24

怎么才能够坚持做一件事并且把它做好?

好久没写过碎言碎语的文章了,一直都是更新技术文章,那么今天就换换口味,聊一聊近况和想法。自从回北京之后,就一直在家办公,十几平方的卧室内支撑着北漂的身体和灵魂,我相信这不是我一个人的情况,而是无数在异国他乡追求自己理想的人的缩影。来北京工作的人无非就两种想法,第一:追求梦想,实现人生价值,可能的话定居北京,成为一个新的北京人,第二:赚钱,满足自己和家庭的生活、物质和一些所谓的虚荣心的需求。这两...

2020-03-16 09:05:11

论文|看腾讯如何玩转实时推荐-TencentRec

今天要分享的一篇论文是有关腾讯如何利用协同过滤(Collaborative Filtering)、基于内容和图进行实时推荐的,我们都知道协同过滤是传统的推荐算法,但在实际应用中取得的效果却很好,因此在各大公司应用的也非常广泛。协同过滤的改进经常出现了各种硕士研究生的毕业论文中,那都属于学术界的研究和实现,且是离线的,在工业界的CF算法实现和如何实时基于CF进行推荐的资料却是少之又少,接下来的内容...

2020-03-10 10:29:57

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 图书勋章
    图书勋章
    CSDN技术图书作者专属勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 技术圈认证(专家版)
    技术圈认证(专家版)
    博客专家完成年度认证,即可获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 原力计划专属勋章
    原力计划专属勋章
    2019年《原力计划【第一季】》专属勋章,现已经开启第二季活动啦,小伙伴们快去参加吧
  • 原力探索
    原力探索
    参与《原力计划【第二季】——打卡挑战》的文章入选【每日精选】的博主将会获得此勋章。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。
  • 分享精英
    分享精英
    成功上传11个资源即可获取