7 DivinerShi

尚未进行身份认证

博客

等级
TA的排名 2w+

【CTR预估】 xDeepFM模型

xDeepFM 模型看作者邮箱应该中科大、北邮、微软合作发表的,发表在kdd2018 。看这个模型的原因是因为最近在写Deep Cross Network的时候感觉总是怪怪的,因为DCN对同一个特征的embedding内部都做了特征的交叉,这个和我们正常直观的特征交叉会有明显的出入,虽然DCN模型在实践中确实会好于正常的wide&deep,说明显式的特征交叉是有意义的,但是有没有办法不对...

2019-11-09 22:30:10

【GCN】: IntentGC算法框架

本篇论文是阿里发表在kdd2019的文章,是gcn在淘宝场景下的实际应用,还提供了源码,很具有可读性。论文地址:https://arxiv.org/pdf/1907.12377.pdf作者在论文里面附有对应的代码地址:https://github.com/peter14121/intentgc-models论文提出了一个新的基于GCN的大规模推荐算法框架:IntentGC。该算法框架利...

2019-09-03 23:20:56

【GCN】: Graph Convolutional Neural Networks for Web-Scale Recommender Systems

最近看了“GraphConvolutionalNeuralNetworksforWeb-ScaleRecommenderSystems”这篇文章,是Pinterest将GCN成功应用在大规模真实场景的论文,唯一可惜的是没有公开源码。论文下载地址:https://arxiv.org/pdf/1806.01973论文包含了理论创新和实际落地实现中的一些工程优化。这里对算法理论这块...

2019-06-16 17:09:18

【CTR预估】DSIN模型

最近看了一篇文章‘Deep Session Interest Network for Click-Through Rate Prediction’, 这篇是阿里发表在IJCAI2019的文章。文章地址:https://arxiv.org/abs/1905.06482作者还开源了代码:https://github.com/hhh920406/DSIN淘宝最近也公开了一个rank模型,和这...

2019-05-30 00:40:03

【CTR预估】Deep & Cross Network 模型

DCN模型是组合了显式和隐式特征交叉的一个模型。如果了解WD模型的话,简单的说这篇文章就是把WD模型的wide侧改成了cross网络,用来显式的做一些特征的交叉,因为DNN虽然有着拟合任意模型的能力,但是世界上没有免费的午餐,所以显式的定义特征交叉还是很有必要的。论文下载地址:https://arxiv.org/pdf/1708.05123.pdf这里我对一些常用的ctr预估模型进行了复现...

2019-05-07 23:44:37

【Semantic Embedding】: BERT模型

时间过的是真快,bert已经是去年火起来的模型了。论文"BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"地址:https://arxiv.org/abs/1810.04805 要了解bert一定要先看看tranformer模型,就是那篇"attention is all...

2019-05-02 16:52:28

【Semantic Embedding】: LSTM-DSSM模型

论文下载地址:https://arxiv.org/pdf/1412.6629.pdf其实这几篇论文,DSSM, C-DSSM, LSTM-DSSM 百度一下资料一大堆,不过我还是选择自己去看了一遍,然后做一下笔记,便于更深入的理解。不过看完了论文发现,这几篇文章真的是短小精悍。。。基本都是五六页结束。这篇文章还是一样的套路,是这对DSSM模型的修改,毕竟全连接网络是最简单的神经网络,替换一...

2019-04-17 22:58:04

【Semantic Embedding】: CDSSM(CLSM)模型

文章下载地址:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/cikm2014_cdssm_final.pdfDSSM模型的输入是query和doc的词袋模型生成的向量,所以模型丢失来文本的上下文结构信息。而CDSSM模型则通过词的n-gram和卷积池化操作来捕获上下文关系,按文章说明的,该算法相比原始DS...

2019-04-17 22:05:23

【Semantic Embedding】: DSSM模型

论文下载地址代码实现DSSM现在应该已经算是经典的文章了,有些年头了。网上已经有很多优秀的博客对该算法进行分析,建议去看那些文章,讲的比较全面。DSSM的思想是利用搜索点击数据,分别将query和documents利用DNN映射到高纬语义空间,然后将query和document的高纬语义向量利用余弦相似度,对向量进行相似度计算。训练阶段,对于点击数据,如果在当前query下,被点击...

2019-04-15 23:51:07

【Graph Embedding】: SDNE算法

论文“Structural Deep Network Embedding”发表在kdd2016论文下载地址:https://www.kdd.org/kdd2016/papers/files/rfp0191-wangAemb.pdf论文利用深度自编码器来学习图中节点的embedding向量,结合一阶和二阶相似度进行联合训练,将二阶相似度作为无监督信息,捕获全局网络结构信息,一阶相似度作为有监...

2019-04-09 23:17:01

【Graph Embedding】: node2vec算法

论文“node2vec:ScalableFeatureLearningforNetworks”发表在kdd2016,文章提出了一个新的graphembedding论文地址:https://www.kdd.org/kdd2016/papers/files/rfp0218-groverA.pdf作者提供的代码地址:http://snap.stanford.edu/node2vec/...

2019-03-27 23:33:42

【Graph Embedding】: LINE算法

论文“LINE:Large-scaleInformationNetworkEmbedding”发表在WWW‘15上,提出了一个适用于大规模网络embedding算法“LINE”。论文下载地址:https://arxiv.org/pdf/1503.03578.pdf作者公布的代码:https://github.com/tangjianpku/LINE介绍本篇文章提出的算法定义...

2019-03-24 16:33:30

【Graph Embedding】: DeepWalk算法

论文“DeepWalk: Online Learning of Social Representations” 发表在kdd2014,下载地址:https://arxiv.org/pdf/1403.6652.pdf作者开源的代码:https://github.com/phanein/deepwalk文章提出的deepwalk用于学习图网络中节点的低维表示,学习出的低纬embedding...

2019-03-21 23:35:23

【Graph Embedding】: metapath2vec算法

metapath2vec:ScalableRepresentationLearningforHeterogeneousNetworks发表在kdd2017,用于解决异构网络的embedding表示。个人看完文章的感觉就是将deepwalk的算法思路引入到异构网络当中,并针对异构网络的特点,针对deepwalk算法中的各个步骤,针对性的进行优化。所以看在了解metapath2vec之前...

2019-03-17 21:54:23

【Graph Embedding】:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

本文是阿里在kdd2018发表的关于使用graphembedding作为淘宝首页推荐召回策略的算法实现。现在利用图embedding来做召回算是业界最前沿的技术,下面我们来看看淘宝是如何来用户行为转化为图,以及从图中学习出item的embdding。论文下载地址:https://arxiv.org/abs/1803.02349介绍淘宝应该是国内最大的C2C平台,平台上承载着10亿的用...

2019-03-03 15:49:29

【Airbnb搜索】:Real-time Personalization using Embeddings for Search Ranking at Airbnb

原始论文下载地址:本文是kdd 2018 的best paper,文章来自airbnb的搜索推荐团队,描述的是airbnb如何使用embedding来提高搜索和排序的效果。知乎有官方认证的中文文章(文章地址,原始论文)。文章利用搜索的session数据来获取Listing和用户的embedding,全文思想相对来说还是比较简单的,但是整体针对业务实际情况,一步步的解决问题的思路很清晰,和a...

2019-02-24 21:08:19

【Airbnb搜索】:Applying Deep Learning To Airbnb Search

论文地址:https://arxiv.org/abs/1810.09591这篇论文将的是airbnb搜索在深度学习方面的探索airbnb最开始在搜索排序中使用的是gbdt,但是随着模型的稳定,gbdt带来的提升越来越有限。而这篇文章就是要讲airbnb将深度学习技术应用到实际环境中去的实践。论文并有没提出什么新的理论技术,重点放在了整个工程实现以及模型优化,迭代,各种在由传统机器学习向深度...

2019-02-16 17:42:13

【日本雅虎新闻推荐】:Embedding-based News Recommendation for Millions of Users(附开源代码)

本篇论文由日本雅虎团队发表于KDD 2017,利用深度学习方法将用户和文章进行embedding化,再进行推荐。下载地址:http://dacemirror.sci-hub.tw/proceedings-article/b79bf692bc190d28d255671a64aedf02/okura2017.pdf#view=FitH代码:https://github.com/Leavings...

2019-01-02 20:35:10

【Transformer模型】:Attention is all your need(附attention的代码)

tranformer已经火了好长一段时间了,一直只是只闻其名不知其意,特地看了attention is all your need。 这篇论文摒弃了传统encoder-decoder模型必须结合cnn或者rnn的固有模式,只用了attention模型,可谓大道至简。现在主流的序列转化模型都是基于端到端的encoder-decoder的RNN或者CNN网络结构模式。现在都是在该框架中引入了a...

2018-12-12 21:41:29

【基于序列的推荐】:Session-based Recommendations with Recurrent Neural Networks (附开源代码)

论文下载地址:https://arxiv.org/pdf/1511.06939.pdf论文实现代码:https://github.com/Shicoder/GRU4Rec首先解释一下什么是Session,Session就是从用户进入推荐界面到其离开的一次完整的行为流程。作者将rnn应用到session推荐任务中。在传统的推荐任务中,往往着重考虑用户最后一次的点击行为,而与之同一时间段下前几...

2018-11-21 23:31:48

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。