guoyuhaoaaa-CSDN博客

原创推荐搜索系统中关于多场景学习的常见方法

最近公司准备在做“one model to serve all”相关的探索 (毕竟行情不好了，大家都在为降本增效做好准备。做完了模型层面的合并事宜之后，接下来要发生的事情大家懂的都懂)。这两天看了一些业界做的比较好的方法，正好周末总结一下。今天的讲解方式并不是说将以上材料中的内容按照顺序从前到后完整的论述下来。而是按照一种建模框架的思路，将各个部分的内容融合进来。

2022-10-24 10:41:48 1859 2

今天要讲博客博客都围绕一个问题主题展开：有一个包含了N个元素的集合，在向量化的参数空间里，给出任何一个节点i，如何在最短的时间复杂度的前提下找到该节点iii的kkk临近向量子集。当然第一直觉是最少也要把元素iii和集合里其余N−1N-1N−1个元素两两比较，这样才能从这N−1N-1N−1个元素中找到k个最大的元素。当然如果在N不是特别大的时候，这种方法也是可以的。但是如果是类似应用在搜索推荐系统的召回环节，往往候选集规模在千万量级，这种全部遍历的方法往往效率就不够了。这时候就需要对检索结构进行特殊的设计，

2022-05-22 23:58:46 863

原创从用户长序列行为中有效抽取信息的常见方法

今天的博客主要参考了以下资料：1 2019年SIGIR会议的《Lifelong Sequential Modeling with Personalized Memorization for User Response Prediction》2 2018年WSDM会议的《Sequential Recommendation with User Memory Networks》3 2020年SIGIR会议的《User Behavior Retrieval for Click-Through Rate Pre

2022-03-31 16:49:34 2073 3

原创搜索搜索系统中常见的Debais方法与策略

最近由于刚刚入职了新公司，已经很久没有更新博客了。从今天开始，要开始慢慢总结工作与学习了。今天的博客主要参考了2019年华为诺亚方舟实验室在ResSys会议的paper《PAL:APositionbiasAwareLearningFrameworkforCTRPredictioninLiveRecommenderSystems》，微软发表的paper《Modeling and Simultaneously Removing Bias via Adversarial Neural Networks》以及美团N

2021-08-03 14:28:30 645

原创基于边缘计算框架的端上推荐模型

今天的博客主要参考了2020年CIKM会议的paper《EdgeRec: Recommender System on Edge in Mobile Taobao》。这篇paper提出的在手机淘宝客户端上部署的边缘计算推荐模型应该是边缘计算在推荐领域落地应用的开山之作。首先，我来解释一下我理解的“边缘计算”这个概念在淘宝推荐领域应用的意思。所谓“边缘计算”其实是随着手机移动端的计算能力、存储能力越来越强，相较于传统的CS(client,server)模式中client端只负责用户行为特征数据采集，其被赋予了

2021-03-12 15:51:31 1118 2

原创基于GNN网络的session推荐模型（知识图谱技术在推荐场景的应用）

今天的博客主要参考了2019年AAAI的论文《Session-based Recommendation with Graph Neural Networks》和2020年SIGIR的论文《Global Context Enhanced Graph Neural Networks for Session-based Recommendation》。主要讲解了如何利用当下最火的GNN模型辅助Session-based 下的行为序列建模。所谓Session-based 场景下的推荐模型建模，其实就是利用用户在t

2020-12-27 18:26:00 985

原创利用深度学习网络显示挖掘高阶特征交互的CTR模型

今天的论文主要参考了华为诺亚方舟实验室这两年的3篇paper，分别是2019年WWW会议上的《Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction》，2020年KDD会议上的《AutoFIS: Automatic Feature Interaction Selection in Factorization Models for Click-Through Rate Prediction》和20

2020-09-30 19:44:29 2049

原创一种基于超长用户点击序列的CTR预估模型（算法和工程架构的 co-design）

今天的论文参考了2019年KDD的paper《Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction》，这也是阿里妈妈盖坤组最新的在定向广告方向的研究实践成果，即在进行CTR预估的时候考虑了用户更长时间的行为序列信息。首先从整体来讲，我觉得这篇paper是有一定划时代的意义的，和之前...

2020-06-22 11:31:15 1938

原创深度学习在工业界的应用案例（二）

今天的博客主要参考了4篇paper，分别为阿里妈妈定向广告推荐团队的《Deep Session Interest Network for Click-Through Rate Prediction》和《Deep Match to Rank Model for Personalized Click-Through Rate Prediction》，蚂蚁金服风控团队的《A Semi-supervised Graph Attentive Network for Financial Fraud Detection》

2020-06-02 20:56:45 1678

原创基于稀疏特征场景的embedding策略和基于非平衡数据的DICE损失函数

今天的博客主要参考了阿里妈妈定向广告团队的论文《Res-embedding for Deep Learning Based Click-Through Rate Prediction Modeling》和香侬科技李纪为团队的论文《Dice Loss for Data-imbalanced NLP Tasks》。首先声明的是，这两篇paper在内容上并没有直接的关系，但是最近是我看的论文里比较有启发意义的，所以索性就在一篇博客里一起总结一下。首先介绍《Res-embedding for Deep Learn

2020-05-26 11:33:11 923

空空如也

空空如也