搜索与推荐Wiki-CSDN博客

原创闲聊推荐系统中的曝光过滤机制

某天某时某刻在摸鱼，闲刷某乎，看到了一篇实用性很强的文章：【闲聊推荐架构】推荐系统的曝光去重该怎么设计？，仔细阅读了一番，发现写的是真不错，推荐大家去读，但是这篇文章可能是一个「工程大佬」写的，对于曝光过滤的设计实现层面写的很赞，但是对于偏向于算法层面的同学来讲，可能不是那么友好，因此提笔在该篇文章和一些话题讨论基础上，结合笔者自己的工作经验进行补充和介绍，如果大家有什么好的想法和提议欢迎在评论区留言！1.曝光过滤问题的定义相信做推荐系统的朋友对「曝光过滤」这个话题肯定不陌生，试想在某个电商平台中总是给

2021-08-09 22:39:17 822

原创论文｜SDNE的算法原理、代码实现和在阿里凑单场景中的应用说明

1.概述SDNE（Structural Deep Network Embedding）算法是发表在KDD-2016上的一篇文章，论文的下载地址为：https://www.kdd.org/kdd2016/papers/files/rfp0191-wangAemb.pdfSDNE主要也是用来构建node embedding的，和之前介绍的node2vec发表在同年，但不过node2vec可以看作是deepwalk的扩展，而SDNE可以看作是LINE的扩展。2.算法原理SDNE和LINE中相似度的定义是一

2021-08-09 22:38:38 696

转载 Google官方开源的推荐系统工具库介绍（含视频教程）

说明：文章内容仅供学习使用，如有侵权请联系删除编辑：搜索与推荐Wiki参考：1.谷歌开源推荐系统库(TensorFlow Recommenders)2.中文视频 | TF Recommenders 系列视频教程TensorFlow RecommendersTensorFlow推荐器是一个使用TensorFlow构建推荐系统模型的库。它有助于构建推荐系统的全部工作流程:数据准备、模型制定、训练、评估和部署。它构建在Keras上，目标是让学习者有一个平缓的学习曲线，同时仍然给你构建复杂模型的灵活

2021-08-09 22:33:20 1101

原创 ItemCF的演进：狭义 VS 广义

CF在推荐系统的发展中扮演着举足轻重的角色，虽然已经被使用很长时间了，但依旧经久不衰。在各大互联网公司都保存着CF的使用，而气召回的效果也一直都很好。本文主要是描述一下狭义上的Item CF和广义上的Item CF，欢迎拍砖！狭义上的Item CF1.1 ItemCF 的原理ItemCF是基于Item的协同过滤（Collaboration Filter）算法，它是通过分析用户的行为来计算Item的相似度。与基于内容计算相似、一些embedding方法相比，itemcf中增加了用户的行为，在线上效果表

2021-06-04 06:56:12 641

原创 Spark推荐系列之Word2vec算法介绍、实现和应用说明

Spark推荐实战系列目前已经更新：Spark推荐实战系列之Swing算法介绍、实现与在阿里飞猪的实战应用Spark推荐实战系列之ALS算法实现分析Spark中如何使用矩阵运算间接实现i2iFP-Growth算法原理、Spark实现和应用介绍Spark推荐系列之Word2vec算法介绍、实验和应用说明更多精彩内容，请持续关注「搜索与推荐Wiki」！1. 背景word2vec 是Google 2013年提出的用于计算词向量的工具，在论文Efficient Estimation of Wor

2021-06-04 06:54:16 757 2

原创论文｜LINE算法原理、代码实战和应用

1 概述LINE是2015年微软发表的一篇论文，其全称为： Large-scale Information Network Embedding。论文下载地址：https://arxiv.org/pdf/1503.03578.pdfLINE是一种基于graph产生embedding的方法，它可以适用于任何类型的graph，如无向图、有向图、加权图等，同时作者基于边采样进行了目标函数的优化，使算法既能捕获到局部的网络结构，也能捕获到全局的网络结构。2 算法原理2.1 新的相似度定义该算法同时优化了节点

2021-05-26 08:17:06 2201

原创论文｜Node2vec算法原理、代码实战和在微信朋友圈的应用

1 概述Node2vec是2016年斯坦福教授 Jure Leskovec、Aditya Grover提出的论文，论文的下载链接为：https://arxiv.org/pdf/1607.00653.pdf。其本质上是对Deepwalk的延伸，也是属于图神经网络种随机游走模型一类。不了解Deepwalk的可以看上一篇文章：论文｜DeepWalk的算法原理、代码实现和应用说明。Node2vec在DeepWalk的基础上提出了更加合理的图特征学习方法，提出了用于网络中可伸缩特征学习的半监督算法，使用SGD优

2021-05-26 08:14:57 924

原创论文｜DeepWalk的算法原理、代码实现和应用说明

万物皆可Embedding系列会结合论文和实践经验进行介绍，前期主要集中在论文中，后期会加入实践经验和案例，目前已更新：万物皆可Vector之语言模型：从N-Gram到NNLM、RNNLM万物皆可Vector之Word2vec：2个模型、2个优化及实战使用Item2vec中值得细细品味的8个经典tricks和thinksSentence2Vec & GloVe 算法原理、推导与实现Doc2vec的算法原理、代码实现及应用启发DeepWalk的算法原理、代码实现和应用说明后续会持续更

2021-05-09 09:56:47 4703

原创论文｜一种基于Embedding和Mapping的跨域推荐方法

迁移学习（Transfer Learning）作为机器学习的一大分支，已经取得了长足的进步。在人工智能领域，无论是图像识别、NLP、搜索推荐都离不开迁移学习的身影。迁移学习的核心问题是找到源域和目标域的某种相似性，继而将已知的知识应用到目标域中。迁移学习的一个核心要解决的问题是冷启动、数据稀疏性，当然其前提是同一个公司有不同的业务或者APP数据可以供不同部门进行使用和挖掘，比如阿里、腾讯、美团等，业务模型丰富，可以进行相应的迁移学习。当迁移学习应用到推荐系统中时就被称为跨域推荐（Cross-Domain

2021-04-20 22:46:27 1187 8

原创 Swing算法介绍、实现与在阿里飞猪的实战应用

本系列主要是基于Spark的推荐算法实战系列，本文为首篇，欢迎关注！1.Swing算法介绍Swing算法原理比较简单，是阿里早期使用到的一种召回算法，在阿里多个业务被验证过非常有效的一种召回方式，它认为 user-item-user 的结构比 itemCF 的单边结构更稳定，截止目前并没有公开的论文进行介绍和说明（可能是因为比较简单，阿里看不上哈哈），但是根据网上的各种资料，对该算法的原理进行介绍，如有错误，欢迎指正。Swing指的是秋千，例如用户 uuu 和用户 vvv ，都购买过同一件商品iii，

2021-04-20 22:44:50 9391 2

原创 ABTest流量分发和业界的一些经验

流量为王的时代，如何精准的利用用户的流量进行分析和产品的迭代？ABTest就是其中不可缺少的一环，那么ABTest是什么呢？下面来一层一层揭开它神秘的面纱。0.流量分发在互联网流量的分发模式中，主要的两种分发模式为：中心化：平台负责流量的分配，节点的流量来自平台分配，平台拥有流量的控制权，比如像淘宝、京东、美团等互联网产品都是一个中心化的流量分发模式去中心化：相对于中心化而言，去中心化模式并不负责流量的分配，节点的流量需要自己获取，节点本身拥有流量的控制权，其中典型的产品是微信，张小龙在阐述微信公

2021-04-13 17:10:13 1930 1

原创算法工程师的自我修养

看过星爷电影《喜剧之王》的人都知道，在电影中出现的一本书叫《演员的自我修养》，一个演员可以跑一次、十次、一百次龙套，但是不能跑一辈子龙套，跑一辈子龙套的不叫演员，只能叫跑龙套！同样在我们做技术的、做算法的也是一样的道理，如果从业期间，不追求技术的长进和个人成长，那和跑龙套的有什么区别，拿着差不多的工资，干着差不多的活，回到差不多的家，喝着差不多的茶，过着差不多的人生，演着差不多的笑话！那么算法工程师（这里本来想写技术工程师的，但是太广了，由于自己是从事算法行业的，所以就写算法了）的自我修养是什么呢？自我

2021-03-23 09:16:26 1782 4

原创结合论文看Youtube推荐系统中召回和排序的演进之路（中）篇

上一篇（结合论文看Youtube推荐系统中召回和排序的演进之路（上）篇）主要介绍的是Youtube发表的三篇论文，但主要集中在机器学习方向，接下来会用几篇论文说明一下Youtube在深度学习推荐系统方向做的工作。在介绍Youtube的DNN之前，先介绍一篇Google的非常经典的深度学习推荐算法Wide & Deep，虽然Youtube 也属于Google，这里之所以先介绍Wide & Deep，因为我个人觉得这应该是深度学习应用在推荐系统排序上的「基石」之作，而且其提出的框架也是非常的经

2021-01-27 08:50:18 11556 9

原创强化学习介绍和马尔可夫决策过程详细推导

强化学习系列学习笔记，结合《UCL强化学习公开课》、《白话强化学习与PyTorch》、网络内容，如有错误请指正，一起学习！强化学习基本介绍强化学习的中心思想是让智能体在环境中自我学习和迭代优化。强化学习流程强化学习的过程是一个反馈控制系统，其大概的一个流程图如下所示：结合这张图，我们进行相关的概念解释和流程说明。首先图中涉及了几个概念，我们依次来看下是什么意思。Agent：或者称为“Brain”、大脑、智能体，是机器人的智能主体部分，也即我们要操控的对象Environment：指机器人所处

2021-01-18 22:40:57 1385 2

原创结合论文看Youtube推荐系统中召回和排序的演进之路（上）篇

本文涉及的论文如下：【2008 年】Video Suggestion and Discovery for YouTube: Taking Random Walks Through the View Graph【RecSys 2010】The YouTube Video Recommendation System【ICML 2013】Label Partitioning For Sublinear Ranking内容主要介绍Youtube在机器学习方面的探索和尝试！后续会更新Youtube在深度学

2021-01-12 12:32:50 2873 4

原创论文｜Sentence2Vec & GloVe 算法原理、推导与实现

万物皆可Embedding系列会结合论文和实践经验进行介绍，前期主要集中在论文中，后期会加入实践经验和案例，目前已更新：万物皆可Vector之语言模型：从N-Gram到NNLM、RNNLM万物皆可Vector之Word2vec：2个模型、2个优化及实战使用Item2vec中值得细细品味的8个经典tricks和thinksDoc2vec的算法原理、代码实现及应用启发Sentence2Vec & GloVe 算法原理、推导实与现后续会持续更新Embedding相关的文章，欢迎持续关注「搜

2020-12-22 09:15:21 10022 5

原创论文｜Doc2vec的算法原理、代码实现及应用启发

万物皆可Embedding系列会结合论文和实践经验进行介绍，前期主要集中在论文中，后期会加入实践经验和案例，目前已更新：万物皆可Vector之语言模型：从N-Gram到NNLM、RNNLM万物皆可Vector之Word2vec：2个模型、2个优化及实战使用Item2vec中值得细细品味的8个经典tricks和thinksDoc2vec的算法原理、代码实现及应用启发后续会持续更新Embedding相关的文章，欢迎持续关注「搜索与推荐Wiki」Doc2vec是Mikolov2014年提出的论文

2020-12-17 11:31:21 861 2

原创论文｜Item2vec论文中值得细细品味的8个经典tricks和thinks

本主题文章将会分为三部分介绍，每部分的主题为：word2vec的前奏-统计语言模型word2vec详解-风华不减其他xxx2vec论文和应用介绍后续会更新Embedding相关的文章，可能会单独成系列，也可能会放到《特征工程-Embedding系列中》，欢迎持续关注「搜索与推荐Wiki」Item2vec：论文《Item2Vec：Neural Item Embedding for Collaborative Filtering》来自于微软2016年发表在RecSys上的，因为word2vec

2020-12-09 09:11:24 1388 1

原创论文｜万物皆可Vector之Word2vec：2个模型、2个优化及实战使用

本主题文章将会分为三部分介绍，每部分的主题为：word2vec的前奏-统计语言模型word2vec详解-风华不减其他xxx2vec论文和应用介绍后续会更新Embedding相关的文章，可能会单独成系列，也可能会放到《特征工程-Embedding系列中》，欢迎持续关注「搜索与推荐Wiki」2.1、背景介绍word2vec 是Google 2013年提出的用于计算词向量的工具，在论文Efficient Estimation of Word Representations in Vector S

2020-12-07 12:08:29 908 2

原创论文｜万物皆可Vector之语言模型：从N-Gram到NNLM、RNNLM

本主题文章将会分为三部分介绍，每部分的主题为：word2vec的前奏-统计语言模型word2vec详解-风华不减其他xxx2vec论文和应用介绍后续会更新Embedding相关的文章，可能会单独成系列，也可能会放到《特征工程-Embedding系列中》，欢迎持续关注「搜索与推荐Wiki」1.1、基础知识a）定义语言模型（Language model）是自然语言处理的重要技术，自然语言处理中最常见的是文本数据，我们可以把一段自然语言文本看作是一段离散的时间序列，假设一段长度为TTT的文本中

2020-12-07 12:05:22 841

原创论文｜Airbnb Embedding的实践和思考

其实在19年初的时候大概看了一下这篇论文，但当时其实理解的并不深，今天再读的时候发现这里边其实包含了很多东西，不仅是学术性的目标函数优化，也包括工程性的取舍和特征的构造。本文分为两部分，第一部分主要介绍论文，第二部分谈从中的收获和启发，如果你对论文比较熟悉的话可以直接阅读第二部分。第一部分引言Airbnb于2018年提出了论文《Real-time Personalization using Embeddings for Search Ranking at Airbnb》，可谓是Embedding技术

2020-11-27 07:15:52 505

原创从极大似然到对数损失函数和交叉熵损失函数，以及对数损失优化取值范围

本文主要介绍CTR场景中的对数损失函数和交叉熵损失函数，以及对数损失函数的取值范围，如果觉得对你有帮助，文末「分享」「点赞」「在看」来一波，点击「阅读原文」获取精彩比例PDF下载链接。极大似然估计在统计学领域，有两种对立的思想学派：贝叶斯学派和经典学派（频率学派），他们之间最大的区别是如何看待被估计的参数。贝叶斯学派的观点是将其看成是已知分布的随机变量，而经典学派的观点是将其看成未知的待估计的常量。极大似然估计属于经典学派的一种。通俗来说，极大似然估计就是利用已知的样本结果信息，反推最大概率出现这.

2020-08-19 08:17:48 1833

原创论文｜从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考

基于深度学习的召回近些年已经得到了长足的发展，其中双塔模型更是作为经典的深度学习召回模型被各大公司应用，回顾双塔模型的发展可以追溯到2003年微软发布的DSSM模型，本篇文章将会从DSSM开始介绍几篇论文，看一下DSSM模型是怎么发展成为双塔模型并应用在推荐系统中做召回的。DSSMDSSM模型是2013年微软发布的，其论文全称为：Learning Deep Structured Semantic Models for Web Search using Clickthrough Dara（https://

2020-08-12 12:32:40 1435

原创关于推荐算法工程师大家比较关注的几个问题

今天在《推荐系统开发实战》的读者群里聊天，在探讨技术问题的时候发现也有朋友对一些非技术的问题比较感兴趣，这里进行总结和分享，希望能够帮助到看这篇文章的人。欢迎加我的微信进行技术交流，非技术的人生思考问题也可以进行探讨。我的微信号如下图以下问题，随机排序，不分先后！Q、推荐算法工程师的工资待遇怎么样A：这个问题真的是很直接呀，当然可以理解，毕竟我们工作就是为了赚钱，为了生活。推荐算法工程师和算法工程师的待遇基本差不多，不过不同地方、不同级别的推荐算法工程师待遇肯定是不一样，比如一线的北上广深

2020-07-24 12:00:41 45601 1

翻译 Kaggle宝典｜使用Python进行全面的数据探索

算法工程师的日常工作中基础最多的便是数据，但是大多数的算法工程师在使用数据过程中，最缺少的还是对数据的整体把控和分析，更多靠的是业务经验。但是严谨的算法工程师在建模之前是需要对数据进行探索和分析的，以便于在建模过程中能给更快的做出更优的模型。生活中最苦难的事情就是了解自己，建模过程中最苦难的事是了解数据！了解数据是一件非常困难的事情，且非常耗时，因此从事数据科学很容易忽略前期的数据了解，而直接对数据进行应用。本文是一篇非完整的翻译文（在个人理解的基础上进行翻译，个人水平有限，如果文章有误，欢迎在评论.

2020-07-11 11:30:37 914

原创传统机器学习和前沿深度学习推荐模型演化关系介绍

本文来自王喆老师《深度学习推荐系统》一书，如果有一定的推荐系统基础的话，建议读一读，当然如果只是初学者的话还是建议从基础的开始学起，比如《推荐系统开发实战》。传统机器学习推荐模型演化简单讲，传统推荐模型的发展主要由以下几部分组成协同过滤算法族即上图中蓝色部分，协同过滤是推荐系统的首选模型，从物品相似度和用户相似角度出发，衍生出了ItemCF和UserCF两种算法。为了使协同过滤衍生出矩阵分解模型（Matrix Factorization，MF），并发展出矩阵分解的各分支模型。逻辑回归模型族.

2020-06-30 08:16:41 1157

原创独孤九剑：算法模型训练的一般流程

这篇文章主要分享一下模型训练的一般流程，目的是让大家明白做一个算法模型过程中会涉及的流程和数据特征在算法模型中的重要性。作为一名算法工程师训练模型可谓是家常便饭，不管是做推荐中的召回模型、排序模型还是其他领域的分类模型等，都应该有一个规范化的流程，这样在做模型的过程中也会更加清晰，当然也不一定完全遵循这个流程，只是说基本过程应该是一致的。1、总诀式——定义问题What，How，Why。首先要弄清楚自己要干什么，然后调研相关的技术确定怎么解决问题，最后反思自己为什么要用这个方案解决这个问题，有没有更好的

2020-06-29 07:27:36 2835

原创 CTR预估模型中的正负样本定义、选择和比例控制

目前推荐系统中给用户进行推荐大部分都是基于CTR预估来做的，CTR预估中很重要的一环便是正负样本的选择，那么不同业务场景下我们如何定义正负样本、如何控制正负样本的比例、正负样本选择有哪些技巧？虽然这些只是模型训练中的一环，但却也扮演着重要的角色。这篇文章简单聊一下上边提到的问题，如何你对这有什么想法和意见，欢迎在评论区留言，一起沟通。分析业务场景不同业务场景下对应的kpi也是不同的，那么模型训练的目标也是不一致的，比如kpi是点击率，那么模型训练的目的就是增加推荐的准确性，提升用户的准确率；如果k.

2020-06-19 10:02:54 4108 4

原创用户网络行为画像知识点纪要

用户画像在推荐系统中扮演着重要的角色，这篇文章主要是阅读《用户网络行为画像》一书的读书摘要，该书较老，感觉更加适合产品经理或者不懂推荐的人看，如果读者本身就是一个推荐从业者的话，只需要看书的前半部分，对用户画像有个本质的理解即可，后半部分可忽略。可以在京东或者当当上购买纸质版图书，也可以购买京东上的电子版，如果想要获取免费的电子版，加我的微信号，备注【book】即可获取用户描述分为三种情况用户画像（User Portrait），更倾向于对同一类用户进行不同维度的刻画用户角色（User .

2020-06-10 17:15:17 1016

原创基于tensorflow实现稀疏自编码和在推荐中的应用

稀疏自编码自编码器（Auto-Encoder）顾名思义，即可以利用自身的高阶特征编码自己。自编码器也是一种神经网络，他的输入和输出是一致的，他借助稀疏编码的思想，目标是使用稀疏的一些高阶特征重新组合来重构自己。因此他的特征十分明显：期望输入与输出一致希望使用高阶特征来重构自己，而不只是复制像素点自编码器的输入节点和输出节点的数量是一致的，但如果只是单纯的逐个复制输入节点则没有意义，像前面提到的，自编码器通常希望使用少量稀疏的高维特征来重构输入，所以加入几种限制：（1）中间隐含层节点的数量。

2020-05-28 20:45:45 1257 3

原创基于DNN的推荐算法

本文为《推荐系统与深度学习》第六章的复习笔记，只记录了一些要点，希望能够快速的进行复习，如果发现哪一个点不明白的话，可以自行展开学习或者加小编微信进行沟通。深度学习在推荐中发挥的作用：能够直接从内容中提取特征，表征能力强容易对噪声数据进行处理，抗噪能力强可以使用循环神经网络对动态或者序列数据进行建模可以更加准确的学习user和item的特征基于DNN的推荐算法推荐系统和通用搜索排序问题共有的一大挑战为同时具备记忆能力和泛化能力。记忆能力可以解释为学习那些经常共同出现的特征，发现历史.

2020-05-27 23:19:36 2754

原创晓得嘛？混合推荐系统速览和技巧锦囊

本文为《推荐系统与深度学习》第五章的复习笔记，只记录了一些要点，希望能够快速的进行复习，如果发现哪一个点不明白的话，可以自行展开学习或者加小编微信进行技术交流。5.1 什么是混合推荐系统混合推荐系统的含义海量数据推荐系统中通常存在三部分：在线系统（Online）直接与用户进行交互，具有高性能、高可用的特性，通常利用缓存系统，处理热门请求的重复计算近在线系统（Nearline）接受在线系统的请求，执行比较复杂的推荐算法，缓存在线系统的结果，并及时收集用户的反馈，快速调整结果离.

2020-05-20 14:50:09 981

原创虽然简单但确不能不会的推荐算法重点回顾

本文为《推荐系统与深度学习》第四章的复习笔记，只记录了一些要点，希望能够快速的进行复习，如果发现哪一个点不明白的话，可以自行展开学习。4.1 基于内容的推荐算法基于内容的推荐算法步骤：特征（内容）提取用户偏好计算内容召回（召回用户偏好的top K）物品排序（可以根据top K中其他用户打分平均值最高的top N推荐给用户，好处是可以考虑其他用户的意见）优点：物品没有冷启动问题（因为物品的内容特征不依赖于用户数据），推荐出的物品也不会存在过于热门的问题能够捕获到用户的特殊偏好原理.

2020-05-11 17:10:05 826

原创论文｜AGREE-基于注意力机制的群组推荐，含代码（Attentive Group Recommendation）

这篇文章主要分享的论文是2018年被CCF收录的一篇论文：Attentive Group Recommendation（基于注意力机制的群组推荐），第一作者是湖南大学的曹达老师，二作是论文Neural Collaborative Filtering的作者何老师。当然也会结合小编的工作来进行一些补充说明，写的不好，欢迎拍砖！

2020-04-24 11:56:26 3136 4

原创论文｜组推荐系统及其应用研究

这篇文章主要是普及一下群组推荐系统，众所周知，推荐系统已经应用十分广泛，群组推荐的应用不仅老用户上发挥了极大的作用，在新用户的冷启动上也发挥了很大的作用。由于后续会有一篇文章介绍结合深度学习的群组推荐，所以这里先借用该篇论文，借花献佛，介绍一下群组推荐系统和其应用。本文中所涉及的内容算是比较老了，但在不同公司或者推荐系统的不同阶段仍然有应用，其中群组推荐的思想更是经久不衰，所以本文比较适合以“...

2020-04-13 21:50:16 1047

原创论文｜被“玩烂”了的协同过滤加上神经网络怎么搞？

相信熟悉推荐系统的同学对于协同过滤（Collaborative Filtering）已经熟悉的不能再熟悉了，我也相信很多人心里在想“这么简单的协同，都2020年了，谁还用呀”。俗话说得好，人不可貌相，海水不可斗量！CF作为最早的推荐算法，基于CF的改进在学术界和工业界应用的十分广泛，就在之前介绍的一篇论文里，介绍了腾讯实时ItemCF的实现和应用，所以说可千万别小瞧协同过滤了。本篇论文主要介绍...

2020-03-23 14:34:58 1918

原创 LTR｜怎么理解基于机器学习“四大支柱”划分的学习排序方法

Learning to rank（LTR，L2R）也叫排序学习，泛指机器学习中任何用户排序的技术，是指一类监督学习（Supervised Learning）排序算法。 LTR被应用在很多领域，比如信息检索（Information Retrieval）、推荐系统（Recommend System）、搜索引擎（Search Engine）。LTR框架一般来讲，根据机器学习的“四大支柱”，LTR分为...

2020-03-21 14:02:44 4346 3

原创 2019全球人工智能技术峰会PDF资料拿走不谢

2019 全球人工智能技术峰会PDF资料免费分享，资料内容涵盖各个方面，全部都是一线互联网公司的产业实践。工业实践「百度」源于产业实践的开源深度学习平台飞浆（PaddlePaddle）「易观」如何建设大数据中台（从0到1建设大数据中台）「华为」云边协同，重新定义AI机器学习「网易云」AI算法在音乐推荐中的应用「VIPKID」在线教育行业中视频理解的应用「美团点评」美团外卖...

2020-03-18 19:19:08 4622

原创怎么才能够坚持做一件事并且把它做好？

好久没写过碎言碎语的文章了，一直都是更新技术文章，那么今天就换换口味，聊一聊近况和想法。自从回北京之后，就一直在家办公，十几平方的卧室内支撑着北漂的身体和灵魂，我相信这不是我一个人的情况，而是无数在异国他乡追求自己理想的人的缩影。来北京工作的人无非就两种想法，第一：追求梦想，实现人生价值，可能的话定居北京，成为一个新的北京人，第二：赚钱，满足自己和家庭的生活、物质和一些所谓的虚荣心的需求。这两...

2020-03-16 09:05:11 6233 8

原创论文｜看腾讯如何玩转实时推荐-TencentRec

今天要分享的一篇论文是有关腾讯如何利用协同过滤（Collaborative Filtering）、基于内容和图进行实时推荐的，我们都知道协同过滤是传统的推荐算法，但在实际应用中取得的效果却很好，因此在各大公司应用的也非常广泛。协同过滤的改进经常出现了各种硕士研究生的毕业论文中，那都属于学术界的研究和实现，且是离线的，在工业界的CF算法实现和如何实时基于CF进行推荐的资料却是少之又少，接下来的内容...

2020-03-10 10:29:57 1297 3

grafana-6.3.3-1 rpm安装包.zip

grafana-6.3.3-1.x86_64.rpm 安装包，

2020-04-09

word2vec.zip

word2vec 官方资源未修改版和malloc函数替换版，官方源码需要科学上网才能获取，这里进行提供，同时mac os系统下需要修改malloc函数方可使用，这里也提供一份修改后的

2019-11-13

NLP汉语自然语言处理原理与实战

自然语言处理大体是从1950年代开始，虽然更早期也有作为。1950年，图灵发表论文“计算机器与智能”，提出现在所谓的“图灵测试”作为判断智能的条件。 1954年的乔治城实验涉及全部自动翻译超过60句俄文成为英文。研究人员声称三到五年之内即可解决机器翻译的问题。[1]不过实际进展远低于预期，1966年的ALPAC报告发现十年研究未达预期目标，机器翻译的研究经费遭到大幅削减。一直到1980年代末期，统计机器翻译系统发展出来，机器翻译的研究才得以更上一层楼。 1960年代发展特别成功的NLP系统包括SHRDLU——一个词汇设限、运作于受限如“积木世界”的一种自然语言系统，以及1964-1966年约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息，有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时，可能会得到空泛的回答。例如问题是“我的头痛”，回答是“为什么说你头痛？

2018-06-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

grafana-6.3.3-1 rpm安装包.zip

word2vec.zip

NLP汉语自然语言处理原理与实战

一种人脸表情分类的新方法_Manhattan距离

基于用户兴趣分类的协同过滤推荐算法

gephi-0.9.1-windows.exe

mysql-connector-java-5.0.4-bin.jar

commons-el-1.0.jar，jasper-compiler.jar，jasper-runtime.jar

delicious.dat

kosarak.dat

从疝气病症预测病马的死亡率的测试数据集

从疝气病症预测病马的死亡率的训练数据集

hadoop-eclipse-plugin-2.6.0.jar

lucene4.3.0+IK Analyzer2012FF

IKAnalyzer_all_jar

十大算法之线性查找算法

MySQL基本教程

高精度的加减乘除

securboot未完全配置消除补丁

空空如也