5 文文学霸

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 9w+

社交推荐系统中的用户交互

文章作者:查鲁·C.阿加沃尔编辑整理:Hoh内容来源:《推荐系统原理与实践》注:文末有赠书活动,欢迎参与~导读:近年来,社会性标签系统使得用户能够以一种自由的描述方法对网络上的资源进行协...

2020-07-13 21:42:00

所有机器学习项目都适用的检查清单

作者:Harshit Tyagi编译:ronghuaiyang导读构建端到端机器学习项目的任务检查清单。Image for post我正在创建一系列[有价值的项目](https://to...

2020-07-12 22:21:35

推荐系统遇上深度学习(八十六)-[腾讯&微博]GateNet:使用门机制提升点击率预估效果...

本文介绍的论文是《GateNet:Gating-Enhanced Deep Network for Click-Through Rate Prediction》下载地址为:https:/...

2020-07-11 21:35:49

优酷视频元素内容召回系统:多级多模态引擎探索

DataFunCon线上大会,火热报名中~点击图片了解详情分享嘉宾:崇懿 阿里文娱 技术专家编辑整理:李沛欣内容来源:阿里文娱技术出品平台:DataFunTalk导读:多级多模态引擎是为...

2020-07-09 21:54:55

一文总结词向量的计算、评估与优化

Datawhale干货作者:芙蕖,Datawhale优秀学习者,东北石油大学为了处理语言,需要将文本信息用向量的形式表达。词向量(Word Vector)或称为词嵌入(Word Em...

2020-07-09 21:54:55

干货分享|给即将参加秋招的同学一点建议

7月份到了,很多公司都陆陆续续的开启了秋招的进程,也有不少2021年毕业的同学也都在积极的准备着,并且也有很多同学都已经进入到了提前批的面试阶段。今天我就结合我自身的招聘经历来聊聊秋招算...

2020-07-08 21:45:36

字节跳动 | 算法三面复盘

作者|2020可真难整理|NewBeeNLP一面(45min)自我介绍项目介绍算法里有什么改进的地方吗?多线程间怎么通信?怎么部署的?unet结构,为什么要下采样,上采样?场景题...

2020-07-08 21:45:36

Elasticsearch遇上BERT:使用Elasticsearch和BERT构建搜索引擎

作者:Hironsan编译:ronghuaiyang导读强强联合,看看是否能有1+1>2的效果。在这篇文章中,我们使用一个预先训练好的BERT模型和Elasticsearch来构建一个搜...

2020-07-07 12:47:00

Google at KDD 2020,提出MoSE框架显式建模用户行为序列提升多任务学习效果

导读:今天分享一下Google在KDD 2020的一篇关于多目标优化的工作,在MMoE[2]多任务框架基础上引入LSTM显式建模用户行为序列提升多任务学习效果,推荐一读。论文:Multi...

2020-07-06 12:46:39

赠书丨如何高效学习计算机视觉?

计算机视觉是人工智能的一个热门方向,很多人想要入门,但是却找不到方向。对于初学者来说,最快的入门方法是边实践边学习,也就是要掌握计算机视觉的开发工具。但其实对初学者来说并不太友好,主要有...

2020-07-06 12:46:39

(ACL+ICML)2020推荐系统相关论文聚焦

前言第58届国际计算语言学协会年会(ACL,The Association for Computational Linguistics)将于2020年7月6号-8号线上举行。官网公布了A...

2020-07-05 21:47:34

Spark如何处理Hive的集合类型?

上一篇中我们介绍了hive中的数据类型,其中一类比较重要的类型即集合类型,主要包括struct、map、array三种。那么我们在spark中处理这三种类型呢?本文就来介绍一下。1、数据...

2020-07-05 21:47:34

Hive数据类型详解!

本篇来学习一下Hive中的数据类型,以及如何在Hive SQL中去处理这些数据类型。Hive的数据类型可以分为基本类型、字符串类型、日期与时间戳类型、集合类型,我们分别进行介绍:1、 基...

2020-07-04 21:47:51

机器学习模型评估与超参数调优详解

Datawhale干货作者:李祖贤 深圳大学,Datawhale高校群成员机器学习分为两类基本问题----回归与分类。在之前的文章中,也介绍了很多基本的机器学习模型。可在Dataw...

2020-07-03 21:46:39

汽车之家机器学习平台的架构与实践

文章作者:田董涛、王若愚、方矩编辑整理:Hoh内容来源:作者授权出品平台:DataFunTalk导读:汽车之家机器学习平台是为算法工程师打造的一站式机器学习服务平台,集数据导入、数据处理...

2020-07-02 22:19:12

什么是脏数据?怎样用箱形图分析异常值?终于有人讲明白了

导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础。没有可信的数据,数据挖掘构建的模型将是空中楼阁。数据质量分析的主要任务...

2020-07-02 22:19:12

为啥你的数据没法指导业务?

“那谁谁麻烦给我跑个数!”干我们这行的,最讨厌听到这句话,如果有更讨厌的,就是在你快下班时听到了这句话,还得在下班前就给到他。很多人挂着“数据分析师”的 title,实际上干着人肉跑数机...

2020-07-01 12:46:00

如何优雅地展示机器学习项目!

Datawhale干货作者:杨剑砺,Datawhale成员,数据分析师很多数据科学工作者都存在这样一个痛点,由于没有能点亮网页前端的技能树,导致在项目展示或项目合作时,无法快速...

2020-07-01 12:46:00

因子分解机算法原理及实现

由于在逻辑回归中使用的是特征的最原始组合,最终得到的分隔超平面属于线性模型,其只能处理线性可分的二分类问题。现实生活中的分类问题是多种多样的,存在大量的非线性可分的分类问题。...

2020-07-01 12:46:00

KDD2020推荐系统论文聚焦

前言ACM SIGKDD(国际数据挖掘与知识发现大会,简称KDD)是数据挖掘领域的最高级别的学术会议,由ACM的数据挖掘及知识发现专委会(SIGKDD)主办,是CCF A类会议。其中今年...

2020-06-30 12:46:00

查看更多

勋章 我的勋章
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。