自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (6)
  • 收藏
  • 关注

空空如也

atec_nlp_sim_train_all.csv

蚂蚁金融文本匹配训练数据,个性化的普惠金融服务体验,本质是充分理解用户意图,在已有知识体系中精准地找到与之相匹配的内容

2020-06-09

Apache Oozie.pdf

大数据相关,大数据资源调度,oozie,可创建定时调度任务

2019-05-31

spark 高级数据分析

大数据是这几年科技和应用领域炙手可热的话题,而Spark 又是大数据领域里最活跃的技 术。对Spark 这个技术,国内研究比较多的是原理和源代码,而许多客户抱怨Spark 应用 落地难。造成这一现象的一个主要原因是Spark 技术比较新,许多应用还处在探索阶段。 Cloudera 公司作为全球大数据领域的领头羊,在给全球客户提供最高质量大数据平台的同 时,也积累了许多Spark 应用方面的宝贵经验。本书四位作者均为Cloudera 公司的数据科 学家,也长期为客户提供专业的数据分析服务。可以说,本书的出版将为Spark 数据分析 项目的落地起到巨大的推动作用。

2018-06-11

A LargeScale Analysis of Query Logs for Assessing Personalization Opportunities

推荐系统论文,大规模数据分析Query logs, the patterns of activity left by millions of users, contain a wealth of information that can be mined to aid personalization. We perform a large-scale study of Yahoo! search engine logs, tracking 1.35 million browser-cookies over a period of 6 months. We define metrics to address questions such as 1) How much history is available?, 2) How do users’ topical interests vary, as reflected by their queries?, and 3) What can we learn from user clicks? We find that there is significantly more expected history for the user of a randomly picked query than for a randomly picked user. We show that users exhibit consistent topical interests that vary between users. We also see that user clicks indicate a variety of special interests. Our findings shed light on user activity and can inform future personalization efforts.

2018-06-11

R语言的绘图功能及应用案例

R语言的绘图功能及应用案例

2013-10-22

CLEMENTINE

CLEMENTINE 实例指南 各种实例教程,适合初学者。更好地掌握CLEMENTINE.学会数据挖掘技术

2013-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除