6 炒饭君

尚未进行身份认证

暂无相关简介

等级
TA的排名 1w+

Mahout推荐算法API详解

用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。

2015-12-26 14:13:13

使用Python实现Hadoop MapReduce程序

hadoop支持多种语言编写mp程序,这里是网上的一篇使用python实现的mp例子

2015-12-26 13:23:00

推荐系统公共资源汇总

推荐系统公共资源汇总

2015-12-23 16:50:18

从源代码剖析Mahout推荐引擎

转自:http://blog.fens.me/mahout-recommend-engine/前言Mahout框架中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集,同时规范了数据结构,并标准化了程序开发过程。应用推荐算法时,代码也就7-8行,简单地有点像R了。为了使用简单的目标,Mahout推荐引擎必然要做到精巧的程序设计。本文将介绍Maho

2015-12-12 21:03:12

【转】机器学习最佳入门学习资料汇总

机器学习最佳入门学习资料汇总专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门?资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学

2015-12-11 19:52:11

A cost-effective recommender system for taxi drivers

GPS技术和新形式的城市地理学改变了手机服务的形式。比如说,丰富的出租车GPS轨迹使得出做租车领域有新方法。事实上,最近很多工作是在使用出租车GPS轨迹数据来开发手机推荐系统。这些系统可以推荐一系列的载客点,为了使得在最短的驾驶距离里最大可能地找到一个乘客。然而,在现实世界中,出租车的收入和有效的驾驶时间息息相关。换句话说,对一个出租车司机来说,在找到一个乘客前知道一个确切地驾驶路径来缩短驾驶时间更加重要。最后,在本文中,我们提出了开发一个收益比高的推荐系统。开发的目的是使得按照推荐的路径寻找乘客获得最大化

2015-11-30 22:24:30

hadoop配置文件详解、安装及相关操作

hadoop配置文件详解、安装及相关操作

2015-11-29 22:10:14

探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。聚类(Clustering)是一个数据挖掘的经典问题,它的目的是将数据分为多个簇(Cluster),在同一个簇中的对象之间有较高的相似度,而不同簇的对象差别较大。聚类被广泛的应用于数据处理和统计分析领域。ApacheMahout是ASF(ApacheSoftwareF

2015-11-09 20:09:08

探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

随着Web技术的发展,使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的。而推荐引擎的出现,使用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的上下文信息更丰富的信息发现。

2015-11-09 19:50:10

探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤

本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集,推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于ApacheMahout的协同过滤算法的高效实现。ApacheMahout是ASF的一个较新的开源项目,它源于Lucene,构建在Hadoop之上

2015-10-08 22:03:57

聚类算法和分类算法总结

聚类算法和分类算法总结

2015-09-21 21:56:24

winform 可拖动的自定义Label控件

效果预览:  实现步骤如下: (1)首先在项目上右击选择:添加->新建项,添加自定义控件   (2)自定义的一个Label让它继承LabelControl控件,LabelControl控件是DevExpress控件库里面的一种,和Label控件差不多,想了解更多关于DevExpress控件,推荐到DevExpress控件论坛学习:http://ww...

2015-08-14 08:35:34

Windows下用Codeblocks建立一个最简单的DLL动态链接库

转自:http://blog.csdn.net/wangwei_cq/article/details/8187576来源:http://hi.baidu.com/hellosim/item/9ae4317168f4a74bee1e53cb建立一个最简单的只有一个get_id()函数的DLL库 一、创建C语言动态链接库1.新建一个动态库的工程

2015-01-14 09:11:47

【2】安卓学习之控件和布局

【2】安卓学习之控件和布局

2014-12-03 21:41:22

HDU 4050 wolf5x(动态规划-概率DP)

HDU4050wolf5x(动态规划-概率DP)题目大意:这是一维的,一个人在0号格子,现在1~n号格子排成一排,上面有各种限制,一个人想从0号格子走出n号格子,也就是走到>n处。每个格子是4种状态的其中一种,并且没告诉你是哪种状态,只是告诉你概率,第i号格子4种状态的其中一种的概率记为p[i][0],p[i][1],p[i][2],p[i][3]。0表示这个格子既不能左腿也不能右腿踏进去。1表示这个格子可以左腿踏进去。2表示这个格子可以右腿踏进去。3表示这个格子既可以左腿

2014-11-10 20:10:00

HDU 4044 GeoDefense(动态规划)

HDU4044GeoDefense(动态规划)题目输入描述:有T组测试数据,每组首先一个n,表示一颗生成树有n个节点接下来n-1行表示n-1条边描述这个生成树接下来一行表示你的总的钱数sum接下来n行,第i行表示树上的第i号节点可以建ki个塔,每个塔两个数字参数表示花费和造成的伤害。这是个塔防游戏,敌人从树根(1号节点)出发,叶子节点是你的基地,敌人的路线不固定,经过每个节点的塔后受到伤害问你在总的花费下,你选择建一些塔,敌人的血量至多是多少才能保证不伤害到你的基地。解题思

2014-11-10 16:15:47

HDU 4049 Tourism Planning(动态规划)

HDU4049TourismPlanning(动态规划)题目大意:输入描述:第一行两个数字表示,有n个人,m个城市接下来m个数字表示每个人参观这些城市的花费接下来n行m列表示每个人参观每个城市得到的满意度接下来n行n列表示每参观一个城市互相之间的影响的额外满意度,Bij(1<=i<=N,1<=j<=N),0<=Bij<=1000,Bij=0ifi=j,Bij=Bji.你可以安排这n个人中的任意多个依次参观这m个城市0~m-1,中途也可以让一个人退出,退出后不能再回来,问

2014-11-05 20:56:42

HDU 4045 Machine scheduling (组合数学-斯特林数,组合数学-排列组合)

HDU4045Machinescheduling(组合数学-斯特林数,组合数学-排列组合)解题思路:这题考的是排列组合

2014-11-02 23:01:57

HDU 4043 FXTZ II (组合数学-排列组合)

HDU4043FXTZII(组合数学-排列组合)题目大意:有n个能量球,能量分别为2^0,2^1,2^2,........2^n-1这个人每次随机选择一个能量球概率相同,选择后的可以看作消失了不能再被选,打中自己和敌人的概率都是50%,过程中,一旦自己的血量小于对方就算输了,问自己赢的概率。解题思路及代码:见文章

2014-11-02 22:53:37

ubuntu创建、删除文件及文件夹方法

mkdir目录名        =>创建一个目录rmdir空目录名     =>删除一个空目录rm文件名文件名  =>删除一个文件或多个文件rm–rf非空目录名=>删除一个非空目录下的一切touch文件名       =>创建一个空文件 重命名文件(夹)/移动文件(夹)到指定文件夹执行格式:mvsou

2014-10-31 11:49:32

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!