自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (2)
  • 收藏
  • 关注

转载 win7声卡驱动安装失败(不能安装)完美解决方法

这篇文章完美解决Win7声卡驱动安装失败的问题!   首先请在驱动人生官网下载最新版本的驱动人生,自动更新一次声卡驱动,更新后会自动修复系统漏洞,修复后可以使用手动更新安装驱动或安装品牌电脑的官方驱动。(更新成功可不浏览下面的内容)   如果无法进行更新请试试右键点计算机-管理-设备管理器-系统设备-卸载High Definition Audio控制器,然后退出驱动人生,再重新运行驱动

2015-08-28 22:37:00 1704

原创 mahout的安装与配置

1.构建mahout要的系统事先安装df

2014-06-12 11:17:08 597

原创 伪分布式Hadoop配置安装

1. 安装Hadoop到/home/xsj/hadoop:$ tar -zxvf hadoop-0.20.2.tar.gz2. 创建目录:$ mkdir /home/xsj/hadoop/hadoop-0.20.2/hadooptmp$ mkdir /home/xsj/hadoop/hadoop-0.20.2/hdfs/data$ mkdir /

2014-06-10 14:25:23 553

转载 探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

聚类分析什么是聚类分析?聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。

2014-06-04 14:24:30 650

转载 探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助

2014-06-04 14:19:13 514

转载 用Maven构建Mahout项目

用Maven构建Mahout项目Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop,

2014-06-03 12:24:50 694

转载 solr一致性hash个分布式索引

一致性hash和solr千万级数据分布式搜索引擎中的应用时间2013-05-13 09:13:00 博客园-原创精华区 相似文章 (3) 原文  http://www.cnblogs.com/lanceyan/archive/2013/05/13/3075044.html互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库。在这样严峻的条件

2014-05-06 16:16:11 895

转载 solr索引分片查找以及性能调优

分片部署:指定多个片:http://localhost:8983/solr/select/?q=*:*&shards=localhost:8983/solr,localhost:8984/solr

2014-04-30 17:27:37 6582

转载 solr分布式部署

一:如何进行solr分布式复制索引

2014-04-30 17:25:46 758

转载 solr schema.xml和colrconfig.xml

schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。 1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个FieldType的名称。class:指向org.

2014-04-30 16:15:19 825

转载 Git SSH Key 生成步骤

Git SSH Key 生成步骤it是分布式的代码管理工具,远程的代码管理是基于ssh的,所以要使用远程的git则需要ssh的配置。github的ssh配置如下:一 、设置git的user name和email:$ git config --global user.name "xuhaiyan"$ git config --global user.email

2014-01-08 12:04:14 526

转载 Eclipse,myeclipse安装 配置Maven

Eclipse,myeclipse安装 配置Mavenmyeclipse自带了maven插件,但是和原生插件还是有点不一样,本文介绍Maven的安装和配置,同样适用于eclipse。1.首先需要安装jdk,myeclipse(废话!)。然后到maven官网下载maven,http://maven.apache.org/download.html我下载的是3.0.52.将

2014-01-02 13:38:56 591

转载 redis中各种数据类型对应的jedis操作命令

redis中各种数据类型对应的jedis操作命令分类: redis2013-11-18 16:21 96人阅读 评论(0) 收藏 举报redis数据类型jedis命令jedis命令操作redis中各种数据类型对应的jedis一、常用数据类型简介:      redis常用五种数据类型:string,hash,list,set,zset(sorted set).

2013-12-05 11:03:59 621

转载 redis学习手册

一、概述:      在Redis中,我们可以将Set类型看作为没有排序的字符集合,和List类型一样,我们也可以在该类型的数据值上执行添加、删除或判断某一元素是否存在等操作。需要说明的是,这些操作的时间复杂度为O(1),即常量时间内完成次操作。Set可包含的最大元素数量是4294967295。      和List类型不同的是,Set集合中不允许出现重复的元素,这一点和C++标准库中

2013-12-04 10:46:38 445

转载 java操作redis

java操作redis博客分类: JavaDataBase转自:http://jzkangta.iteye.com/blog/1137428 Java操作redis(增删改查) Java代码  package sgh.main.powersite;        import java.util.ArrayLi

2013-12-03 18:10:23 531

转载 storm入门

Storm框架入门1 Topology构成   和同样是计算框架的Mapreduce相比,Mapreduce集群上运行的是Job,而Storm集群上运行的是Topology。但是Job在运行结束之后会自行结束,Topology却只能被手动的kill掉,否则会一直运行下去。    Storm集群中有两种节点,一种是控制节点(Nimbus节点),另一种是工作节点(Supervi

2013-12-03 17:12:45 628

转载 PhraseQuery slop

文章来自:http://myzhangjl.blog.sohu.com/95911870.html这几天看Lucene,看到检索那块,被PhraseQuery折腾了一阵,那本《Lucene In Action》里的代码版本太旧了,也不知是翻译的问题还是我的理解问题,总之在看PhraseQuery的设置slop时费了半天劲,不过,总算是搞明白了,发个帖子来分享一下:    所谓PhraseQ

2013-01-22 15:32:30 361

原创 zookeeper

zookeeper使用原理探究转自:http://buliedian.javaeye.com/blog/852088zookeeper介绍zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的Hadoop项目中的一个子项目,并且根据google发表的论文来实现的,接下来我们首先来安装使用下这个软件,然后再来探索下其中比较重要一致性算法。 zooke

2012-01-05 13:54:39 429

徐皓+-+360大数据中心平台演进与实践.pdf

徐皓+-+360大数据中心平台演进与实践 数据资产  全域产品数据分层、归一化 全域产品数据分层、归一化  跨业务的数据价值评估体系 跨业务的数据价值评估体系  统一的数据标准和安全体系 统一的数据标准和安全体系  统一的用户账号体系  自助式创建用户标签  跨引擎的计算平台  图元化的任务配置  多数据源任务处理  基于场景化的服务

2020-02-25

常用网站列表

SQLite+Database+Browser

2011-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除