自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一切依旧的专栏

做自己喜欢的事叫自由,喜欢自己做的事叫幸福

  • 博客(22)
  • 资源 (1)
  • 收藏
  • 关注

转载 各消息队列对比,Kafka深度解析,众人推荐,精彩好文!

作者: Jason Guo背景介绍Kafka简介Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下:以时间复杂度为O(1)的方式提供消息持久化能力,并保证即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条消息的传输支持Kafka Server间的消息分区,及分布式消息消费,同时保证每个p

2015-08-08 21:31:21 60783

转载 logstash入门(简单而全面)

原文地址:http://logstash.net/docs/1.4.2/tutorials/getting-started-with-logstash英语水平有限,如果有错误请各位指正简介Logstash是一个接收,处理,转发日志的工具。支持系统日志,webserver日志,错误日志,应用日志,总之包括所有可以抛出来的日志类型。怎么样听起来挺厉害的吧?

2015-08-08 10:57:24 14378

转载 Kafka 与 Flume 对比

采集层 主要可以使用Flume, Kafka两种技术。Flume:Flume 是管道流方式,提供了很多的默认实现,让用户通过参数部署,及扩展API.Kafka:Kafka是一个可持久化的分布式的消息队列。Kafka 是一个非常通用的系统。你可以有许多生产者和很多的消费者共享多个主题Topics。相比之下,Flume是一个专用工具被设计为旨在往HDFS,HBase发送

2015-08-08 10:27:31 1747

原创 开源远程登录、远程查看工具你知道几个

详细工具说明链接地址:https://code.csdn.net/openkb/c-2102putty项目介绍:PuTTY为一开放源代码软件,主要由Simon Tatham维护,使用MIT licence授权。是一个Telnet、SSH、rlogin、纯TCP以及串行接口连接软件。较早的版本仅支持Windows平台,目前开始支持各类Unix平台,并打算移植至Mac OS X

2015-08-07 23:10:23 2090

转载 开源日志系统比较:scribe、chukwa、kafka、flume

1. 背景介绍许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征:(1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;(2) 支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统;(3) 具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩

2015-08-07 23:00:55 452

转载 solr中ik分词自定义词库和停止词

1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes 2、新增一个文件:IKAnalyzer.cfg.xml IK Analyzer 扩展配置 my.dic; stopword.dic; 3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:么么哒

2015-07-23 17:13:00 5695 4

原创 solr suggest配置

1.修改solrconfig.xml,添加如下内容 string <!--Optional, it is required when more than one spellchecker is configured. Select non-default name with spellcheck.d

2015-07-23 16:53:40 616

原创 solr分词只能全词匹配怪现象

现象:例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!既然已经分词了,应该可以搜索非完全匹配的,如下图所示:fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的

2015-07-22 17:05:44 10059 2

原创 solr安装ansj_seg分词

1.下载nlp_lang,下载地址:http://maven.ansj.org/org/nlpcn/nlp-lang/0.3/,得到jar包nlp-lang-0.3.jar2.下载ansj-seg,http://maven.ansj.org/org/ansj/ansj_seg/也可以下载源码自己编译,源码下载地址:https://github.com/NLPchina/ansj_s

2015-07-16 11:15:12 3667 1

原创 solr安装mmseg4j 分词器

1.下载资料   https://github.com/chenlb/mmseg4j-solr   注意版本:mmseg4j-solr-2.0.0.jar 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1] 测试过兼容可用。mmseg4j-solr-2.1.0.jar 要求 lucene/solr 4.8.xmmseg4

2015-07-15 15:16:56 1489

原创 solr中Zookeeper指令

1.upconfigjava -classpath %TOMCAT_HOME%\webapps\solr\WEB-INF\lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 -confdir F:\solr_home1\collection1

2015-07-14 20:47:13 1299

转载 Schema.xml详解

引自:http://iamyida.iteye.com/blog/2213354schema.xml是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即Norms,是否存储项向量等等。     schema.xml配置文件的根元素就是schema,有个name属性,name属性值可以随便配,根元素没什么好说的,schema元素下主

2015-07-14 20:44:00 2689

原创 solr安装配置拼音分词器

1.准备jar包将ik的jar包、pinyin4j-2.5.0​.jar、solr-4.9.0\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-4.9.0.jar拷贝到%TOMCAT_HOME%\webapps\solr\WEB-INF\lib下2.修改schema.xml

2015-07-14 20:40:11 3293 1

原创 solr同步mysql数据库

solr同步mysql数据库

2015-07-14 18:58:39 3251

转载 创建用户、授权、数据导入导出

创建用户与授权这里,我将Oracle当做一个类似于OA的管理系统来学习。首先,安装oracle是第一步,学习状态下安装oracle的人比比皆是,事实上,能够在生产环境下安装oracle的人却凤毛麟角,有的人和oracle打一辈子交道,不一定实际的做过一次oracle数据库实施,但也从另一个角度上看出,oracle的安装实际上并不简单,能够在不同的环境下安装好oracle确实是一

2013-03-17 12:31:46 1366

原创 彻底卸载orcale

1.关闭oracle所有的服务。可以在windows的服务管理器中关闭; 2.打开注册表:regedit 打开路径: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ 删除该路径下的所有以oracle开始的服务名称,这个键是标识Oracle在windows下注册的各种服务! 3.打开注册表,找到路径: HKEY_

2013-03-15 23:26:20 699

原创 oracle创建多个数据库,通过浏览器链接问题

今天被一个小问题搞的很郁闷,新创建的数据库不知道如何在浏览器中打开~    首先,在利用Database Configuration Assistant创建数据库时,在步骤4中要勾选“使用Enterprise Manger”,如下图所示:     此处需要注意的是,有时候上面的界面出不来,那么就直接点击“下一步”,然后再点击“上一步”回到该页面即可。        最后安装完成后就

2012-11-19 16:38:46 327

原创 javafx环境搭建

安装sdk        在jdk7中已经集成了javaFx SDK,所以最简单方式就是安装jdk7,下载连接如下:              http://www.oracle.com/technetwork/java/javase/downloads/index.html下载JavaFx Scene Builder        此工具由官方出品,主要是设计界面,输出为扩展

2012-11-13 15:43:03 771

转载 win8下安装oracle

项目需要,今天在win8上安装oracle10g,但总是第一步就提示:"程序异常终止,发生未知错误",通过搜索发下如下方法:1.修改E:\oracle安装文件\10201_database_win32\database\stage\prereq\db路径下refhost.xml当打开refhost.xml 后会发现有 .....只要在 后面添加

2012-11-13 15:15:11 532

转载 Java基础(反射案例)

package cn.itcast.test; import java.util.ArrayList; import java.util.List; import org.junit.Test;  /** * 这个案例表明的意思是怎么向指定类型的集合添加不同类型的数据 */ public class ReflectedTest {  /** * 用两种解决方

2012-11-11 21:34:12 298

转载 java通过pid来kill进程

近段工作用到了线程方面的东西,拿出一些来和大家进行分享下,这里主要是通过pid来kill进程,以下是方法public void killByPid(String str) {  final String[] Array = { "ntsd.exe", "-c", "q", "-p", str };  int i = 0;  try {   Process p

2012-11-09 22:48:19 1027

原创 养成记录的好习惯

博客第一篇,希望以此为鉴,督促自己养成记录的好习惯。           IT的知识点太多了,好多时候第二次用到一个知识点时,只记得当初用过,但如何去用却忘的一干二净。更有在实现某个功能是需要注意得点,只有再次遇到这个问题时才后悔当初没有记录一下。        给自己定个要求吧,每周至少写一篇博客,内容不限,主要是摘录一些知识点,方便日后查看,也希望能为网友提供便利。

2012-11-09 22:46:24 584

AnsjTokenizerFactory

solr安装ansj分词必备,其中包含了各个依赖包,已经改写的AnsjTokenizerFactory

2015-07-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除