9 KingBoxing

尚未进行身份认证

平凡普通

等级
博文 323
排名 2k+

Solr - 主/从同步

Solr1.4以后,可以使用基于http的同步方式。之前基于ssh/rsync的同步方式已经停止维护。还有一种基于SolrCloud的方式:https://cwiki.apache.org/confluence/display/solr/SolrCloud 这里只介绍ReplicationHandler基于http的方式。 官方文档: http://wiki.apa

2016-06-28 19:59:08

软负载与nginx强大功能

当我们打开手机访问点评客户端的时候,访问商户的请求是如何到达对应某台应用服务器的?当有很多XX宽带的用户投诉说我大点评某某域名无法打开但是我们却找不出任何问题的时候,我们就想到会不会是宽带运营商的问题。今天与大家分享的话题,主要是跟我们的软负载集群和Nginx这个强大的开源应用有关系。当我们准备上线一个新的业务,或者新的功能时候,除了把代码发布的线上生产环境的应用服务器外,

2016-03-29 17:28:56

前端请求m3u8

@RequestMapping("/school.m3u8")//这里要写标准的m3u8格式,否则有些播放器会不支持播放  publicvoidm3u8(      HttpServletRequestrequest,HttpServletResponseresponse,      finalModelmodel)throw

2016-03-25 09:30:56

SOLR对多个(关联)表创建索引

一、无关联多表创建索引1.1数据库准备  首先在数据库创建一张表,本来有一个tuser表了,我又创建了一个role表,就两三个字段,没什么特殊的,然后在里面随便添加几条数据即可,看一下数据库:1.2data-config.xml  数据库创建完成之后就是修改data-config.xml文件了,因为数据库跟solr之间的关联主要就是建立在这个文件上面的,所以接下来就

2016-02-19 20:31:41

Solr Multivalue field的索引和搜索

Solr里头可以设计Field为Multivalue类型,这样的一个好处是可以很方便的设置copyField,在我们的项目中也有使用。但是一直以来都有一个问题困扰着我,就是对multivalue里头多个值域的搜索问题。多个value之间我认为应该是保持相互独立的,但是在实际搜索中感觉solr把所有的值域都串在一起,当作一个长value来处理,没有达到我想要的效果。后来通过搜索,我发现sol

2015-09-17 11:29:14

[ lucene扩展 ] spellChecker原理分析

spellChecker是用来对用户输入的“检索内容”进行校正,例如百度上搜索“麻辣将”,他的提示如下图所示: 我们首先借用lucene简单实现该功能。本文内容如下(简单实现、原理简介、现有问题)  lucene中spellchecker简述lucene的扩展包中包含了spellchecker,利用它我们可以方便的实现拼写检查的功能,但

2015-09-17 11:04:14

Solr 使用自定义 Query Parser

版权信息:可以任意转载,转载时请务必以超链接形式标明文章原文出处,即下面的声明.原文出处:http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html由于Solr默认的QueryParser生成的Query一般是“短语查询”,导致只有很精确的结果才被搜索出来。大部分时候我们要分词后

2015-09-17 01:11:40

solr 使用自定义的 QueryParser

版权信息:可以任意转载,转载时请务必以超链接形式标明文章原文出处,即下面的声明.原文出处:http://blog.chenlb.com/2009/02/use-custom-solr-queryparser.html如果想让solr有更加强大的功能或在查询时做一些特别的处理。可以在solrconfig.xml里注册自定义的QueryParser(查询解析

2015-09-17 01:10:28

solr HMMChineseTokenizer 中文解词

solr自带的中文解词HMMChineseTokenizer的效果还不错,在schema.xml里面的配置如下                           words="/data/local/solr-5.2.1/server/solr/solr_analyzer_task/dic/stopwords.txt"/>

2015-09-16 17:04:41

Solr4.2.1 拼写检查组件

在做搜索时一般可以在用户输入检索条件时使用suggest,而在点击完搜索时,使用拼写检查,二者结合给可以用户带来比较好的用户体验! suggest与spellcheck看似功能一样,出发点是不一样的,使用条件也不一样,spellcheck是在没有搜索出结果时才有的功能,搜索词正确是没能spellcheck结果的,而suggest是任何情况下都有结果的。Solr4.0以后又新增了一个拼写

2015-09-10 21:24:15

spring中集成作业调度

本文地址:http://blog.csdn.net/kongxx/article/details/6860732前面写了几个文章是关于spring中集成作业调度功能的东西,可以参考Spring任务调度实战之TimerSpring任务调度实战之QuartzSimpleTriggerSpring任务调度实战之QuartzCronTrigger

2015-08-18 19:11:46

Solr配置停止词/排除词 stopwords(mmseg版)

停止词是无功能意义的词,比如is、a、are、”的”,“得”,“我”等,这些词会在句子中多次出现却无意义,所以在分词的时候需要把这些词过滤掉。测试于:Solr4.5.1,mmseg4j1.9.1,Jdk1.6.0_45,Tomcat6.0.37|CentOS5.7我这里拿名为test的core做例子。准备停止词在solrhome下建dic目录,

2015-08-17 15:35:56

Solr查询时设置字段的boost值,改变默认打分排序

实现方法有3个:在建索引的时候设置boost,这个值会写入文件,建索引时有额外的性能开销;在查询的时候指定boost,这个值不会写入文件,查询时指定任意字段的boost值,适用与一个索引库的多种查询场景,但查询时有额外性能开销;(推想)前两者结合使用,如绝大多数都需要标题优先,那么建索引时可指定标题boost为2,其他场景可在查询时指定标题boost为0.5,中和建索引时的设置。这

2015-08-17 14:42:39

Solr的一些查询参数

fl:是逗号分隔的列表,用来指定文档结果中应返回的 Field 集。默认为“*”,指所有的字段。defType:指定queryparser,常用defType=lucene,defType=dismax,defType=edismaxq:query。q.alt:当q字段为空时,用于设置缺省的query,通常设置q.alt为*:*。qf:query

2015-08-14 22:19:46

solr增量更新的字段

在配置增量更新时MySQL表里要有一个字段,update_time能让solr找到那些行是新增的,在配置文件里的SQL要加上条件where update_time> '${dih.last_index_time}'"update_time字段要是date类型,但是我们在设计表的时间该字段是long的时间戳。所以当我在进行增量更新时,被更新的总是全量。所以要把long类型转换成date类型才能

2015-07-31 14:40:47

solr5解决时区差8小时的问题

在oschina上的第一篇文章,记录一个在工作中遇到的问题问题很简单,也算是开博了在solr5中解决时区的问题,更加简单了,直接修改配置文件bin/solr.in.sh即可。如下:#SOLR_TIMEZONE="UTC"将此参数修改为如下:SOLR_TIMEZONE="UTC+8"

2015-07-31 10:22:20

solr配置自动增量更新

关于solr如何导入数据请参见:http://blog.csdn.net/xintongfei/article/details/19046575自动增量更新可定时将数据库中的数据导入到solr索引库中,并可定时重建索引库,合并小索引文件为大的索引文件。下面介绍如何配置solr自动更新。需要准备的jar包solr自带: apache-solr-data

2015-07-28 21:01:29

Schema.xml和solrconfig.xml属性分析

现在我们开始研究载入的数据部分(importingdata) 在正式开始前,我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ,这里的数据都是免费的,一个大型开放社区提供。MusicBrainz每天都提供一个数据快照(snapshot)的SQL文件,这些数据可以被导入PostgreSQL数据库中。 一、字段配置(s

2015-07-24 11:04:41

Solr查询语法总结-参数说明

1、常用查询参数说明     q-查询字符串,必须的。     fl-指定返回那些字段内容,用逗号或空格分隔多个。     start-返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。     rows-指定返回结果最多有多少条记录,配合start来实现分页。     sort-排序,格式:sort=+[,+]…。示例:(inSto

2015-07-23 22:38:16

关于solr schema.xml 和solrconfig.xml的解释

一、字段配置(schema) schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。 1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个Fi

2015-07-23 16:13:59
奖章
    暂无奖章