solr简介
solr是受欢迎的,速度极快的开源企业搜索平台。主要功能包括强大的全文搜索,搜索词高亮显示,分面搜索,近实时的索引,动态聚类,数据库集成,丰富的文件(例如,Word,PDF)处理,和空间搜索。Solr是高度可靠的,可扩展性和容错性,提供了分布式的索引,复制和负载均衡的查询,自动故障转移和恢复,集中配置和更多。许多世界上最大的互联网网站的导航、搜索功能都是采用solr实现的。
solr是一个基于Lucene、采用JAVA语言编写、运行于servlet容器中(如jetty,tomcat)的全文搜索服务器,提供了Rest 的HTTP接口,并支持多种数据格式如json,php,ruby,csv,phps,javabin及自定义格式。
使用的安装介质 - jdk1.7.0.45
- tomcat 7.0.55
- solr-4.9.0.tgz
- IKAnalyzer2012FF_u1.jar
安装步骤
1: 安装jdk1.7.0.45
2:安装tomcat6.0.36
3: 安装solr
#解压文件(假设把solr-4.9.0.tgz放在/home/solr目录中)
cd /home/solr
tar -zxvf solr-4.9.0.tgz
ln -s solr-4.9.0 solr
#更改solr工作目录
cp -r /home/solr/solr/example/solr /home/solr/solrhome
#更改solr web程序目录
mkdir solrweb
cp solr/dist/solr-4.9.0.war solrweb
cd solrweb
jar -xvf solr-4.9.0.war
rm -rf solr-4.9.0.war
cd ../
#复制solr扩展的jar到tomcat(假设tomcat安装在/home/solr/tomcat目录中)
cp solr/example/lib/ext/*.jar tomcat/lib
#告知solr它的工作目录在哪里,一般有两种方式,设置环境变量以及jndi。但我建议采用jndi,便于维护
在$TOMCAT_HOME/conf/Catalina/localhost里新建solr.xml文件,内容如下:
<Context docBase&#61;"/home/solr/solrweb" debug&#61;"0" crossContext&#61;"true" > <Environment name&#61;"solr/home" type&#61;"java.lang.String" value&#61;"/home/solr/solrhome" override&#61;"true" />
Context>
其中里面的/home/solr/solrhome就是所谓的solr工作目录.solr配置,以及索引都将存放到该目录
启动tomcat即可。
http://172.168.63.233:8080/solr
默认的端口是8983,修改tomcat/conf/server.xml中的http端口即可。
4&#xff1a; 安装中文分词IKanalyzer&#xff1a;
将IKAnalyzer2012FF_u1.jar放到/home/solr/solrweb/WEB-INF/lib目录中
对应的配置文件放在jar包的根目录下&#xff1a;IKAnalyzer.cfg.xml&#xff0c;stopword.dic&#xff0c;ext.dic
5&#xff1a;设置IKAnalyzer中文分词
修改/home/solr/solrhome/collection1/conf/中的schema.xml&#xff0c;在中增加如下内容
<fieldType name&#61;"text_ik" class&#61;"solr.TextField"><analyzer type&#61;"index" isMaxWordLength&#61;"false" class&#61;"org.wltea.analyzer.lucene.IKAnalyzer"/><analyzer type&#61;"query" isMaxWordLength&#61;"true" class&#61;"org.wltea.analyzer.lucene.IKAnalyzer"/>
fieldType>
其中查询采用IK自己的最大分词法,索引则采用它的细粒度分词法.所以各自配置了isMaxWordLength
6&#xff1a;启动/停止solr
只要启动/停止Tomcat即可
验证
参考
http://lucene.apache.org/solr