热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

07在solr中配置分词器、停词库以及扩展词库

在前面几节,我们看了一下solr的基本用法,这一节我们将看一下在solr中配置分词器、停词库以及扩展词库。1、前提约束完成solr的安装和启动https:www.jianshu.c

在前面几节,我们看了一下solr的基本用法,这一节我们将看一下在solr中配置分词器、停词库以及扩展词库。


1、前提约束

  • 完成solr的安装和启动

    https://www.jianshu.com/p/de807e2ef12f

    笔者的solr路径位于/root/solr-4.10.3

    solr的web端部署于/root/apache-tomcat-8.0.33


2、操作步骤:

  • 未配置前的测试

    所有汉字都被单个分词,并未按语义


2.1、配置

  • 上传jar包IKAnalyzer2012FF_u1.jar

    将IKAnalyzer2012FF_u1.jar上传到/root/apache-tomcat-8.0.33/webapps/solr/WEB-INF/lib,就可以完成中文的分词。

  • 修改/root/solr-4.10.3/example/solr/collection1/conf/schema.xml











  • 创建/root/apache-tomcat-8.0.33/webapp/solr/WEB-INF/classes文件夹,在该文件夹创建IKAnalyzer.cfg.xml、ext.dic、stopword.dic文件夹。

    IKAnalyzer.cfg.xml内容如下:



IK Analyzer 扩展配置

ext.dic;

stopword.dic;

ext.dic乃扩展词库,内容如下,请注意第一行空:


万和
江苏万和

stopword.dic乃停词库,内容如下,请注意第一行空:




一个


  • 重启tomcat


2.2、测试



  • 测试扩展词库

    扩展词库测试

  • 测试停词库

    测试停词库

    以上就是solr中的分词、停词以及扩展词库。



推荐阅读
author-avatar
手机用户2502928693
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有