热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词

solr基本指令:jetty部署【推荐】:Linux:$binsolrstart;Windows:bin\solr.cmdstart
solr基本指令:
jetty部署【推荐】: Linux: $ bin/solr start; Windows: bin\solr.cmd start
创建core: Linux: $ bin/solr create -c corehotel; Windows: bin\solr.cmd create -c corehotel
停止所有:bin/solr stop -all;
重启solr【指定端口】:bin/solr start 【 -p 8983】;
查看帮助:bin/solr -help ;
状态:bin/solr status

1、部署solr6.6(本教程基于solr自带的jetty启动),tomcat部署配置教程相似【由于solr解压即用,部署简单,此处省略详细部署教程】。

2、下载支持solr6.6的ikanalyzer-6.6.0.jar,源码地址: https://github.com/zxiaofan/ik-analyzer-solr6 ,可直接在target目录(或release)下载已打包好的ikanalyzer-6.6.0.jar。
Note:
ikanalyzer原作者已停止更新,上述代码根据网友描述修改了相关文件使之兼容sole6.6。

3、下载拼音插件:pinyin4j-2.5.0.jar、pinyinAnalyzer4.3.1.jar,相关jar下载见文末。

4、将下载的3个插件copy到\server\solr-webapp\webapp\WEB-INF\lib目录。

5、修改managed-schema(server\solr\[coreName]\conf目录),在节点前新增如下配置:
text_ik:IK分词,配置同义词过滤器;
text_pinyin:支持IK分词,索引index支持拼音过滤器。

        
        
        
        
        
    
    
        
        
        
    
    
 


  
  


   
    


6、重启solr,访问 http://localhost:8983/solr/#/【corehotel】/analysis
Analyse Fieldname / FieldType选择text_ik,
6.1、中文分词:

6.2、IK扩展词
“嗨咯”这个词语我不想拆分怎么办呢,只需在server\solr-webapp\webapp\WEB-INF\classes目录配置扩展词即可。配置文件包含:IKAnalyzer.cfg.xml、以及ext.dic,相关文件可直接在附件下载。
在ext.dic内容中新增一行数据“嗨咯”,然后重启solr,再次查询“嗨喽朋友今天天气真好”,就会发现“嗨喽”并未被分词了。

6.3、同义词
如果我想查询“朋友”的时候也能搜索到“zxiaofan”怎么操作呢,只需在server\solr\【coreName】\conf\synonyms.txt文件中新增一行数据(朋友,zxiaofan)即可。重启solr,再次查询“嗨喽朋友今天天气真好”,你就会发现分词器结果中包含了“zxiaofan”这个词语了。

6.4、pinyin4j拼音分词
Analyse Fieldname / FieldType选择text_pinyin,你会发现分词结果中包含了拼音,并且前面配置的扩展词、同义词依然有效(因为text_pinyin依旧使用了IK分词器)。

相关配置文件或jar均可在github下载, https://github.com/zxiaofan/ik-analyzer-solr6/releases/tag/6.6.0。

欢迎个人转载,但须在文章页面明显位置给出原文连接;
未经作者同意必须保留此段声明、不得随意修改原文、不得用于商业用途,否则保留追究法律责任的权利。

【 CSDN 】:csdn.zxiaofan.com
【GitHub】:github.zxiaofan.com

如有任何问题,欢迎留言。祝君好运!
Life is all about choices! 
将来的你一定会感激现在拼命的自己!

推荐阅读
  • 在Java Web服务开发中,Apache CXF 和 Axis2 是两个广泛使用的框架。CXF 由于其与 Spring 框架的无缝集成能力,以及更简便的部署方式,成为了许多开发者的首选。本文将详细介绍如何使用 CXF 框架进行 Web 服务的开发,包括环境搭建、服务发布和客户端调用等关键步骤,为开发者提供一个全面的实践指南。 ... [详细]
  • 本文介绍了如何在Spring框架中使用AspectJ实现AOP编程,重点讲解了通过注解配置切面的方法,包括方法执行前和方法执行后的增强处理。阅读本文前,请确保已安装并配置好AspectJ。 ... [详细]
  • 本文介绍了 Go 语言中的高性能、可扩展、轻量级 Web 框架 Echo。Echo 框架简单易用,仅需几行代码即可启动一个高性能 HTTP 服务。 ... [详细]
  • 一、Tomcat安装后本身提供了一个server,端口配置默认是8080,对应目录为:..\Tomcat8.0\webapps二、Tomcat8.0配置多个端口,其实也就是给T ... [详细]
  • Spring Data JdbcTemplate 入门指南
    本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作,包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]
  • php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]
  • 本指南详细介绍了如何在CentOS 6.6 64位系统上以root用户身份部署Tomcat 8服务器。系统环境为CentOS 6.6 64位,采用源码安装方式。所需软件为apache-tomcat-8.0.23.tar.gz,建议将软件下载至/root/opt目录。具体下载地址请参见官方资源。本指南涵盖了从环境准备到服务启动的完整步骤,适用于需要在该系统环境下搭建高性能Web应用服务器的技术人员。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 本文详细介绍了如何在Java Web服务器上部署音视频服务,并提供了完整的验证流程。以AnyChat为例,这是一款跨平台的音视频解决方案,广泛应用于需要实时音视频交互的项目中。通过具体的部署步骤和测试方法,确保了音视频服务的稳定性和可靠性。 ... [详细]
  • Android异步处理一:使用Thread+Handler实现非UI线程更新UI界面Android异步处理二:使用AsyncTask异步更新UI界面Android异步处理三:Handler+Loope ... [详细]
  • 在React中使用setState时遇到错误,本文将详细分析错误原因并提供解决方案。 ... [详细]
  • Amoeba 通过优化 MySQL 的读写分离功能显著提升了数据库性能。作为一款基于 MySQL 协议的代理工具,Amoeba 能够高效地处理应用程序的请求,并根据预设的规则将 SQL 请求智能地分配到不同的数据库实例,从而实现负载均衡和高可用性。该方案不仅提高了系统的并发处理能力,还有效减少了主数据库的负担,确保了数据的一致性和可靠性。 ... [详细]
  • C++ 开发实战:实用技巧与经验分享
    C++ 开发实战:实用技巧与经验分享 ... [详细]
  • 在日常的项目开发中,测试环境和生产环境通常采用HTTP协议访问服务。然而,从浏览器的角度来看,这种访问方式会被标记为不安全。为了提升安全性,当前大多数生产环境已经转向了HTTPS协议。本文将详细介绍如何在Spring Boot应用中配置SSL证书,以实现HTTPS安全访问。通过这一过程,不仅可以增强数据传输的安全性,还能提高用户对系统的信任度。 ... [详细]
  • 深入解析HTTP网络请求API:从基础到进阶的全面指南
    本文全面解析了HTTP网络请求API,从基础到进阶,详细介绍了Android平台上的两种原生API——HttpUrlConnection和HttpClient。这两种API通过对底层Socket的封装,提供了高效、灵活的网络通信功能。文章不仅涵盖了基本的使用方法,还深入探讨了性能优化、错误处理和安全性等方面的高级主题,帮助开发者更好地理解和应用这些工具。 ... [详细]
author-avatar
2cz2x
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有