热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Solr—2.window环境中文分词器和Dataimport

Solr—1.window环境-单机部署环境部署完毕后,接下来配置中文分词器和导入数据库数据。目录配置中文分词器导入数据库数据配置中文分词器solr安装包中自带中文分词器,但是不是

Solr—1.window环境-单机部署  环境部署完毕后,接下来配置中文分词器和导入数据库数据。

目录


配置中文分词器

导入数据库数据



配置中文分词器

solr安装包中自带中文分词器,但是不是那么十分的好用,各类的教学视频都建议使用ik分词器,所以接下来配置ik分词器。

(1)将ik分词器的jar包(ik-analyzer-solr7x.jar)放到apache-tomcat-solr\webapps\solr\WEB-INF\lib下

(2)修改对应的core下的managed-schema配置文件,添加分词器配置,我这里修改solr_home\core-test01\conf\managed-schema配置文件。将下面的一段配置代码放在其他fieldType 标签附近即可。



(3)重启服务,进入后台选择我们配置的core

(4)选择图中Analysis 输入一段汉字,选择我们配置的ik分词器,然后点击蓝色按钮,出现图中标识分词器配置成功。

导入数据库数据

(1)相关jar包导入,这里我用的是mysql5.7数据库

数据库驱动包mysql-connector-java-5.1.37-bin.jar 和  solr-7.7.2\dist下的solr-dataimporthandler-7.7.2.jar 和 solr-dataimporthandler-extras-7.7.2.jar

复制上面三个jar包到\webapps\solr\WEB-INF\lib下面

(2)修改配置文件db-data-config.xml

复制solr-7.7.2\example\example-DIH\solr\db\conf\db-data-config.xml

到solr_home\core-test01\conf下,修改名称为data-config.xml(不修改也行的)

修改内容为如下,里面的账号密码需改为自己的,如果用的其他数据修改驱动jar包即可。

用sql语句查询出,需要导入的字段。


driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/story"
user="root"
password="root1234"/>

query="
select article_id,article_title,article_content,create_time from article">



(3)修改配置文件managed-schema,注意字段要和上面的一样





(4)重启solr服务,进行验证,选择core,数据导入,选择配置的实体,然后执行导入即可

(5)选择查询,查询所有,数据已经正确查询出来。



推荐阅读
  • 本文深入解析了通过JDBC实现ActiveMQ消息持久化的机制。JDBC能够将消息可靠地存储在多种关系型数据库中,如MySQL、SQL Server、Oracle和DB2等。采用JDBC持久化方式时,数据库会自动生成三个关键表:`activemq_msgs`、`activemq_lock`和`activemq_ACKS`,分别用于存储消息数据、锁定信息和确认状态。这种机制不仅提高了消息的可靠性,还增强了系统的可扩展性和容错能力。 ... [详细]
  • 本文介绍了如何利用Struts1框架构建一个简易的四则运算计算器。通过采用DispatchAction来处理不同类型的计算请求,并使用动态Form来优化开发流程,确保代码的简洁性和可维护性。同时,系统提供了用户友好的错误提示,以增强用户体验。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • PHP自学必备:从零开始的准备工作与工具选择 ... [详细]
  • 在处理遗留数据库的映射时,反向工程是一个重要的初始步骤。由于实体模式已经在数据库系统中存在,Hibernate 提供了自动化工具来简化这一过程,帮助开发人员快速生成持久化类和映射文件。通过反向工程,可以显著提高开发效率并减少手动配置的错误。此外,该工具还支持对现有数据库结构进行分析,自动生成符合 Hibernate 规范的配置文件,从而加速项目的启动和开发周期。 ... [详细]
  • 本文探讨了利用Java实现WebSocket实时消息推送技术的方法。与传统的轮询、长连接或短连接等方案相比,WebSocket提供了一种更为高效和低延迟的双向通信机制。通过建立持久连接,服务器能够主动向客户端推送数据,从而实现真正的实时消息传递。此外,本文还介绍了WebSocket在实际应用中的优势和应用场景,并提供了详细的实现步骤和技术细节。 ... [详细]
  • 部署solr建立nutch索引
    2019独角兽企业重金招聘Python工程师标准接着上篇nutch1.4的部署应用,我们来部署一下solr,solr是对lucene进行了封装的企 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 在 Ubuntu 中遇到 Samba 服务器故障时,尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]
  • PHP 各版本对比:标准版与最新顶级版的详细分析 ... [详细]
  • 在Linux系统中避免安装MySQL的简易指南
    在Linux系统中避免安装MySQL的简易指南 ... [详细]
  • 本文探讨了资源访问的学习路径与方法,旨在帮助学习者更高效地获取和利用各类资源。通过分析不同资源的特点和应用场景,提出了多种实用的学习策略和技术手段,为学习者提供了系统的指导和建议。 ... [详细]
  • 在过去,我曾使用过自建MySQL服务器中的MyISAM和InnoDB存储引擎(也曾尝试过Memory引擎)。今年初,我开始转向阿里云的关系型数据库服务,并深入研究了其高效的压缩存储引擎TokuDB。TokuDB在数据压缩和处理大规模数据集方面表现出色,显著提升了存储效率和查询性能。通过实际应用,我发现TokuDB不仅能够有效减少存储成本,还能显著提高数据处理速度,特别适用于高并发和大数据量的场景。 ... [详细]
  • 本文详细探讨了MySQL并发参数的优化与调整方法,旨在帮助读者深入了解如何通过合理配置这些参数来提升数据库性能。文章不仅介绍了常见的并发参数及其作用,还提供了实际操作中的调整策略和最佳实践,适合希望提高数据库管理技能的技术人员阅读。 ... [详细]
  • 2018深入java目标计划及学习内容
    本文介绍了作者在2018年的深入java目标计划,包括学习计划和工作中要用到的内容。作者计划学习的内容包括kafka、zookeeper、hbase、hdoop、spark、elasticsearch、solr、spring cloud、mysql、mybatis等。其中,作者对jvm的学习有一定了解,并计划通读《jvm》一书。此外,作者还提到了《HotSpot实战》和《高性能MySQL》等书籍。 ... [详细]
author-avatar
寂寞-无解
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有