Solr之（分词器）TokenizerFactoriey有哪些

作者：mobiledu2502885977 | 来源：互联网 | 2023-09-16 16:46

下面来记录并分享下solr都提供了那些分词器：1、solr.Letter.TokenizerFactory创建org.apache.lucene.analysis.

下面来记录并分享下solr都提供了那些分词器&＃xff1a;

1、solr.Letter.TokenizerFactory创建org.apache.lucene.analysis.LetterTokenizer.
分词举例&＃xff1a;“I can’t” &＃61;&＃61;> “I”, “can”, “t”&＃xff0c;字母切词

2、solr.WhitespaceTokenizerFactory创建org.apache.lucene.analysis.WhitespaceTokenizer&＃xff0c;主要是切除所有空白字符。

3、solr.LowerCaseTokenizerFactory创建org.apache.lucene.analysis.LowerCaseTokenizer
分词举例&＃xff1a;“I can’t” &＃61;&＃61;&＃61;> “i”, “can”, “t”, 主要是大写转小写

4、solr.StandardTokenizerFactory创建org.apache.lucene.analysis.standard.StandardTokenizer
说明&＃xff0c;该分词器会自动地给每个分词添加type&＃xff0c;以便接下来的对type敏感的过滤器进行处理&＃xff0c;目前仅有StandardFilter对Token的类型是敏感的

5、solr.HTMLStripWhitespaceTokenizerFactory
从结果中除去HTML标签&＃xff0c;将结果交给WhitespaceTokenizer处理。

6、solr.HTMLStripStandardTokenizerFactory
从结果中除去HTML标签&＃xff0c;将结果交给StandTokenizer处理。

7、solr.PatternTokenizerFactory
说明&＃xff1a;按照正则表达式对文本进行分词

推荐阅读

solr
部署solr建立nutch索引

2019独角兽企业重金招聘Python工程师标准接着上篇nutch1.4的部署应用，我们来部署一下solr，solr是对lucene进行了封装的企 ... [详细]

蜡笔小新 2023-10-16 18:06:09
ip
首次周测解析与答案

本文档提供了首次周测的答案解析，涵盖特殊符号、命令作用、路径说明以及实战练习等内容。 ... [详细]

蜡笔小新 2024-11-25 14:28:11
object
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
web
Fiddler 安装与配置指南

本文详细介绍了Fiddler的安装步骤及配置方法，旨在帮助用户顺利抓取用户Token。文章还涵盖了一些常见问题的解决方案，以确保安装过程顺利。 ... [详细]

蜡笔小新 2024-11-22 11:36:57
list
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
split
java解析json转Map

java解析json转Map前段时间在做json报文处理的时候，写了一个针对不同格式json转map的处理工具方法，总结记录如下：1、单节点单层级、单节点多层级json转mapim ... [详细]

蜡笔小新 2024-11-15 18:21:27
include
Lucene 4.2.1入门教程之查询构造

为什么80%的码农都做不了架构师？本文介绍了Lucene查询构造的几种方法。1.查询方式简介查询构造的方法主要有两种，第一种是Query,另外一种 ... [详细]

蜡笔小新 2024-10-12 00:33:43
web
datetime 索引_【免费毕设】ASP.NET基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+论文)...

点击上方“蓝字”关注我们目录系统设计4.1搜索引擎模型模型包括爬虫、索引生成、查询以及系统配置部分。爬虫包括：网页抓取模块、网页减肥模块、爬虫维持模块。索引生成包括& ... [详细]

蜡笔小新 2024-10-09 12:30:45
include
org.apache.solr.common.SolrDocument.setField()方法的使用及代码示例

本文整理了Java中org.apache.solr.common.SolrDocument.setField()方法的一些代码示例，展示了SolrDocum ... [详细]

蜡笔小新 2023-12-09 06:54:05
ip
HBase 数据复制与灾备同步策略

本文探讨了HBase在企业级应用中的数据复制与灾备同步解决方案，包括存量数据迁移及增量数据实时同步的方法。 ... [详细]

蜡笔小新 2024-11-21 19:20:03
foreach
如何使用 org.apache.tinkerpop.gremlin.structure.VertexProperty 的 key 方法

本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法，并提供了多个实际应用的代码示例。通过这些示例，读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]

蜡笔小新 2024-11-21 17:38:10
include
编译原理中的语法分析方法探讨

本文探讨了在编译原理课程中遇到的复杂文法问题，特别是当使用SLR(1)文法时遇到的多重规约与移进冲突。文章讨论了可能的解决策略，包括递归下降解析、运算符优先级解析等，并提供了相关示例。 ... [详细]

蜡笔小新 2024-11-19 14:44:19
include
解析与应用：org.apache.hadoop.hdfs.server.namenode.FSNamesystem.shouldUseDelegationTokens() 方法

本文详细介绍了 `org.apache.hadoop.hdfs.server.namenode.FSNamesystem.shouldUseDelegationTokens()` 方法的用途和实际应用场景，并提供了多个代码示例以帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-11-18 17:59:10
callback
Android异步处理系列文章四篇之三

Android异步处理一：使用Thread+Handler实现非UI线程更新UI界面Android异步处理二：使用AsyncTask异步更新UI界面Android异步处理三：Handler+Loope ... [详细]

蜡笔小新 2024-11-15 19:09:29
list
LeetCode 实战：寻找三数之和为零的组合

给定一个包含 n 个整数的数组，判断该数组中是否存在三个元素 a、b、c，使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]

蜡笔小新 2024-11-15 18:39:48

mobiledu2502885977

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章