当前位置: 开发笔记 > 编程语言 > 正文

python–使用jcc在pylucene/inheritance中编写自定义anaylzer？

作者：手机用户2502891655 | 来源：互联网 | 2023-09-11 10:50

我想在pylucene中编写一个自定义分析器.通常在javalucene中,当你编写一个分析器类时,你的类继承了lucene的Analyzer类.但是pylucene

我想在pylucene中编写一个自定义分析器.
通常在java lucene中,当你编写一个分析器类时,你的类继承了lucene的Analyzer类.

但是pylucene使用jcc,java到c / python编译器.

那么如何让python类使用jcc从java类继承,尤其是如何编写自定义pylucene分析器？

谢谢.

解决方法:

以下是包装EdgeNGram过滤器的分析器示例.

import lucene class EdgeNGramAnalyzer(lucene.PythonAnalyzer): ''' This is an example of a custom Analyzer (in this case an edge-n-gram analyzer) EdgeNGram Analyzers are good for type-ahead ''' def __init__(self, side, minlength, maxlength): ''' Args: side[enum] Can be one of lucene.EdgeNGramTokenFilter.Side.FRONT or lucene.EdgeNGramTokenFilter.Side.BACK minlength[int] maxlength[int] ''' lucene.PythonAnalyzer.__init__(self) self.side = side self.minlength = minlength self.maxlength = maxlength def tokenStream(self, fieldName, reader): result = lucene.LowerCaseTokenizer(Version.LUCENE_CURRENT, reader) result = lucene.StandardFilter(result) result = lucene.StopFilter(True, result, StopAnalyzer.ENGLISH_STOP_WORDS_SET) result = lucene.ASCIIFoldingFilter(result) result = lucene.EdgeNGramTokenFilter(result, self.side, self.minlength, self.maxlength) return result

推荐阅读

object
Python 中 filter、map 和 reduce 函数详解

本文深入探讨了 Python 编程语言中 filter、map 和 reduce 函数的功能与用法，包括它们的基本语法、应用场景及代码示例，旨在帮助读者更好地理解和运用这些高阶函数。 ... [详细]

蜡笔小新 2024-11-26 14:26:43
get
Activity跳转动画无缝衔接

Activity跳转动画无缝衔接 ... [详细]

蜡笔小新 2024-11-27 11:40:35
get
Symfony中日期时间字段格式设置技巧

本文探讨了如何在Symfony框架中正确设置日期时间字段的格式，以满足特定的显示需求。 ... [详细]

蜡笔小新 2024-11-27 11:38:03
ip
Python全栈之旅：SQLAlchemy ORM中的外键与关系

本文探讨了SQLAlchemy ORM框架中如何利用外键和关系（relationship）来建立表间联系，简化复杂的查询操作。通过示例代码详细解释了relationship的定义、使用方法及其与外键的相互作用。 ... [详细]

蜡笔小新 2024-11-27 11:20:01
ip
Python与PyCharm：理解两者之间的差异

本文旨在阐述Python编程语言与PyCharm集成开发环境（IDE）之间的主要区别。Python作为一种广泛使用的高级编程语言，以其简洁明了的语法著称；而PyCharm则是专为Python开发者设计的强大工具集。 ... [详细]

蜡笔小新 2024-11-27 10:48:19
ip
electronvue使用electronupdater实现自动更新

今天呢，给大家带来一篇干货满满的electron-vue自动升级的教程，话不多说，开始我的表演!配置文件package.jsonbu ... [详细]

蜡笔小新 2024-11-26 19:07:21
get
Mac环境下Python与MySQL交互指南

本文详细介绍了在Mac操作系统中使用Python连接MySQL数据库的方法，包括常见的错误处理及解决方案。 ... [详细]

蜡笔小新 2024-11-26 17:41:41
get
Python - 合并具有相同值的字典键

本文介绍如何使用Python编程语言合并字典中具有相同集合值的键，并提供两种实现方法。 ... [详细]

蜡笔小新 2024-11-26 16:26:06
get
Python游戏开发实战：外星人入侵项目详解

本文详细介绍了使用Python进行《外星人入侵》游戏开发的全过程，包括环境搭建、游戏逻辑设计及代码实现等关键步骤，适合对游戏开发感兴趣的朋友参考。 ... [详细]

蜡笔小新 2024-11-26 15:21:31
ip
如何在 VS Code 中调试 Vue 项目

本文详细介绍了如何通过配置 Chrome 和 VS Code 来实现对 Vue 项目的高效调试。步骤包括启用 Chrome 的远程调试功能、安装 VS Code 插件以及正确配置 launch.json 文件。 ... [详细]

蜡笔小新 2024-11-27 11:52:35
ip
MySQL 安装指南

本文档提供了详细的MySQL安装步骤，包括解压安装文件、选择安装类型、配置MySQL服务以及设置管理员密码等关键环节，帮助用户顺利完成MySQL的安装。 ... [详细]

蜡笔小新 2024-11-27 09:10:30
get
深入解析Android Activity生命周期

本文详细探讨了Android中Activity的生命周期，通过实例代码和详细的步骤说明，帮助开发者更好地理解和掌握Activity各个阶段的行为。 ... [详细]

蜡笔小新 2024-11-27 03:28:32
get
深入解析 com.codahale.metrics.servlets.AdminServlet.() 方法及其应用实例

本文详细探讨了 Java 中 com.codahale.metrics.servlets.AdminServlet.() 方法的实现与应用，并提供了多个实际项目中的代码示例，帮助开发者更好地理解和使用这一方法。 ... [详细]

蜡笔小新 2024-11-26 19:33:26
ip
VMware 15.5.7 中文版激活方法

本文提供了一种有效的方法来激活 VMware 15.5.7 的中文版本，同时介绍了如何利用最新的激活码进行操作，确保用户能够顺利使用。 ... [详细]

蜡笔小新 2024-11-26 18:59:09
ip
配置PicGo与Gitee结合Typora打造高效写作环境

本文详细介绍了如何通过PicGo和Gitee搭建个人图床，并结合Typora实现高效的文章撰写。包括创建图床项目、生成访问令牌、安装配置PicGo和Typora等步骤。 ... [详细]

蜡笔小新 2024-11-26 16:42:35

手机用户2502891655

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章