热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

Oracle建立二进制文件索引的方法

Oracle建立二进制文件索引的方法

Oracle建立二进制文件索引的方法

正在看的ORACLE教程是:Oracle建立二进制文件索引的方法。Oracle text是Oracle的全文检索技术,是9i版本标准版和企业版的一部分。Oracle text使用标准的sql语言索引、查找、分析存储在oracle数据库、文件或者网络里的文本及文档。 Oracle text能进行关于文档的语言分析,使用多种方法查找文档,包括关键字、上下文查询、逻辑操作、模式匹配、混合主题查询、HTML/XML段落查找等方法。Oracle text在包含文本和结构化的关系属性的混合查询方面具有优越性。下面举例说明。

  现有文档表ZYCONTENT_TABLE为上载文件的存储表,二进制文件以BLOB类型存储在BLOB_CONTENT列中,oracle text技术提供为BLOB列中的二进制文本文件建立索引的方法,细节如下:

  一、准备工作

  文档表的模式为ZYFILEUP,文档表为ZYCONTENT_TABLE。文档表定义为:


  二、为拥有文档表的模式建立文本索引授权

  以system用户连接数据库,为ZYFILEUP授权。


  三、建立文档表在BLOB_CONTENT列上的索引

  以ZYFILEUP用户连接数据库,建立文本索引参考项


  建立索引


  四、索引同步和删除

  同步索引的两种方法:


  和


  删除索引的方法:


  五、索引功能介绍

  1.索引的文件类型

  Oracle text可以过滤以及从不同格式的文档里提取内容,它支持150多种文档格式,最常见的MS OFFICE文档、PDF文档等都可由Oracle text来检索。

  2.过滤器介绍

  对于纯文本文件格式,如TXT、HTML、XML等文件,使用空过滤器,即NULL_FILTER,对于二进制文件,使用INSO_FILTER过滤器,如果文档表的BLOB列中含有二进制文件和纯文本文件,也要用INSO_FILTER过滤器,但最好是把纯文本和二进制文件分开存储和索引。Oracle text还提供包来从二进制文件中提取文本到纯文本文件中。

  3.词典

  可以定制不同语言的词典,该词典含有同意词和词的级别关系。Oracle text可以提供多语言的最优特性以支持跨越西方语言、日语、朝鲜语、传统和简体中文所写的文档查找。

  六、文本查询语句格式


  contains函数提供强大的查询功能,"与"、"或"关系,相近(near ;)和排除(not ~)等功能,更方便的是它还可以根据某一关键词查询不同语种的文本,当然,这要事先设定词典。

  七、实际应用中的问题

  在我的实际应用中,最常用的是使用Oracle text对Word、Excel、PowerPoint、HTML、PDF等格式的中文文档进行索引,但我发现,无论使用INSO_FILTER还是NULL_FILTER,无论使用BASIC_LEXER还是CHINESE_LEXER,都不能检索RTF格式的文本文档,我在win2000,XP下试验,都没成功,不知什么原因。总体来说,Oracle text的文本检索功能还是相当出色的,它甚至不需要文本文件存储在数据库里,即使存储在操作系统的文件目录里,Oracle text也能在数据库里为文件建立索引。
推荐阅读
  • HTML:  将文件拖拽到此区域 ... [详细]
  • 本文探讨了如何在PHP与MySQL环境中实现高效的分页查询,包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]
  • 本文详细介绍了如何使用SQL*Plus连接Oracle数据库以及使用MySQL客户端连接MySQL数据库的方法,包括基本命令和具体操作步骤。 ... [详细]
  • 一、使用Microsoft.Office.Interop.Excel.DLL需要安装Office代码如下:2publicstaticboolExportExcel(S ... [详细]
  • PHP中Smarty模板引擎自定义函数详解
    本文详细介绍了如何在PHP的Smarty模板引擎中自定义函数,并通过具体示例演示了这些函数的使用方法和应用场景。适合PHP后端开发者学习。 ... [详细]
  • Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]
  • JavaScript 跨域解决方案详解
    本文详细介绍了JavaScript在不同域之间进行数据传输或通信的技术,包括使用JSONP、修改document.domain、利用window.name以及HTML5的postMessage方法等跨域解决方案。 ... [详细]
  • 在Notepad++中配置Markdown语法高亮及实时预览功能
    本文详细介绍了如何在Notepad++中配置Markdown语法高亮和实时预览功能,包括必要的插件安装和设置步骤。 ... [详细]
  • Android 中的布局方式之线性布局
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 本文探讨了如何通过优化 DOM 操作来提升 JavaScript 的性能,包括使用 `createElement` 函数、动画元素、理解重绘事件及处理鼠标滚动事件等关键主题。 ... [详细]
  • 如何在Django框架中实现对象关系映射(ORM)
    本文介绍了Django框架中对象关系映射(ORM)的实现方式,通过ORM,开发者可以通过定义模型类来间接操作数据库表,从而简化数据库操作流程,提高开发效率。 ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
  • JUnit下的测试和suite
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问,特别是对于需要频繁访问的服务,如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本,并提供了对多种服务的统一访问接口。 ... [详细]
  • 深入理解:AJAX学习指南
    本文详细探讨了AJAX的基本概念、工作原理及其在现代Web开发中的应用,旨在为初学者提供全面的学习资料。 ... [详细]
author-avatar
情调
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有