科技情报开发与经济
文章编号:1005-6033(2005)15-0242-03
SCI/TECHINFORMATIONDEVELOPMENT&ECO
NOMY2005年第15卷第15期
收稿日期:2005-06-03
基于Lucene的网站全文搜索的设计与实现
陈庆伟1,刘
军2
(1.山西省网络管理中心,山西太原,030001;2.山西省科技情报
研究所,山西太原,030001)摘要:Lucene是一个基于Java技术
的开放源代码全文索引引擎工具包,它可以方便
地嵌入到各种应用中实现针对应用的全文索引/检索功能。利用Lucene
的API可以比较方便地为一个网站提供全文搜索功能。探讨了如何使用Luce
ne建造一个通用的Web站点全文搜索工具,并对在构建系统中应注意的若干问
题进行了探讨。关键词:全文搜索;Lucene;Java中图分类号:TP3
93.07文献标识码:A
在构建一个信息类Web站点的时候,站点的全文搜索功能是必备的功能之
一。一般站点的信息内容都存储在各种数据库系统中,并使用数据库提供的检索和
查询功能构建网站的搜索功能。但随着信息的累
‘
%keyword%
’
查询构成的
数据检索性能将积,使用数据库中的类似like急剧下降,因此,只使用数据库
查询进行全文检索并不是一个好的解决它可以方便方案。Lucene是一个基于
Java技术的全文索引引擎工具包,