作者:机智的孙志嵘 | 来源:互联网 | 2023-05-26 10:02
Lucene的使用主要体现在两个步骤:1创建索引,通过IndexWriter对不同的文件进行索引的创建,并将其保存在索引相关文件存储的位置中。2通过索引查寻关键字相关文档。首先,我们需要定
Lucene的使用主要体现在两个步骤:
1 创建索引,通过IndexWriter对不同的文件进行索引的创建,并将其保存在索引相关文件存储的位置中。
2 通过索引查寻关键字相关文档。
首先,我们需要定义一个词法分析器。
Analyzer analyzer = new IKAnalyzer(true);
注意各种词法分析器的区别,详见 http://blog.csdn.net/silentmuh/article/details/78451786
比如一句话,“我爱我们的中国!”,如何对他拆分,扣掉停顿词“的”,提取关键字“我”“我们”“中国”等等。这就要借助的词法分析器Analyzer来实现。这里面使用的是标准的词法分析器,如果专门针对汉语,还可以搭配paoding,进行使用。
第二步,确定索引文件存储的位置,Lucene提供给我们两种方式:
Directory directory = FSDirectory.open(FileSystems.getDefault().getPath(INDEX_DIR));
1 本地文件存储
第三步,创建IndexWriter,进行索引文件的写入。
IndexWriterConfig cOnfig= new IndexWriterConfig(analyzer);
IndexWriter indexWriter = new IndexWriter(directory, config);
第四步,内容提取,进行索引的存储。
Document doc = new Document();
String text = "This is the text to be indexed."