lucene实例2

为什么80%的码农都做不了架构师&＃xff1f;>>>

package com.lucene;

import java.io.File;
import java.io.FileReader;
import java.util.Date;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;

/**
* 简单的搜索
*
* 给指定的文件夹下的文件建立索引 ,为指定的的文件创建索引基本搜索功能
*
* &＃64;author dengyang
*
*/
public class TestIndex2 {

// static Analyzer analyzer &＃61; new StandardAnalyzer(Version.LUCENE_35);//内置分词器
static Analyzer analyzer &＃61; new StandardAnalyzer(Version.LUCENE_35);

public static void createIndexByPath(File indexDir, File dataDir) {
try {
Directory dir &＃61; new SimpleFSDirectory(indexDir);
IndexWriterConfig iwConf &＃61; new IndexWriterConfig(Version.LUCENE_35,analyzer);
iwConf.setOpenMode(OpenMode.CREATE);
IndexWriter indexWriter &＃61; new IndexWriter(dir, iwConf);
long startTime &＃61; new Date().getTime();
File[] files &＃61; dataDir.listFiles();
for (int i &＃61; 0; i if (files[i].isFile()) {
// System.out.println(files[i].getCanonicalPath());
// System.out.println(files[i].getName());
Document document &＃61; new Document();
document.add(new Field("path", files[i].getCanonicalPath(),Field.Store.YES, Field.Index.ANALYZED));
document.add(new Field("filename", files[i].getName(),Field.Store.YES, Field.Index.ANALYZED));
document.add(new Field("contents", new FileReader(files[i])));
indexWriter.addDocument(document);
}
}
indexWriter.close();
long endTime &＃61; new Date().getTime();
System.out.println("创建索引功耗时&＃xff1a;" &＃43; (endTime - startTime) / 1000 &＃43; "s");
} catch (Exception e) {
e.printStackTrace();
}
}

public static void searchIndexByString(String searchStr, String fileName,File indexDir) {
try {
// fileName:根据某个域搜索 new MultiFieldQueryParser 可以用多个域
QueryParser queryParser &＃61; new QueryParser(Version.LUCENE_35,fileName, analyzer);
Query query &＃61; queryParser.parse(searchStr);
System.out.println("query &＃61; "&＃43;query);
IndexReader reader &＃61; IndexReader.open(new SimpleFSDirectory(indexDir));
IndexSearcher searcher &＃61; new IndexSearcher(reader);
long startTime &＃61; new Date().getTime();
TopDocs topDocs &＃61; searcher.search(query, 10);//默认的搜索方法
// searcher.setDefaultFieldSortScoring(true, false);//评分
// TopDocs topDocs &＃61; searcher.search(query, null, 20, Sort.RELEVANCE);//搜索排序 , 不需要过滤
// Filter filter &＃61; new QueryWrapperFilter(new TermQuery(new Term("filename", "stylesheet")));
// TopDocs topDocs &＃61; searcher.search(query, filter, 20, Sort.RELEVANCE);//搜索排序 , 过滤
System.out.println("共有文件&＃xff1a;" &＃43; topDocs.totalHits);
for (int i &＃61; 0; i Document document &＃61; searcher.doc(topDocs.scoreDocs[i].doc);
System.out.println("&＃61;" &＃43; i);
System.out.println("path&＃61;" &＃43; document.get("path"));
System.out.println("filename&＃61;" &＃43; document.get("filename"));
}
reader.close();
searcher.close();
long endTime &＃61; new Date().getTime();
System.out.println("搜索功耗时&＃xff1a;" &＃43; (endTime - startTime));
} catch (Exception e) {
e.printStackTrace();
}
}

/**
* &＃64;param args
*/
public static void main(String[] args) {
File indexDir &＃61; new File("D:\\luceneIndex");
File dataDir &＃61; new File("F:\\面试与就业");

createIndexByPath(indexDir, dataDir);
// searchIndexByString("面试与就业", "path", indexDir);
searchIndexByString("面试","filename",indexDir);
}
}

lucene实例2

Nutch_Nutch

camel_使用Camel在来自不同来源的Solr中索引数据

如何自行分析定位SAP BSP错误

Nginx使用AWStats日志分析的步骤及注意事项

javascript – 概述在Firefox上无法正常工作

解决Mac上无法使用localhost连接mysql的问题

如何从列表中删除所有零？

Python爬虫中使用正则表达式的方法和注意事项

centos 编译安装 php 5.5,CentOS 5.5上编译安装 PHP 5.3.6

利用ASP.NET MVC和Bootstrap快速搭建响应式个人博客站(一)

PDO混合未命名和命名参数 - PDO mixing unnamed and named parameters

linux centos安装lamp(yum快速安装)

es的分布式原理？es是如何实现分布式的？

Solr简介（1）

mysql+全文检索设计,基于sphinx+mysql全文检索架构设计.doc