热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

solr(索引自己的数据集)

概要Solr是一个建立在ApacheLucene之上的搜索服务器,它是一个开源的,基于Java的信息检索库。它旨在驱动强大的文档检索应用程序-无论您需要根据用户的查询向用户提供数据,

概要

Solr是一个建立在Apache Lucene 之上的搜索服务器,它是一个开源的,基于Java的信息检索库。它旨在驱动强大的文档检索应用程序 - 无论您需要根据用户的查询向用户提供数据,Solr都可以为您服务。


由于Solr基于开放标准,因此具有高度的可扩展性。Solr查询是简单的HTTP请求URL,响应是结构化文档:主要是JSON,但也可以是XML,CSV或其他格式。这意味着各种各样的客户端将能够使用Solr,从其他Web应用程序到浏览器客户端,富客户端应用程序和移动设备。任何有HTTP能力的平台都可以和Solr对话。

一个比较常见的情况是,你有太多的数据,或者太多的查询,以至于一台Solr服务器无法处理你的整个工作负载。在这种情况下,您可以使用SolrCloud扩展应用程序的功能,以便更好地在多台服务器上分布数据和处理请求。根据您需要的可扩展性类型,可以混合和匹配多个选项。

“分片”是一种缩放技术,其中一个集合被分割成多个逻辑分片,称为“分片”,以便扩大集合中的文档数量,使其超出实际适合单个服务器的数量。传入查询分发到集合中的每个分片,这些分片响应合并的结果。另一种可用的技术是增加集合的“复制因子”,这允许您通过将请求分散到多个机器来添加具有集合的其他副本的服务器,以处理较高的并发查询负载。分片和复制不是相互排斥的,它们一起使Solr成为一个非常强大和可扩展的平台。



更新数据

numDocs表示索引中可搜索文档的数量(由于某些文件包含多个文档,因此将大于XML,JSON或CSV文件的数量)。maxDoc值可能会更大,因为maxDoc计数包括尚未从索引中物理删除的逻辑删除文档。你可以重新张贴样本文件一遍又一遍,只要你想,numDocs永远不会增加,因为新的文件将不断取代旧的。

删除数据


执行以下命令删除特定的文档:

bin/post -c localDocs -d "SP2514N"

要删除所有文档,可以使用“删除查询”命令:

bin/post -c localDocs -d "*:*"




推荐阅读
  • 一:什么是solrSolr是apache下的一个开源项目,使用Java基于lucene开发的全文搜索服务器;Lucene是一个开放源代 ... [详细]
  • camel_使用Camel在来自不同来源的Solr中索引数据
    camelApacheSolr是建立在Lucene之上的“流行的,快速的开源企业搜索平台”。为了进行搜索(并查找结果),通常需要从不同的源(例如内容管理 ... [详细]
  • Lucene 全文检索技术入门
    一、搜索引擎的历史萌芽:Archie、Gopher起步:Robot(网络机器人)的出现与spider(网络爬虫)发展:excite、galax ... [详细]
  • 首先我们在taotao-search-interface工程中新建一个SearchService接口,并在接口中添加一个方法,如下图所示。接着,我们到taotao-search-s ... [详细]
  • solr倒排索引(转载)
    原文地址:http:blog.csdn.netchichengitarticledetails9235157http:blog.csdn.netnjpjsoftdevarticle ... [详细]
  • javajigsaw2015年12月1日,星期二,在OpenJDK邮件列表中,MarkReinhold确认了许多人的期望:J ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法
    本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法,包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时,还介绍了修改nginx的error.log日志级别为debug,以便查看详细日志信息。 ... [详细]
  • 31.项目部署
    目录1一些概念1.1项目部署1.2WSGI1.3uWSGI1.4Nginx2安装环境与迁移项目2.1项目内容2.2项目配置2.2.1DEBUG2.2.2STAT ... [详细]
  • svnWebUI:一款现代化的svn服务端管理软件
    svnWebUI是一款图形化管理服务端Subversion的配置工具,适用于非程序员使用。它解决了svn用户和权限配置繁琐且不便的问题,提供了现代化的web界面,让svn服务端管理变得轻松。演示地址:http://svn.nginxwebui.cn:6060。 ... [详细]
  • ES基本原理名词解释In-memorybuffer:ES内存缓冲区,新建的document写入的地方document:索引和搜索的 ... [详细]
  • mysql+全文检索设计,基于sphinx+mysql全文检索架构设计.doc
    基于sphinxmysql全文检索架构设计.doc还剩2页未读,继续阅读下载文档到电脑,马上远离加班熬夜!亲,喜欢就下载吧& ... [详细]
  • 搞懂 ELK 并不是一件特别难的事
    点击下方“民工哥技术之路”,选择“设为星标”回复“1024”获取独家整理的学习资料!本篇文章主要介绍ELK的一些框架组成,原理和实践&#x ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
author-avatar
huai
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有