热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PythonElasticsearchDSL查询指南

本文简要介绍了如何使用PythonElasticsearchDSL进行基本和高级查询,包括连接Elasticsearch、执行简单和复杂查询、聚合、排序及分页等。

本文将详细介绍如何利用 Python Elasticsearch DSL 库与 Elasticsearch 交互,涵盖从基础连接到复杂查询的各项技术。

### 建立连接

首先,需要安装并导入 elasticsearch 库,然后创建一个客户端实例来连接 Elasticsearch 集群:

import elasticsearch
client = elasticsearch.Elasticsearch([{'host': '10.44.99.102', 'port': 9200}])
# 或者
client = elasticsearch.Elasticsearch(['10.44.99.102:9200'])

### 执行查询

使用 search 方法可以执行基本查询,例如:

respOnse= client.search(index='bank', q='Holmes', size=1, from_=1)
respOnse= client.search(index='bank', q='39225 5686', size=1000, filter_path=['hits.hits._id', 'hits.hits._type'])

### 多索引查询

可以在单个请求中指定多个索引,支持字符串、列表或正则表达式:

respOnse= client.search(index=['bank', 'banner', 'country'])
respOnse= client.search(index=['apple*'])

### 使用 elasticsearch_dsl 进行查询

除了直接使用 elasticsearch 库外,还可以使用 elasticsearch_dsl 库来构建更复杂的查询:

from elasticsearch_dsl import Search
s = Search(using=client, index='situation-event').execute()
print(s.to_dict())

### 条件查询

可以通过 query 方法添加多个查询条件:

s = Search(using=client, index='situation-event').query('match', event_type='002')
s = s.query('match', event_title='aaa')
print(s.execute().to_dict())

### 多字段查询

使用 MultiMatch 可以同时在多个字段上执行查询:

from elasticsearch_dsl.query import MultiMatch
multi_match = MultiMatch(query='aaa', fields=['event_type', 'event_title'])
s = Search(using=client, index='situation-event').query(multi_match)
print(s.execute().to_dict())

### 使用 Q 对象构建查询

Q 对象提供了更灵活的方式来构建查询条件:

from elasticsearch_dsl import Q
q = Q('multi_match', query='aaa', fields=['event_type', 'event_title'])
s = Search(using=client, index='situation-event').query(q)
print(s.execute().to_dict())

### 组合查询

可以使用逻辑运算符(如 AND、OR、NOT)来组合多个查询条件:

q = Q('bool', must=[Q('match', event_type='002'), Q('match', event_title='aaa')])
s = Search(using=client, index='situation-event').query(q)
print(s.execute().to_dict())

### 范围查询

使用 range 方法可以执行基于范围的查询:

s = Search(using=client, index='situation-event').filter('range', update_time={'gte': 0, 'lt': time.time()}).query('match', event_type='003')
print(s.to_dict())

### 聚合查询

聚合操作允许对数据进行分组和统计分析:

s = Search(using=client, index='situation-event')
s.aggs.bucket('per_one', 'terms', field='event_type')
respOnse= s.execute()
print(response.to_dict())

### 排序和分页

可以使用 sort 方法对结果进行排序,并通过切片实现分页:

s = Search().sort('category', '-title', {'lines': {'order': 'asc', 'mode': 'avg'}})
s = s[10:20]
print(s.to_dict())

### 其他功能

除了上述功能,elasticsearch_dsl 还提供了许多其他方法来增强查询能力,例如设置扩展属性、控制返回字段等:

s = Search()
s = s.extra(explain=True)
s = s.params(search_type='count')
s = s.source(['title', 'body'])
s = s.source(False)
s = s.source(include=['title'], exclude=['user.*'])
s = s.source(None)
s = Search.from_dict({'query': {'match': {'title': 'python'}}})
s.update_from_dict({'query': {'match': {'title': 'python'}}, 'size': 42})

推荐阅读
  • MySQL DateTime 类型数据处理及.0 尾数去除方法
    本文介绍如何在 MySQL 中处理 DateTime 类型的数据,并解决获取数据时出现的.0尾数问题。同时,探讨了不同场景下的解决方案,确保数据格式的一致性和准确性。 ... [详细]
  • 利用决策树预测NBA比赛胜负的Python数据挖掘实践
    本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据,结合《Python数据挖掘入门与实践》一书中的方法,展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]
  • 目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 本文介绍如何在现有网络中部署基于Linux系统的透明防火墙(网桥模式),以实现灵活的时间段控制、流量限制等功能。通过详细的步骤和配置说明,确保内部网络的安全性和稳定性。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 使用Pandas高效读取SQL脚本中的数据
    本文详细介绍了如何利用Pandas直接读取和解析SQL脚本,提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本,并且能够显著提升数据导入的速度和效率。 ... [详细]
  • 在现代Web应用中,当用户滚动到页面底部时,自动加载更多内容的功能变得越来越普遍。这种无刷新加载技术不仅提升了用户体验,还优化了页面性能。本文将探讨如何实现这一功能,并介绍一些实际应用案例。 ... [详细]
  • Python第三方库安装的多种途径及注意事项
    本文详细介绍了Python第三方库的几种常见安装方法,包括使用pip命令、集成开发环境(如Anaconda)以及手动文件安装,并提供了每种方法的具体操作步骤和适用场景。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • 本文探讨了在Django项目中,如何在对象详情页面添加前后导航链接,以提升用户体验。文章详细描述了遇到的问题及解决方案。 ... [详细]
  • 本文将详细介绍如何在没有显示器的情况下,使用Raspberry Pi Imager为树莓派4B安装操作系统,并进行基本配置,包括设置SSH、WiFi连接以及更新软件源。 ... [详细]
  • 本文详细介绍了优化DB2数据库性能的多种方法,涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段,可以显著提升数据库的运行效率和响应速度。 ... [详细]
  • 使用OpenCV和Python 4.2提升模糊图像清晰度
    本文介绍如何利用OpenCV库在Python中处理图像,特别是通过不同类型的滤波器来改善模糊图像的质量。我们将探讨均值、中值和自定义滤波器的应用,并展示代码示例。 ... [详细]
  • 搭建Jenkins、Ant与TestNG集成环境
    本文详细介绍了如何在Ubuntu 16.04系统上配置Jenkins、Ant和TestNG的集成开发环境,涵盖从安装到配置的具体步骤,并提供了创建Windows Slave节点及项目构建的指南。 ... [详细]
author-avatar
hustjs
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有