热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PythonElasticsearchDSL查询指南

本文简要介绍了如何使用PythonElasticsearchDSL进行基本和高级查询,包括连接Elasticsearch、执行简单和复杂查询、聚合、排序及分页等。

本文将详细介绍如何利用 Python Elasticsearch DSL 库与 Elasticsearch 交互,涵盖从基础连接到复杂查询的各项技术。

### 建立连接

首先,需要安装并导入 elasticsearch 库,然后创建一个客户端实例来连接 Elasticsearch 集群:

import elasticsearch
client = elasticsearch.Elasticsearch([{'host': '10.44.99.102', 'port': 9200}])
# 或者
client = elasticsearch.Elasticsearch(['10.44.99.102:9200'])

### 执行查询

使用 search 方法可以执行基本查询,例如:

respOnse= client.search(index='bank', q='Holmes', size=1, from_=1)
respOnse= client.search(index='bank', q='39225 5686', size=1000, filter_path=['hits.hits._id', 'hits.hits._type'])

### 多索引查询

可以在单个请求中指定多个索引,支持字符串、列表或正则表达式:

respOnse= client.search(index=['bank', 'banner', 'country'])
respOnse= client.search(index=['apple*'])

### 使用 elasticsearch_dsl 进行查询

除了直接使用 elasticsearch 库外,还可以使用 elasticsearch_dsl 库来构建更复杂的查询:

from elasticsearch_dsl import Search
s = Search(using=client, index='situation-event').execute()
print(s.to_dict())

### 条件查询

可以通过 query 方法添加多个查询条件:

s = Search(using=client, index='situation-event').query('match', event_type='002')
s = s.query('match', event_title='aaa')
print(s.execute().to_dict())

### 多字段查询

使用 MultiMatch 可以同时在多个字段上执行查询:

from elasticsearch_dsl.query import MultiMatch
multi_match = MultiMatch(query='aaa', fields=['event_type', 'event_title'])
s = Search(using=client, index='situation-event').query(multi_match)
print(s.execute().to_dict())

### 使用 Q 对象构建查询

Q 对象提供了更灵活的方式来构建查询条件:

from elasticsearch_dsl import Q
q = Q('multi_match', query='aaa', fields=['event_type', 'event_title'])
s = Search(using=client, index='situation-event').query(q)
print(s.execute().to_dict())

### 组合查询

可以使用逻辑运算符(如 AND、OR、NOT)来组合多个查询条件:

q = Q('bool', must=[Q('match', event_type='002'), Q('match', event_title='aaa')])
s = Search(using=client, index='situation-event').query(q)
print(s.execute().to_dict())

### 范围查询

使用 range 方法可以执行基于范围的查询:

s = Search(using=client, index='situation-event').filter('range', update_time={'gte': 0, 'lt': time.time()}).query('match', event_type='003')
print(s.to_dict())

### 聚合查询

聚合操作允许对数据进行分组和统计分析:

s = Search(using=client, index='situation-event')
s.aggs.bucket('per_one', 'terms', field='event_type')
respOnse= s.execute()
print(response.to_dict())

### 排序和分页

可以使用 sort 方法对结果进行排序,并通过切片实现分页:

s = Search().sort('category', '-title', {'lines': {'order': 'asc', 'mode': 'avg'}})
s = s[10:20]
print(s.to_dict())

### 其他功能

除了上述功能,elasticsearch_dsl 还提供了许多其他方法来增强查询能力,例如设置扩展属性、控制返回字段等:

s = Search()
s = s.extra(explain=True)
s = s.params(search_type='count')
s = s.source(['title', 'body'])
s = s.source(False)
s = s.source(include=['title'], exclude=['user.*'])
s = s.source(None)
s = Search.from_dict({'query': {'match': {'title': 'python'}}})
s.update_from_dict({'query': {'match': {'title': 'python'}}, 'size': 42})

推荐阅读
  • 本文详细介绍了Elasticsearch中的分页查询机制,包括基本的分页查询流程、'from-size'浅分页与'scroll'深分页的区别及应用场景,以及两者在性能上的对比。 ... [详细]
  • 本文详细介绍了如何使用 Python 编程语言中的 Scapy 库执行 DNS 欺骗攻击,包括必要的软件安装、攻击流程及代码示例。 ... [详细]
  • 本文提供了详细的 Filebeat 部署指南,涵盖了解压安装包、配置文件编辑以及启动服务等关键步骤。具体操作包括使用 `tar -zxvf filebeat-6.1.1-linux-x86_64.tar.gz` 解压安装包,并通过 `vi /home/elk/filebeat-6.4.2-linux/filebeat.yml` 编辑配置文件。此外,文章还介绍了最佳实践,帮助用户确保 Filebeat 的高效运行和数据传输的可靠性。 ... [详细]
  • 使用R语言进行Foodmart数据的关联规则分析与可视化
    本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况,然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]
  • 本文探讨了在Python中多线程与多进程的性能差异,特别是在处理CPU密集型任务和I/O密集型任务时的表现。由于全局解释器锁(GIL)的存在,多线程在利用多核CPU方面表现不佳,而多进程则能有效利用多核资源。 ... [详细]
  • 本文详细探讨了编程中的命名空间与作用域概念,包括其定义、类型以及在不同上下文中的应用。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 本文探讨了在已知最终数组尺寸不会超过5000x10的情况下,如何利用预分配和调整大小的方法来优化Numpy数组的创建过程,以提高性能并减少内存消耗。 ... [详细]
  • 在安装并配置了Elasticsearch后,我在尝试通过GET /_nodes请求获取节点信息时遇到了问题,收到了错误消息。为了确保请求的正确性和安全性,我需要进一步排查配置和网络设置,以确保Elasticsearch集群能够正常响应。此外,还需要检查安全设置,如防火墙规则和认证机制,以防止未经授权的访问。 ... [详细]
  • Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案 ... [详细]
  • Python Selenium WebDriver 浏览器驱动详解与实践
    本文详细介绍了如何使用Python结合Selenium和unittest构建自动化测试框架,重点解析了WebDriver浏览器驱动的配置与使用方法,涵盖Chrome、Firefox、IE/Edge等主流浏览器。 ... [详细]
  • Kubernetes Services详解
    本文深入探讨了Kubernetes中的服务(Services)概念,解释了如何通过Services实现Pods之间的稳定通信,以及如何管理没有选择器的服务。 ... [详细]
  • 本文探讨了Android系统中联系人数据库的设计,特别是AbstractContactsProvider类的作用与实现。文章提供了对源代码的详细分析,并解释了该类如何支持跨数据库操作及事务处理。源代码可从官方Android网站下载。 ... [详细]
  • 本文探讨了Python中的enchant模块及其提供的dict_exists()函数,该函数用于检测特定语言词典的可用性。 ... [详细]
  • 构建Elasticsearch环境与课程索引
    本章节详细介绍了如何在开发环境中搭建Elasticsearch (ES) 环境,包括安装、启动服务端以及创建索引和映射的具体步骤。对于旧版ES环境的清理方法也进行了说明。 ... [详细]
author-avatar
hustjs
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有