大数据培训技术ELK文档操作

作者：Lala88童鞋_619 | 来源：互联网 | 2023-09-23 08:49

文档操作CRUD创建文档1、索引一个文档文档通过indexAPI被索引——使数据可以被存储和搜索。但是首先我们需要决定文档所在。正如我们讨论的，文档通过其_i

文档操作

CRUD

创建文档

1、索引一个文档

文档通过index API被索引——使数据可以被存储和搜索。但是首先我们需要决定文档所在。正如我们讨论的&＃xff0c;文档通过其_index、_type、_id唯一确定。们可以自己提供一个_id&＃xff0c;或者也使用index API 为我们生成一个。

PUT {index}/{type}/{id}

{

“”:””

}

2、使用自己的ID

如果你的文档有自然的标识符&＃xff08;例如user_account字段或者其他值表示文档&＃xff09;&＃xff0c;你就可以提供自己的_id&＃xff0c;使用这种形式的index API&＃xff1a;

PUT /{index}/{type}/{id}

{

“field”: “value”,

…

}

例如我们的索引叫做“website”&＃xff0c;类型叫做“blog”&＃xff0c;我们选择的ID是“123”&＃xff0c;那么这个索引请求就像这样&＃xff1a;

PUT /website/blog/123

{

“title”: “My first blog entry”,

“text”: “Just trying this out…”,

“date”: “2014/01/01”

}

Elasticsearch的响应&＃xff1a;

{

“_index”: “website”,

“_type”: “blog”,

“_id”: “123”,

“_version”: 1,

“created”: true

}

响应指出请求的索引已经被成功创建&＃xff0c;这个索引中包含_index、_type和_id元数据&＃xff0c;以及一个新元素&＃xff1a;_version。

Elasticsearch中每个文档都有版本号&＃xff0c;每当文档变化&＃xff08;包括删除&＃xff09;都会使_version增加。_version确保你程序的一部分不会覆盖掉另一部分所做的更改。

3、自增ID

如果我们的数据没有自然ID&＃xff0c;我们可以让Elasticsearch自动为我们生成。请求结构发生了变化&＃xff1a;PUT方法——“在这个URL中存储文档”变成了POST方法——”在这个类型下存储文档”。&＃xff08;译者注&＃xff1a;原来是把文档存储到某个ID对应的空间&＃xff0c;现在是把这个文档添加到某个_type下&＃xff09;。

URL现在只包含_index和_type两个字段&＃xff1a;

POST /website/blog/

{

“title”: “My second blog entry”,

“text”: “Still trying this out…”,

“date”: “2014/01/01”

}

响应内容与刚才类似&＃xff0c;只有_id字段变成了自动生成的值&＃xff1a;

{

“_index”: “website”,

“_type”: “blog”,

“_id”: “wM0OSFhDQXGZAWDf0-drSA”,

“_version”: 1,

“created”: true

}

自动生成的ID有22个字符长&＃xff0c;URL-safe, Base64-encoded string universally unique identifiers, 或者叫 UUIDs。

获取文档

1、检索文档

想要从Elasticsearch中获取文档&＃xff0c;我们使用同样的_index、_type、_id&＃xff0c;但是HTTP方法改为GET&＃xff1a;

GET /website/blog/123?pretty

响应包含了现在熟悉的元数据节点&＃xff0c;增加了_source字段&＃xff0c;它包含了在创建索引时我们发送给Elasticsearch的原始文档。

2、pretty

在任意的查询字符串中增加pretty参数&＃xff0c;类似于上面的例子。会让Elasticsearch美化输出(pretty-print)JSON响应以便更加容易阅读。_source字段不会被美化&＃xff0c;它的样子与我们输入的一致。

GET请求返回的响应内容包括{“found”: true}。这意味着文档已经找到。如果我们请求一个不存在的文档&＃xff0c;依旧会得到一个JSON&＃xff0c;不过found值变成了false。

此外&＃xff0c;HTTP响应状态码也会变成’404 Not Found’代替’200 OK’。我们可以在curl后加-i参数得到响应头&＃xff1a;

curl -i -XGET http://localhost:9200/website/blog/124?pretty

现在响应类似于这样&＃xff1a;

HTTP/1.1 404 Not Found

Content-Type: application/json; charset&＃61;UTF-8

Content-Length: 83

{

“_index” : “website”,

“_type” : “blog”,

“_id” : “124”,

“found” : false

}

3、检索文档的一部分

通常&＃xff0c;GET请求将返回文档的全部&＃xff0c;存储在_source参数中。但是可能你感兴趣的字段只是title。请求个别字段可以使用_source参数。多个字段可以使用逗号分隔&＃xff1a;

GET /website/blog/123?_source&＃61;title,text

_source字段现在只包含我们请求的字段&＃xff0c;而且过滤了date字段&＃xff1a;

{

“_index” : “website”,

“_type” : “blog”,

“_id” : “123”,

“_version” : 1,

“exists” : true,

“_source” : {

“title”: “My first blog entry” ,

“text”: “Just trying this out…”

}

或者你只想得到_source字段而不要其他的元数据&＃xff0c;你可以这样请求&＃xff1a;

GET /website/blog/123/_source

它仅仅返回:

{

“title”: “My first blog entry”,

“text”: “Just trying this out…”,

“date”: “2014/01/01”

}

更新

POST /website/blog/123

{

“title”: “My first blog entry”,

“text”: “I am starting to get the hang of this…”,

“date”: “2014/01/02”

}

在响应中&＃xff0c;我们可以看到Elasticsearch把_version增加了。

{

“_index” : “website”,

“_type” : “blog”,

“_id” : “123”,

“_version” : 2,

“created”: false <1>

}

删除文档

删除文档的语法模式与之前基本一致&＃xff0c;只不过要使用DELETE方法&＃xff1a;

DELETE /website/blog/123

局部更新

POST /website/blog/1/_update

{

“doc” : {

“tags” : [ “testing” ],

“views”: 0

}

如果请求成功&＃xff0c;我们将看到类似index请求的响应结果&＃xff1a;

{

“_index” : “website”,

“_id” : “1”,

“_type” : “blog”,

“_version” : 3

}

检索文档文档显示被更新的_source字段&＃xff1a;

{

“_index”: “website”,

“_type”: “blog”,

“_id”: “1”,

“_version”: 3,

“found”: true,

“_source”: {

“title”: “My first blog entry”,

“text”: “Starting to get the hang of this…”,

“tags”: [ “testing” ], <1>

“views”: 0 <1>

}

批量插入

每个json之间不能有换行\n

POST test_search_index/doc/_bulk

{

“index”:{

“_id”:1

}

{

“username”:”alfred way”,

“job”:”java engineer”,

“age”:18,

“birth”:”1991-12-15″,

“isMarried”:false

}

{

“index”:{

“_id”:2

}

{

“username”:”alfred”,

“job”:”java senior engineer and java specialist”,

“age”:28,

“birth”:”1980-05-07″,

“isMarried”:true

}

{

“index”:{

“_id”:3

}

{

“username”:”lee”,

“job”:”java and ruby engineer”,

“age”:22,

“birth”:”1985-08-07″,

“isMarried”:false

}

{

“index”:{

“_id”:4

}

{

“username”:”lee junior way”,

“job”:”ruby engineer”,

“age”:23,

“birth”:”1986-08-07″,

“isMarried”:false

}

检索多个文档

像Elasticsearch一样&＃xff0c;检索多个文档依旧非常快。合并多个请求可以避免每个请求单独的网络开销。如果你需要从Elasticsearch中检索多个文档&＃xff0c;相对于一个一个的检索&＃xff0c;更快的方式是在一个请求中使用multi-get或者mget API。

mget API参数是一个docs数组&＃xff0c;数组的每个节点定义一个文档的_index、_type、_id元数据。如果你只想检索一个或几个确定的字段&＃xff0c;也可以定义一个_source参数&＃xff1a;

POST /_mget

{

“docs” : [

{

“_index” : “website”,

“_type” : “blog”,

“_id” : 2

{

“_index” : “website”,

“_type” : “pageviews”,

“_id” : 1,

“_source”: “views”

}

]

}

响应体也包含一个docs数组&＃xff0c;每个文档还包含一个响应&＃xff0c;它们按照请求定义的顺序排列。每个这样的响应与单独使用get request响应体相同&＃xff1a;

{

“docs” : [

{

“_index” : “website”,

“_id” : “2”,

“_type” : “blog”,

“found” : true,

“_source” : {

“text” : “This is a piece of cake…”,

“title” : “My first external blog entry”

“_version” : 10

{

“_index” : “website”,

“_id” : “1”,

“_type” : “pageviews”,

“found” : true,

“_version” : 2,

“_source” : {

“views” : 2

}

]

}

如果你想检索的文档在同一个_index中&＃xff08;甚至在同一个_type中&＃xff09;&＃xff0c;你就可以在URL中定义一个默认的/_index或者/_index/_type。

你可以通过简单的ids数组来代替完整的docs数组&＃xff1a;

POST /website/blog/_mget

{

“ids” : [ “2”, “1” ]

}

注意到我们请求的第二个文档并不存在。我们定义了类型为blog&＃xff0c;但是ID为1的文档类型为pageviews。这个不存在的文档会在响应体中被告知。

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训&＃xff0c;尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。

推荐阅读

require
阻止特定控件影响表单的脏状态 - AngularJS

在AngularJS中，有时需要在表单内包含某些控件，但又不希望这些控件导致表单变为脏状态。例如，当用户对表单进行修改后，表单的$dirty属性将变为true，触发保存对话框。然而，对于一些导航或辅助功能控件，我们可能并不希望它们触发这种行为。 ... [详细]

蜡笔小新 2024-11-24 13:01:59
php
使用 ModelAttribute 实现页面数据自动填充

本文介绍了如何利用 Spring MVC 中的 ModelAttribute 注解，在页面跳转后自动填充表单数据。主要探讨了两种实现方法及其背后的原理。 ... [详细]

蜡笔小新 2024-11-24 12:55:24
php
C/C++ 应用程序的安装与卸载解决方案

本文介绍了如何使用Inno Setup来创建C/C++应用程序的安装程序，包括自动检测并安装所需的运行库，确保应用能够顺利安装和卸载。 ... [详细]

蜡笔小新 2024-11-23 13:44:53
client
Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案

Elasticsearch 嵌套调用中动态类导致数据返回异常分析与解决方案 ... [详细]

蜡笔小新 2024-10-26 16:29:42
php
深入理解PHP中的超全局变量与AJAX技术

本文详细介绍了PHP中的几种超全局变量，包括$GLOBAL、$_SERVER、$_POST、$_GET等，并探讨了AJAX的工作原理及其优缺点。通过具体示例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-24 16:35:09
require
Implementing and Testing Ext Ajax Calls with Promises

This article explores the process of integrating Promises into Ext Ajax calls for a more functional programming approach, along with detailed steps on testing these asynchronous operations. ... [详细]

蜡笔小新 2024-11-24 15:29:28
js
使用jQuery与百度地图API实现地址转经纬度功能

本文详细介绍了如何利用jQuery和百度地图API将地址转换为经纬度，包括申请API密钥、页面构建及核心代码实现。 ... [详细]

蜡笔小新 2024-11-24 14:33:10
object
告别jQuery：Bootstrap5即将全面脱离jQuery依赖及其他前端热点

本文精选了2019年2月「前端大全」平台上的15篇热门文章，涵盖技术分享与资源推荐。关注前端大全，获取更多前沿信息，提升您的前端技能。 ... [详细]

蜡笔小新 2024-11-23 19:07:58
object
WebBenchmark：强大的Web API性能测试工具

本文介绍了一款名为WebBenchmark的Web API性能测试工具，该工具不仅支持HTTP和HTTPS服务的测试，还提供了丰富的功能来帮助开发者进行高效的性能评估。 ... [详细]

蜡笔小新 2024-11-23 05:24:11
request
Spring Security基础配置详解

本文详细介绍了Spring Security的基础配置方法，包括如何搭建Maven多模块工程以及具体的安全配置步骤，帮助开发者更好地理解和应用这一强大的安全框架。 ... [详细]

蜡笔小新 2024-11-22 20:52:07
char
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
list
使用TabActivity实现Android顶部选项卡功能

本文介绍如何通过继承TabActivity来创建Android应用中的顶部选项卡。通过简单的步骤，您可以轻松地添加多个选项卡，并实现基本的界面切换功能。 ... [详细]

蜡笔小新 2024-11-21 17:47:42
php
在 Windows 系统上使用 Docker 构建 NGINX、PHP、MySQL、Redis 和 Elasticsearch 的集成开发环境

本文介绍了如何在 Windows 系统上利用 Docker 构建一个包含 NGINX、PHP、MySQL、Redis 和 Elasticsearch 的集成开发环境。通过详细的步骤说明，帮助开发者快速搭建和配置这一复杂的技术栈，提升开发效率和环境一致性。 ... [详细]

蜡笔小新 2024-11-07 06:06:15
list
为何引入jQuery UI自动完成功能后，我的列表框也受到影响？

我在尝试将组合框转换为具有自动完成功能时遇到了一个问题，即页面上的列表框也被转换成了自动完成下拉框，而不是保持原有的多选列表框形式。 ... [详细]

蜡笔小新 2024-11-24 12:02:48
format
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30

Lala88童鞋_619

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章