热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Elastic8.0:开启速度、规模、相关性和简单的新时代

转载:Elastic8.0:开启速度、规模、相关性和简单的新时代我们很高兴地宣布Elastic8.0的正式发布,随着Elasticsea

转载:Elastic 8.0:开启速度、规模、相关性和简单的新时代

我们很高兴地宣布 Elastic 8.0 的正式发布,随着Elasticsearch的向量检索功能的增强、对 NLP 的原生支持、越来越简化的数据打通,以及精简的安全体验,Elastic 8.0 迎来了一个速度、规模、相关性和简单的新时代。

Elastic Stack 8.0 introduction

Elastic Stack 8.0 introduction_哔哩哔哩_bilibili

无论是将人和团队与重要的内容联系起来、保持关键任务的应用和基础设施在线,还是保护整个数字生态系统免受日益复杂的网络威胁,Elastic 8.0都为下一代搜索驱动的解决方案奠定了基础,帮助每个人达到新的成功水平。

准备好开始了吗?Elastic 8.0 现在可以在 Elastic Cloud 上使用--这是唯一一个包含最新版本中所有新功能的 Elasticsearch 托管产品。


速度、规模和相关性:新的开端,但初心不变

每一个结束意味着一个新的开始。当我们开始新的一年时(2021年再见,2022年你好)--我们也开始进入一个速度、规模和相关性的 Elastic 8.0 新时代。

我们的客户和社区都了解,Elastic 始终奉行对速度、规模和相关性的承诺。每一个 Elastic 版本都有增强和优化,以确保 Elasticsearch 是最快速、最易扩展、最强大的搜索引擎。

事实上,在过去的三年里,我们在以下方面取得了巨大的进步:减少内存的使用(允许每个节点管理更多的数据),减少查询成本(尤其是对大型部署的影响),并引入一些全新的功能来提高相关性。

例如,随着 7.x 版本的发布,我们提高了日期柱状图和搜索聚合的速度、增强了页面缓存的性能、并创建了一个新的“预过滤”搜索阶段。此外,我们通过减少内存堆栈,完全支持 ARM 架构,引入新的方法来减少存储,使我们的客户能够通过新的冻结层和可搜索快照轻松地将计算与存储分离,从而降低了资源需求。

对于我们来说,对 Elastic Stack 做无限优化最赞的一点就在于,无论您如何选择将您的数据用于工作,这些增强功能本质上都能够帮助您以速度和规模进行搜索、解决和成功——无需额外的工作。


用原生向量检索提高搜索的相关性

Elastic 8.0 带来了一整套原生的向量检索功能,从而赋能客户和其员工能够使用自己的语言和文字进行搜索并获得高度相关的结果。

在过去的两年里,我们一直在努力使 Elasticsearch 成为进行向量检索的好地方。早在 Elasticsearch 7.0 发布时,我们就为高维向量引入了字段类型。在 Elasticsearch 7.3 和 Elasticsearch 7.4 中,我们引入了对向量相似性函数的支持。这些早期版本展示了将向量检索技术引入 Elasticsearch 生态系统的前景。我们很高兴地看到我们的客户和社区热切地将它们用于广泛的案例中。

今天,在 Elasticsearch 8.0中,我们把对自然语言处理(NLP)模型的本地支持直接引入 Elasticsearch,让向量搜索更加实用。此外,Elasticsearch 8.0 还包括对 ANN 搜索的原生支持--使基于向量的查询与基于向量的文档库进行快速、大规模的比较成为可能


用NLP的力量开辟一个新的分析世界

Elasticsearch 一直是做 NLP 的好地方,但之前它需要在 Elasticsearch 之外做一些处理,或者编写一些相当复杂的插件。在8.0版本中,用户将可以直接在 Elasticsearch 中进行命名实体识别、情感分析、文本分类等,而不需要额外的组件或代码。在 Elasticsearch 内部计算和创建向量,不仅在横向可扩展性方面是一个 "胜利"(通过在服务器集群中分布计算)--这一变化也为 Elasticsearch 用户节省了大量的时间和精力。

Elastic Stack 8.0 介绍 2

Elastic Stack 8.0 介绍 2_哔哩哔哩_bilibili

在 Elastic 8.0中,用户可以直接在 Elasticsearch 中使用 PyTorch 机器学习模型(如 BERT),并在 Elasticsearch 中使用这些模型进行推理。这些模型可以是你自己的自定义模型,也可以是向社区发布的模型,如 Hugging Face。

通过让用户直接在 Elasticsearch 中进行推理,比以往任何时候都更容易将现代 NLP 的力量整合到搜索应用和体验中(想想看:不需要写代码哦!),本质上更有效率(感谢 Elasticsearch 的分布式计算能力),而且 NLP 本身变得更快,因为你不需要将数据转移到一个单独的进程或系统中。


快速搜索,规模搜索

鉴于 Elastic 8.0 是基于 Lucene 9.0 的,那些利用现代 NLP 的搜索体验,由于对 ANN 的(新)原生支持,可以做到更加快速和规模化。ANN 使快速有效地对比基于向量的查询和基于向量的文档语料库(无论是小的、大的还是巨大的语料库)成为可能。

Elastic Stack 8.0 介绍 3

Elastic Stack 8.0 介绍 3_哔哩哔哩_bilibili


想想看,这仅仅是个开始......

总之,通过对现代 NLP 模型的本地支持和对ANN搜索的本地支持,使得 Elastic 8.0 为我们的客户和社区释放了向量检索的力量。

Elastic Stack 8.0 介绍 4

Elastic Stack 8.0 介绍 4_哔哩哔哩_bilibili

未来,由搜索驱动的解决方案(如Elastic Enterprise Search)将使利用向量检索的强大能力变得非常简单。在这个例子中,用户的搜索词不需要与最佳结果完全匹配。向量检索能够 "连接这些点",并轻松地浮现出最相关的结果。


简单的事情应该简单化

通过两个新 AWS 集成来简化云原生观察能力

在过去的几个版本中,我们简化了从任何来源获取任何类型的数据到 Elastic Stack 的过程。随着 Elastic 8.0 的发布,我们进一步扩大了云原生集成,有两个新的 AWS 集成,即:一个新的 AWS Lambda 应用程序集成和一个新的 Amazon S3 Storage Lens 集成。

新的 AWS Lambda 应用发布在AWS无服务器应用库(SAR)中,使用户能够简化他们的架构并简化数据摄取进程,而不需要支付配置虚拟机或安装数据传输器的开销。简单地说,用户现在只需在 AWS 控制台内点击几下,就能将日志从 Amazon S3 摄取到他们的 Elastic Cloud 部署中。

通过 Elastic 在12月首次宣布的 Amazon S3 Storage Lens 集成,用户可以轻松地将 Storage Lens 指标运送到他们的 Elastic Cloud 部署,使用 Elasticsearch 强大的搜索和分析功能以及 Kibana 强大的仪表盘功能来优化 Amazon S3 使用成本,在确保数据保护效率的基础上,监控用户活动趋势。另外,现在你可以通过 AWS Marketplace 注册,轻松开始使用 AWS 上的 Elastic Cloud 的免费试用。

通过简化的堆栈安全保护你的数据免受未经授权的访问

适当的安全从来没有像今天这样重要。虽然安全功能多年来一直是免费的并内嵌在 Elastic Stack 中,但我们仍旧进一步简化了配置安全所需的步骤——因为我们相信,任何集群都不应该在没有保护的情况下运行。在 Elastic 8.0 中,对于自我管理的集群,现在默认启用安全功能。这确保了数据、网络和用户在 Elastic Stack 中的安全,防止数据泄露和未经授权的访问。通过产品内的协助,如自动生成的token和证书,我们已经精简和简化了这一过程,以节省时间和精力,使所有人都能获得安全。

而且,如果你已经在使用(或准备尝试)Elastic Cloud,请放心,安全和完全基于角色的访问控制始终是启用的。


推荐阅读
  • 在拉斯维加斯举行的Interop 2011大会上,Bitcurrent的Alistair Croll发表了一场主题为“如何以云计算的视角进行思考”的演讲。该演讲深入探讨了传统IT思维与云计算思维之间的差异,并提出了在云计算环境下应具备的新思维方式。Croll强调了灵活性、可扩展性和成本效益等关键要素,以及如何通过这些要素来优化企业IT架构和运营。 ... [详细]
  • 「驭龙」开源主机入侵检测系统了解一下
    「驭龙」开源主机入侵检测系统了解一下 ... [详细]
  • Java高并发与多线程(二):线程的实现方式详解
    本文将深入探讨Java中线程的三种主要实现方式,包括继承Thread类、实现Runnable接口和实现Callable接口,并分析它们之间的异同及其应用场景。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • B站服务器故障影响豆瓣评分?别担心,阿里巴巴架构师分享预防策略与技术方案
    13日晚上,在视频观看高峰时段,B站出现了服务器故障,引发网友在各大平台上的广泛吐槽。这一事件导致了连锁反应,大量用户纷纷涌入A站、豆瓣和晋江等平台,给这些网站带来了突如其来的流量压力。为了防止类似问题的发生,阿里巴巴架构师分享了一系列预防策略和技术方案,包括负载均衡、弹性伸缩和容灾备份等措施,以确保系统的稳定性和可靠性。 ... [详细]
  • 2021年Java开发实战:当前时间戳转换方法详解与实用网址推荐
    在当前的就业市场中,金九银十过后,金三银四也即将到来。本文将分享一些实用的面试技巧和题目,特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验,并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法,并推荐了一些实用的在线资源,帮助读者更好地应对技术面试。 ... [详细]
  • 近年来,BPM(业务流程管理)系统在国内市场逐渐普及,多家厂商在这一领域崭露头角。本文将对当前主要的BPM厂商进行概述,并分析其各自的优势。目前,市场上较为成熟的BPM产品主要分为两类:一类是综合型厂商,如IBM和SAP,这些企业在整体解决方案方面具有明显优势;另一类则是专注于BPM领域的专业厂商,它们在特定行业或应用场景中表现出色。通过对比分析,本文旨在为企业选择合适的BPM系统提供参考。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • grafana,9,1,1,发布,系统,指标, ... [详细]
  • 本文详细介绍了在天正CAD中如何调整和修改尺寸标注的方法,包括改变标注数字大小、修改文字样式、调整标注比例等实用技巧。 ... [详细]
  • 本文详细介绍了视高视频会议系统的音频、数据协作、会议交互以及协同办公功能,并探讨了其在实际应用中的优势。系统支持多种语音编解码技术,提供稳定的语音通信;数据协作功能包括远程电子白板、屏幕共享等;会议交互设计人性化,提升会议效率;协同办公模块则进一步增强了系统的实用性和扩展性。 ... [详细]
  • 外观模式:为子系统中的一系列接口提供一个统一的访问入口,通过定义一个高层次的接口,使子系统的使用变得更加简便和高效。该模式特别适用于那些需要简化复杂子系统交互的场景,能够显著提升代码的可复用性和可维护性。对于具备一定面向对象编程基础的开发者来说,掌握外观模式将有助于更好地组织和管理复杂的软件架构。 ... [详细]
  • 本文通过思维导图的形式,深入解析了大型网站技术架构的核心原理与实际案例。首先,探讨了大型网站架构的演化过程,从单体应用到分布式系统的转变,以及各阶段的关键技术和挑战。接着,详细分析了常见的大型网站架构模式,包括负载均衡、缓存机制、数据库设计等,并结合具体案例进行说明。这些内容不仅有助于理解大型网站的技术实现,还能为实际项目提供宝贵的参考。 ... [详细]
  • Juval Löwy主张,每个类都应被视为服务,这并非是为了让服务无处不在,而是因为微服务是经过深思熟虑后系统分解的自然结果。在他的设计和构建的系统中,这种理念有助于提高模块化、可维护性和扩展性。通过将每个类视为独立的服务,系统能够更好地应对复杂性,实现更灵活的部署和更高的性能。 ... [详细]
author-avatar
白羊蓝色雨线
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有