热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SeMITechnologies的搜索引擎开辟了查询数据的新方法

SeMITechnologies正在使用矢量搜索引擎Weaviate构建的内容。SeMI的首席执行官兼联合创始人BobvanLuijt说,它是一种独特的AI优先数据库,使用机器学习
Bob van Luijt,SeMi Technologies,Weaviate

SeMi Technologies SeMi Technologies 首席执行官 Bob van Luijt


公司坐拥大量非结构化数据,并且通常没有能力从中获得太多收益。

现在想象一下有一种方法可以存储数据并且实际上能够向它提出问题,例如,“ABC 公司什么时候与我们签订了第一份合同?” 或“给我看包含蓝天的视频。”

这就是SeMI Technologies正在使用矢量搜索引擎 Weaviate 构建的内容。SeMI 的首席执行官兼联合创始人 Bob van Luijt 说,它是一种独特的 AI 优先数据库,使用机器学习模型输出向量,也称为嵌入,因此得名向量搜索引擎。


他解释说矢量搜索引擎并不新鲜——谷歌搜索是建立在矢量搜索引擎之上的解决方案的一个例子。然而,SeMI 的目标是将这项技术商品化,并拥有一个开源的商业模式,以便任何人都可以使用它。

去年,Van Luijt 创建了一个语义搜索引擎,对 2021 年 Techcrunch 文章进行问答,从而让我的同事 Alex Wilhelm了解了这项技术。


“每个人都可以使用这项技术,我们为那些需要这项技术的公司提供工具和服务,”van Luijt 补充道。“我们不创建或分发实际模型——这是像 Huggingface 或 OpenAI 这样的公司做的事情,或者公司自己制作模型。但是拥有模型是一回事,在生产中使用它们来支持您的搜索和推荐系统是另一回事,而这正是 Weaviate 解决的问题。”

自 2019 年与首席技术官 Etienne Dilocker 和首席运营官 Micha Verhagen 一起创立公司以来,van Luijt 已经看到 SeMI 的技术激发了 100 多个用例,包括 Keenious 或Zencastr等初创公司,他们根据矢量搜索引擎提供的新可能性创建了新业务,以及 Weaviate 提供的结果直接帮助人们的用途,例如医疗领域。

van Luijt 个人最喜欢的一些是他说更“深奥”的,包括人类基因组的矢量化和搜索,整个世界的矢量映射,或所谓的图嵌入,可以很容易地搜索使用 Weaviate,就像在 Meta Researches 的图嵌入上创建的演示SeMI。

SeMI 于 2020 年 8 月从 Zetta Venture Partners 和 ING Ventures 筹集了 120 万美元的种子资金,此后一直受到风险投资公司的关注。从那时起,它的软件被下载了近 750,000 次,每月增长约 30%。Van Luijt 没有具体说明公司的增长指标,但表示下载量与企业许可证和托管服务的销售量相关。此外,对 Weaviate 附加值的使用和理解的激增导致所有增长指标上升,公司耗尽了其种子资金。


尽管种子资金已经消失,但该公司并未积极寻求新的资金。然而,当 SeMI 联合创始人与前 Datarobot 创始人和 New Enterprise Associates (NEA) 的新基金 Cortical Ventures 进行对话时,van Luijt 表示,这些公司向他们展示了他们将如何支持该业务。

“这真的是‘捏我的胳膊让人瞠目结舌’,太棒了,”他补充道。“他们过去所做的一切,支持我们的团队,正是我们正在寻找的,我可以说,虽然非常新鲜,但所有令人惊叹的故事都是真实的。”

这些对话导致 NEA 和 Cortical 共同领导了新一轮 1600 万美元的 A 轮融资。

SeMI 打算将新资金用于招聘美国和欧洲人才,并在其开源社区中加倍投入用于 Weaviate 和矢量搜索。它还将更加关注开源核心的上市和产品,并在机器学习与计算机科学重叠的研究方面迈出第一步。

与此同时,van Luijt 认为,我们正在关注下一波数据库技术浪潮,该浪潮始于 SQL 浪潮,迎来了 Oracle 和 Microsoft 等大赢家,随后是第二波非 SQL 数据库浪潮,其中 MongoDB 等赢家和 Redis。

“我们现在正处于新一代数据库的边缘,那些以人工智能为先的数据库,而 Weaviate 就是一个例子,”他补充道。“我们不仅需要对市场进行有关 Weaviate 的教育,还需要对矢量搜索数据库或 AI 优先数据库进行教育。这是一件非常令人兴奋的事情,因为机器学习带来了一些非常棒的东西。例如,让您的数据库回答数百万甚至数十亿文档的自然语言问题,或者‘理解’数百万张照片或视频包含的内容。”


文章来源:https://techcrunch.com/2022/02/22/semi-technologies-search-engine-data/


推荐阅读
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • binlog2sql,你该知道的数据恢复工具
    binlog2sql,你该知道的数据恢复工具 ... [详细]
  • 本文探讨了如何在PHP与MySQL环境中实现高效的分页查询,包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]
  • 本文详细探讨了BCTF竞赛中窃密木马题目的解题策略,重点分析了该题目在漏洞挖掘与利用方面的技巧。 ... [详细]
  • 本文介绍了MySQL窗口函数的基本概念、应用场景及常见函数的使用方法。窗口函数在处理复杂查询时非常有用,例如计算每个用户的订单排名、环比增长率、以及动态聚合等。 ... [详细]
  • 1、编写一个Java程序在屏幕上输出“你好!”。programmenameHelloworld.javapublicclassHelloworld{publicst ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • 解决ADODB连接Access时出现80004005错误的方法
    本文详细介绍了如何解决在使用ADODB连接Access数据库时遇到的80004005错误,包括错误原因分析和具体的解决步骤。 ... [详细]
  • Hibernate全自动全映射ORM框架,旨在消除sql,是一个持久层的ORM框架1)、基础概念DAO(DataAccessorOb ... [详细]
  • 本文详细介绍了 Redis 中的主要数据类型,包括 String、Hash、List、Set、ZSet、Geo 和 HyperLogLog,并提供了每种类型的基本操作命令和应用场景。 ... [详细]
  • 本文详细解析了MySQL中常见的几种错误,并提供了具体的解决方法,帮助开发者快速定位和解决问题。 ... [详细]
  • 本文详细介绍了如何在最新版本的Xcode中重命名iOS项目,包括项目名称、应用名称及相关的文件夹和配置文件。通过本文,开发者可以轻松完成项目的重命名工作。 ... [详细]
  • MySQL InnoDB 存储引擎索引机制详解
    本文深入探讨了MySQL InnoDB存储引擎中的索引技术,包括索引的基本概念、数据结构与算法、B+树的特性及其在数据库中的应用,以及索引优化策略。 ... [详细]
  • 本文探讨了在SQL Server中处理几何类型列时遇到的INTERSECT操作限制,并提供了解决方案,包括通过转换数据类型和使用额外表结构的方法。 ... [详细]
  • 如何高效解决Android应用ANR问题?
    本文介绍了ANR(应用程序无响应)的基本概念、常见原因及其解决方案,并提供了实用的工具和技巧帮助开发者快速定位和解决ANR问题,提高应用的用户体验。 ... [详细]
author-avatar
梦蕾AngeL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有