热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SeMITechnologies的搜索引擎开辟了查询数据的新方法

SeMITechnologies正在使用矢量搜索引擎Weaviate构建的内容。SeMI的首席执行官兼联合创始人BobvanLuijt说,它是一种独特的AI优先数据库,使用机器学习
Bob van Luijt,SeMi Technologies,Weaviate

SeMi Technologies SeMi Technologies 首席执行官 Bob van Luijt


公司坐拥大量非结构化数据,并且通常没有能力从中获得太多收益。

现在想象一下有一种方法可以存储数据并且实际上能够向它提出问题,例如,“ABC 公司什么时候与我们签订了第一份合同?” 或“给我看包含蓝天的视频。”

这就是SeMI Technologies正在使用矢量搜索引擎 Weaviate 构建的内容。SeMI 的首席执行官兼联合创始人 Bob van Luijt 说,它是一种独特的 AI 优先数据库,使用机器学习模型输出向量,也称为嵌入,因此得名向量搜索引擎。


他解释说矢量搜索引擎并不新鲜——谷歌搜索是建立在矢量搜索引擎之上的解决方案的一个例子。然而,SeMI 的目标是将这项技术商品化,并拥有一个开源的商业模式,以便任何人都可以使用它。

去年,Van Luijt 创建了一个语义搜索引擎,对 2021 年 Techcrunch 文章进行问答,从而让我的同事 Alex Wilhelm了解了这项技术。


“每个人都可以使用这项技术,我们为那些需要这项技术的公司提供工具和服务,”van Luijt 补充道。“我们不创建或分发实际模型——这是像 Huggingface 或 OpenAI 这样的公司做的事情,或者公司自己制作模型。但是拥有模型是一回事,在生产中使用它们来支持您的搜索和推荐系统是另一回事,而这正是 Weaviate 解决的问题。”

自 2019 年与首席技术官 Etienne Dilocker 和首席运营官 Micha Verhagen 一起创立公司以来,van Luijt 已经看到 SeMI 的技术激发了 100 多个用例,包括 Keenious 或Zencastr等初创公司,他们根据矢量搜索引擎提供的新可能性创建了新业务,以及 Weaviate 提供的结果直接帮助人们的用途,例如医疗领域。

van Luijt 个人最喜欢的一些是他说更“深奥”的,包括人类基因组的矢量化和搜索,整个世界的矢量映射,或所谓的图嵌入,可以很容易地搜索使用 Weaviate,就像在 Meta Researches 的图嵌入上创建的演示SeMI。

SeMI 于 2020 年 8 月从 Zetta Venture Partners 和 ING Ventures 筹集了 120 万美元的种子资金,此后一直受到风险投资公司的关注。从那时起,它的软件被下载了近 750,000 次,每月增长约 30%。Van Luijt 没有具体说明公司的增长指标,但表示下载量与企业许可证和托管服务的销售量相关。此外,对 Weaviate 附加值的使用和理解的激增导致所有增长指标上升,公司耗尽了其种子资金。


尽管种子资金已经消失,但该公司并未积极寻求新的资金。然而,当 SeMI 联合创始人与前 Datarobot 创始人和 New Enterprise Associates (NEA) 的新基金 Cortical Ventures 进行对话时,van Luijt 表示,这些公司向他们展示了他们将如何支持该业务。

“这真的是‘捏我的胳膊让人瞠目结舌’,太棒了,”他补充道。“他们过去所做的一切,支持我们的团队,正是我们正在寻找的,我可以说,虽然非常新鲜,但所有令人惊叹的故事都是真实的。”

这些对话导致 NEA 和 Cortical 共同领导了新一轮 1600 万美元的 A 轮融资。

SeMI 打算将新资金用于招聘美国和欧洲人才,并在其开源社区中加倍投入用于 Weaviate 和矢量搜索。它还将更加关注开源核心的上市和产品,并在机器学习与计算机科学重叠的研究方面迈出第一步。

与此同时,van Luijt 认为,我们正在关注下一波数据库技术浪潮,该浪潮始于 SQL 浪潮,迎来了 Oracle 和 Microsoft 等大赢家,随后是第二波非 SQL 数据库浪潮,其中 MongoDB 等赢家和 Redis。

“我们现在正处于新一代数据库的边缘,那些以人工智能为先的数据库,而 Weaviate 就是一个例子,”他补充道。“我们不仅需要对市场进行有关 Weaviate 的教育,还需要对矢量搜索数据库或 AI 优先数据库进行教育。这是一件非常令人兴奋的事情,因为机器学习带来了一些非常棒的东西。例如,让您的数据库回答数百万甚至数十亿文档的自然语言问题,或者‘理解’数百万张照片或视频包含的内容。”


文章来源:https://techcrunch.com/2022/02/22/semi-technologies-search-engine-data/


推荐阅读
  • 通过Web界面管理Linux日志的解决方案
    本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法,使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境,还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 深入理解T-SQL中的NULL与三值逻辑
    本文探讨了SQL Server中的三值逻辑,解释了谓词计算结果为TRUE、FALSE和UNKNOWN的规则。通过具体示例,详细说明了如何正确处理NULL值,并探讨了在不同约束条件下的行为。 ... [详细]
  • 探讨如何从数据库中按分组获取最大N条记录的方法,并分享新年祝福。本文提供多种解决方案,适用于不同数据库系统,如MySQL、Oracle等。 ... [详细]
  • 本文探讨了2012年4月期间,淘宝在技术架构上的关键数据和发展历程。涵盖了从早期PHP到Java的转型,以及在分布式计算、存储和网络流量管理方面的创新。 ... [详细]
  • 解析SQL查询结果的排序问题及其解决方案
    本文探讨了为什么某些SQL查询返回的数据集未能按预期顺序排列,并提供了详细的解决方案,帮助开发者理解并解决这一常见问题。 ... [详细]
  • 本文探讨了Microsoft OLE DB Provider for SQL Server错误80004005的成因与解决方法,详细分析了SQL Server连接失败的原因,并提供了多个有效的解决方案。 ... [详细]
  • 探索如何使用公共数据集为您的编程项目提供动力。无论您是编程新手还是有经验的开发者,本文将为您提供实用建议和资源,帮助您启动并运行一个创新的数据驱动型项目。 ... [详细]
  • 在尝试用另一台电脑的MySQL文件替换本地D:\xampp\mysql目录后,MySQL服务无法启动。错误提示显示MySQL意外关闭,可能是由于端口冲突、依赖缺失、权限问题或崩溃等原因引起。 ... [详细]
  • 本文详细介绍了在 MySQL、SQL Server 和 Oracle 数据库中如何使用分组和排序功能。涵盖了聚集函数的应用、HAVING 子句的作用以及特定数据库中的独特方法,如 SQL Server 的 ROW_NUMBER() 函数和 Oracle 的相关特性。 ... [详细]
  • 本文详细介绍了 RosPack 类的功能和用法,探讨了其在 ROS 系统中的重要作用。RosPack 类提供了类似于终端命令 rospack 的功能,能够方便地查询和管理 ROS 包的相关信息。 ... [详细]
  • 本文详细介绍了如何查找和更改 MySQL 数据库文件的存放路径,包括不同存储引擎的配置方法以及具体操作步骤。 ... [详细]
  • 探讨如何通过高效的数据库查询和排序策略,优化基于GPS位置信息的附近用户搜索功能,以应对大规模用户数据场景。 ... [详细]
  • 云计算的优势与应用场景
    本文详细探讨了云计算为企业和个人带来的多种优势,包括成本节约、安全性提升、灵活性增强等。同时介绍了云计算的五大核心特点,并结合实际案例进行分析。 ... [详细]
  • 本文探讨了使用C#在SQL Server和Access数据库中批量插入多条数据的性能差异。通过具体代码示例,详细分析了两种数据库的执行效率,并提供了优化建议。 ... [详细]
author-avatar
梦蕾AngeL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有