热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SeMITechnologies的搜索引擎开辟了查询数据的新方法

SeMITechnologies正在使用矢量搜索引擎Weaviate构建的内容。SeMI的首席执行官兼联合创始人BobvanLuijt说,它是一种独特的AI优先数据库,使用机器学习
Bob van Luijt,SeMi Technologies,Weaviate

SeMi Technologies SeMi Technologies 首席执行官 Bob van Luijt


公司坐拥大量非结构化数据,并且通常没有能力从中获得太多收益。

现在想象一下有一种方法可以存储数据并且实际上能够向它提出问题,例如,“ABC 公司什么时候与我们签订了第一份合同?” 或“给我看包含蓝天的视频。”

这就是SeMI Technologies正在使用矢量搜索引擎 Weaviate 构建的内容。SeMI 的首席执行官兼联合创始人 Bob van Luijt 说,它是一种独特的 AI 优先数据库,使用机器学习模型输出向量,也称为嵌入,因此得名向量搜索引擎。


他解释说矢量搜索引擎并不新鲜——谷歌搜索是建立在矢量搜索引擎之上的解决方案的一个例子。然而,SeMI 的目标是将这项技术商品化,并拥有一个开源的商业模式,以便任何人都可以使用它。

去年,Van Luijt 创建了一个语义搜索引擎,对 2021 年 Techcrunch 文章进行问答,从而让我的同事 Alex Wilhelm了解了这项技术。


“每个人都可以使用这项技术,我们为那些需要这项技术的公司提供工具和服务,”van Luijt 补充道。“我们不创建或分发实际模型——这是像 Huggingface 或 OpenAI 这样的公司做的事情,或者公司自己制作模型。但是拥有模型是一回事,在生产中使用它们来支持您的搜索和推荐系统是另一回事,而这正是 Weaviate 解决的问题。”

自 2019 年与首席技术官 Etienne Dilocker 和首席运营官 Micha Verhagen 一起创立公司以来,van Luijt 已经看到 SeMI 的技术激发了 100 多个用例,包括 Keenious 或Zencastr等初创公司,他们根据矢量搜索引擎提供的新可能性创建了新业务,以及 Weaviate 提供的结果直接帮助人们的用途,例如医疗领域。

van Luijt 个人最喜欢的一些是他说更“深奥”的,包括人类基因组的矢量化和搜索,整个世界的矢量映射,或所谓的图嵌入,可以很容易地搜索使用 Weaviate,就像在 Meta Researches 的图嵌入上创建的演示SeMI。

SeMI 于 2020 年 8 月从 Zetta Venture Partners 和 ING Ventures 筹集了 120 万美元的种子资金,此后一直受到风险投资公司的关注。从那时起,它的软件被下载了近 750,000 次,每月增长约 30%。Van Luijt 没有具体说明公司的增长指标,但表示下载量与企业许可证和托管服务的销售量相关。此外,对 Weaviate 附加值的使用和理解的激增导致所有增长指标上升,公司耗尽了其种子资金。


尽管种子资金已经消失,但该公司并未积极寻求新的资金。然而,当 SeMI 联合创始人与前 Datarobot 创始人和 New Enterprise Associates (NEA) 的新基金 Cortical Ventures 进行对话时,van Luijt 表示,这些公司向他们展示了他们将如何支持该业务。

“这真的是‘捏我的胳膊让人瞠目结舌’,太棒了,”他补充道。“他们过去所做的一切,支持我们的团队,正是我们正在寻找的,我可以说,虽然非常新鲜,但所有令人惊叹的故事都是真实的。”

这些对话导致 NEA 和 Cortical 共同领导了新一轮 1600 万美元的 A 轮融资。

SeMI 打算将新资金用于招聘美国和欧洲人才,并在其开源社区中加倍投入用于 Weaviate 和矢量搜索。它还将更加关注开源核心的上市和产品,并在机器学习与计算机科学重叠的研究方面迈出第一步。

与此同时,van Luijt 认为,我们正在关注下一波数据库技术浪潮,该浪潮始于 SQL 浪潮,迎来了 Oracle 和 Microsoft 等大赢家,随后是第二波非 SQL 数据库浪潮,其中 MongoDB 等赢家和 Redis。

“我们现在正处于新一代数据库的边缘,那些以人工智能为先的数据库,而 Weaviate 就是一个例子,”他补充道。“我们不仅需要对市场进行有关 Weaviate 的教育,还需要对矢量搜索数据库或 AI 优先数据库进行教育。这是一件非常令人兴奋的事情,因为机器学习带来了一些非常棒的东西。例如,让您的数据库回答数百万甚至数十亿文档的自然语言问题,或者‘理解’数百万张照片或视频包含的内容。”


文章来源:https://techcrunch.com/2022/02/22/semi-technologies-search-engine-data/


推荐阅读
  • 优化SQL Server批量数据插入存储过程的实现
    本文介绍了一种改进的SQL Server存储过程,用于生成批量插入语句。该方法不仅提高了性能,还支持单行和多行模式,适用于SQL Server 2005及以上版本。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • Java 中的 BigDecimal pow()方法,示例 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 本文将介绍由密歇根大学Charles Severance教授主讲的顶级Python入门系列课程,该课程广受好评,被誉为Python学习的最佳选择。通过生动有趣的教学方式,帮助初学者轻松掌握编程基础。 ... [详细]
  • XNA 3.0 游戏编程:从 XML 文件加载数据
    本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件,并通过内容管道加载到游戏中。此外,还会涉及自定义类型读取器和写入器的实现。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 精选30本C# ASP.NET SQL中文PDF电子书合集
    欢迎订阅我们的技术博客,获取更多关于C#、ASP.NET和SQL的最新资讯和资源。 ... [详细]
  • 本文由瀚高PG实验室撰写,详细介绍了如何在PostgreSQL中创建、管理和删除模式。文章涵盖了创建模式的基本命令、public模式的特性、权限设置以及通过角色对象简化操作的方法。 ... [详细]
  •   上一篇博客中我们说到线性回归和逻辑回归之间隐隐约约好像有什么关系,到底是什么关系呢?我们就来探讨一下吧。(这一篇数学推导占了大多数,可能看起来会略有枯燥,但这本身就是一个把之前算法 ... [详细]
  • 中科院学位论文排版指南
    随着毕业季的到来,许多即将毕业的学生开始撰写学位论文。本文介绍了使用LaTeX排版学位论文的方法,特别是针对中国科学院大学研究生学位论文撰写规范指导意见的最新要求。LaTeX以其精确的控制和美观的排版效果成为许多学者的首选。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 基于机器学习的人脸识别系统实现
    本文介绍了一种使用机器学习技术构建人脸识别系统的实践案例。通过结合Python编程语言和深度学习框架,详细展示了从数据预处理到模型训练的完整流程,并提供了代码示例。 ... [详细]
author-avatar
梦蕾AngeL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有