热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SeMITechnologies的搜索引擎开辟了查询数据的新方法

SeMITechnologies正在使用矢量搜索引擎Weaviate构建的内容。SeMI的首席执行官兼联合创始人BobvanLuijt说,它是一种独特的AI优先数据库,使用机器学习
Bob van Luijt,SeMi Technologies,Weaviate

SeMi Technologies SeMi Technologies 首席执行官 Bob van Luijt


公司坐拥大量非结构化数据,并且通常没有能力从中获得太多收益。

现在想象一下有一种方法可以存储数据并且实际上能够向它提出问题,例如,“ABC 公司什么时候与我们签订了第一份合同?” 或“给我看包含蓝天的视频。”

这就是SeMI Technologies正在使用矢量搜索引擎 Weaviate 构建的内容。SeMI 的首席执行官兼联合创始人 Bob van Luijt 说,它是一种独特的 AI 优先数据库,使用机器学习模型输出向量,也称为嵌入,因此得名向量搜索引擎。


他解释说矢量搜索引擎并不新鲜——谷歌搜索是建立在矢量搜索引擎之上的解决方案的一个例子。然而,SeMI 的目标是将这项技术商品化,并拥有一个开源的商业模式,以便任何人都可以使用它。

去年,Van Luijt 创建了一个语义搜索引擎,对 2021 年 Techcrunch 文章进行问答,从而让我的同事 Alex Wilhelm了解了这项技术。


“每个人都可以使用这项技术,我们为那些需要这项技术的公司提供工具和服务,”van Luijt 补充道。“我们不创建或分发实际模型——这是像 Huggingface 或 OpenAI 这样的公司做的事情,或者公司自己制作模型。但是拥有模型是一回事,在生产中使用它们来支持您的搜索和推荐系统是另一回事,而这正是 Weaviate 解决的问题。”

自 2019 年与首席技术官 Etienne Dilocker 和首席运营官 Micha Verhagen 一起创立公司以来,van Luijt 已经看到 SeMI 的技术激发了 100 多个用例,包括 Keenious 或Zencastr等初创公司,他们根据矢量搜索引擎提供的新可能性创建了新业务,以及 Weaviate 提供的结果直接帮助人们的用途,例如医疗领域。

van Luijt 个人最喜欢的一些是他说更“深奥”的,包括人类基因组的矢量化和搜索,整个世界的矢量映射,或所谓的图嵌入,可以很容易地搜索使用 Weaviate,就像在 Meta Researches 的图嵌入上创建的演示SeMI。

SeMI 于 2020 年 8 月从 Zetta Venture Partners 和 ING Ventures 筹集了 120 万美元的种子资金,此后一直受到风险投资公司的关注。从那时起,它的软件被下载了近 750,000 次,每月增长约 30%。Van Luijt 没有具体说明公司的增长指标,但表示下载量与企业许可证和托管服务的销售量相关。此外,对 Weaviate 附加值的使用和理解的激增导致所有增长指标上升,公司耗尽了其种子资金。


尽管种子资金已经消失,但该公司并未积极寻求新的资金。然而,当 SeMI 联合创始人与前 Datarobot 创始人和 New Enterprise Associates (NEA) 的新基金 Cortical Ventures 进行对话时,van Luijt 表示,这些公司向他们展示了他们将如何支持该业务。

“这真的是‘捏我的胳膊让人瞠目结舌’,太棒了,”他补充道。“他们过去所做的一切,支持我们的团队,正是我们正在寻找的,我可以说,虽然非常新鲜,但所有令人惊叹的故事都是真实的。”

这些对话导致 NEA 和 Cortical 共同领导了新一轮 1600 万美元的 A 轮融资。

SeMI 打算将新资金用于招聘美国和欧洲人才,并在其开源社区中加倍投入用于 Weaviate 和矢量搜索。它还将更加关注开源核心的上市和产品,并在机器学习与计算机科学重叠的研究方面迈出第一步。

与此同时,van Luijt 认为,我们正在关注下一波数据库技术浪潮,该浪潮始于 SQL 浪潮,迎来了 Oracle 和 Microsoft 等大赢家,随后是第二波非 SQL 数据库浪潮,其中 MongoDB 等赢家和 Redis。

“我们现在正处于新一代数据库的边缘,那些以人工智能为先的数据库,而 Weaviate 就是一个例子,”他补充道。“我们不仅需要对市场进行有关 Weaviate 的教育,还需要对矢量搜索数据库或 AI 优先数据库进行教育。这是一件非常令人兴奋的事情,因为机器学习带来了一些非常棒的东西。例如,让您的数据库回答数百万甚至数十亿文档的自然语言问题,或者‘理解’数百万张照片或视频包含的内容。”


文章来源:https://techcrunch.com/2022/02/22/semi-technologies-search-engine-data/


推荐阅读
  • golang常用库:配置文件解析库/管理工具viper使用
    golang常用库:配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库,是由大神SteveFrancia开发,他在google领导着golang的 ... [详细]
  • 本文详细介绍了IBM DB2数据库在大型应用系统中的应用,强调其卓越的可扩展性和多环境支持能力。文章深入分析了DB2在数据利用性、完整性、安全性和恢复性方面的优势,并提供了优化建议以提升其在不同规模应用程序中的表现。 ... [详细]
  • Navicat Premium 15 安装指南及数据库连接配置
    本文详细介绍 Navicat Premium 15 的安装步骤及其对多种数据库(如 MySQL 和 Oracle)的支持,帮助用户顺利完成软件的安装与激活。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文介绍如何使用JPA Criteria API创建带有多个可选参数的动态查询方法。当某些参数为空时,这些参数不会影响最终查询结果。 ... [详细]
  • JavaScript实现表格数据的实时筛选功能
    本文介绍如何使用JavaScript实现对表格数据的实时筛选,帮助开发者提高用户体验。通过简单的代码示例,展示如何根据用户输入的关键字动态过滤表格内容。 ... [详细]
author-avatar
梦蕾AngeL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有