热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ChatwithMilvusNo.2活动回顾

Hello~Milvus的朋友们,想找个机会与Milvus团队和其他的用户一起交流吗?之后我们每周二晚上8点固定与你线上面基,

Hello~ Milvus 的朋友们, 想找个机会与 Milvus 团队和其他的用户一起交流吗?之后我们每周二晚上8点固定与你线上面基,聊聊近似搜索🔍的那些话题!快来与 ZILLIZ 小助手(zilliz-tech)报名下周二的活动吧!

点击链接🔗了解新版本0.7.0有哪些新功能: https://zhuanlan.zhihu.com/p/111034118

 

本周无法参加的朋友可以阅读一下的文字实录, 说不定也有你常遇到的一些问题!

| 文字实录

* 以下文字部分由语音转文字,已经过一些调整让句意可以更清楚,但难免有点错误请读者们包含。

User:

你好我是通过知乎上面了解到Milvus,我们的业务场景大概是这样的:在专利行业里,商标行业他有这种商标的,你要想申请一个专利和商标,他要跟之前的专利和商标进行对比的方式,有的商标和专利它是有图片的,所以说相当于是基于图片对比。

现在专利的对比的方式还是很原始的那种,比如说你这图片里含不含有三角形和看这个原型是什么颜色的,是通过这种标识的方式。然后我了解的咱 Milvus 这个东西主要就是我理解的是这样的,不知道我理解准不准确,针对这种图像的分析、搜索为它的一个应用方向之一,是这样吗?

Milvus:

对,是的。因为 Milvus 是一个向量搜索引擎,那么它主要是解决海量向量的数据的一个比对的问题。那么这个向量数据从哪里来的?它可以是从这种图片来,它可以通过图片,比如说配合 VGG 的模型,抽象成一些向量,然后去进行搜索。

其实在我们的 Milvus.io 的网站上面,在比较靠近底部的地方,我们有个 demo 的区域,那么它其实有一个 demo 是作为图片搜索的;在上面我们下载一些开源开放的一些图片及差不多100多万张图片,然后用户可以给出一张图片去搜和这张图片相似的一个图片,他用的是一个 VGG 的一个模型。

你刚才提到的专利的商标申请,因为你提到说有的是有图片,我理解是你主要关注的是关于商标图像类的相似度的这种分析是吗?

 

User :

 

Milvus:

其实向量搜索引擎用在图片上面,怎么讲呢?因为像不像它可能是一个比较主观的一个感受,我不知道它是不是有一些规则去判断像不像,这个是我比较好奇的一个部分。

 

User :

我没有深入的涉及但大概是这样,我们比如说拿餐饮-肯德基是 KFC,比如说你如果说想申请一个,你也做一家餐饮公司,也申请一个商标,它一个图像,你把 KFC 一字体变成起来,跟自己变相,但你总体的构图设计的整个颜色可能都以这样一致的,国家商标局肯定不允许通过的。如果说是世界级商标的话,你还要像国外的商标专利的机构去申请,他也不会通过的。以前我知道它的默认的方式是给一个图片标志,很多的标识,从颜色从包含的图形,从文字字体,它是用这种方式,相当于是把一个图片有很多标识,而不是而不是像 Milvus 这样完全把一个图片给数据化了,然后用另外一张图片跟他对比。我觉得这种方式肯定是无论从效率上也好,还是从相似度来说和结果的准确率的话,肯定是比以前那种标识方式是是好很多的。

 

User :

其实我还有另一个问题,我主要是想了解一下,因为 Milvus 这个是一个开源的东西,跟我们上海这家公司是一个什么状态?我们(Milvus)现在一直在发布不同的版本,然后主推到市场之后,可能有针对的具象的最终的目标客户?但也有可能比如说针对一些伙伴之类的?我主要想了解这一块,从整体规划这样说,还有跟我们整个 Github上的开源社区、我们公司之间的关系,这一块大概是个什么情况?

 

Milvus:

好的,这个问题非常好,我先补充回答一下,刚才关于商标的一个问题,因为我们现在存的可能是单纯的是一个向量数据,(你这个图形本身向量化之后的结果),但是在未来的版本当中,我们会加入一些属性结构化的数据,就像你刚才说的字体颜色这些可以被结构化描述的东西,我们也会把属性加在里面。这样的话去做检索的时候,我们会允许用户同时使用属性和向量,去从这种结构化和非结构化混合的方式去做一个检索,就是提高一些我们检索的灵活度,在你刚才描述的场景当中,我觉得可能会更好。因为结构化的东西他比较标准,然后就非结构化的东西,像不像这件事可能比较感性,两边结合起来,我觉得可能效果是会更好。

然后再回到说我们这个项目的一些当前的状况是这样的,其实 Milvus 这个项目它是一个完全开源的项目,你可以看到我们现在所有的 Milvus 的核心的代码都是在 Github 上面开源的。并没有分出一个说什么这是一个社区版,那是一个企业版,我们并没有这样做,然后在 Milvus 这一块我们以后也不想这样做,因为它是一个向量搜索引擎。

它主要服务的是一些这种 AI 类的场景,就像图片搜索、视频搜索、推荐系统或者自然语言处理的这些场景。

现在这一块其实主要的大家可能都在用faiss这样的一些底层的算法库,那么 Millvus 是想为大家提供更多系统级别的服务,在那些算法库的层面上,我们当然也会做一些工程化的优化,更多的可能在应用性上面帮助大家去管理海量向量数据。

因为这一块其实有几家现在都开始在做,但是并没有做的特别成熟的一个,特别是因为这块比较新,所以大家都在做,那有一些可能做的好一点,有的可能做的更早期一点,但是并没有说哪一家可以作为一个标准,或者大多数人都用这样一个方案,所以基于这样一种考虑,我们也是希望通过开源的方式,能够把 Milvus 的项目的用户的知名度或者用户基数都能够做到比较理想的状态。

我们上次在研讨当中也提到,像 Milvus 的话,这个项目现在是正在加入 LF AI,就是Linux 基金会旗下有一个 AI 的子基金会。那么我们 Milvus 的项目会作为一个孵化项目,加入到 LF AI 当中,所以 Milvus 加入基金会的结果就是 Milvus 项目它的商标什么都会变得更加的中立,会变得更加的开放。

我们是希望吸引更多的人来使用 Milvus 这个向量搜索引擎,所以我们是非常的欢迎大家来使用。然后大家如果说在使用过程当中发现一些问题,那么把你们的问题和一些需求都可以在 Github 上面反馈给我们,我们都会去综合看大家都有些什么共同的东西,然后去做有针对性的一些开发。包括如果大家说在使用的过程当中,如果产生了一些代码,觉得可以贡献回来的,那就更加欢迎。

我们作为一个基金会孵化项目的话,接下来一个阶段就是要成为一个毕业项目。外部的合作贡献者都是一些项目从孵化到毕业的一个评判的标准,所以 Milvus 项目以后都会是一个非常中立的一个开源项目,然后我们本身也是希望它能够做成向量搜索领域当中用户使用范围最广、用户基数最大的一个项目。所以我们是希望越来越多的人能够加入到社区当中。

 

第二位参会者与我们讨论了多维向量检索,结构化属性过滤等功能的设计思路。应参会者的要求,此部分内容无法作为文字发出。欢迎大家今后参加线上讨论会,获得更多信息!

 

| 欢迎加入 Milvus 社区

github.com/milvus-io/milvus | 源码

milvus.io | 官网

milvusio.slack.com | Slack 社区

zhihu.com/org/zilliz-11/columns | 知乎

zilliz.blog.csdn.net | CSDN 博客


推荐阅读
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 如何用R语言做词云图,以某部网络小说为例
    作者:horoR语言中文社区专栏作者知乎ID:https:www.zhihu.compeoplelin-jia-chuan前言一开始,我在 ... [详细]
  • 1.安装Deepin-wine(1)下载deepin-wine环境克隆(gitclonehttps:github.comwszqkzq ... [详细]
  • ansible 建 kubernetes 证书签名请求_Java中的微信支付(2):API V3 微信平台证书的获取与刷新...
    1.前言在Java中的微信支付(1):APIV3版本签名详解一文中胖哥讲解了微信支付V3版本API的签名,当我方(你自己的服务器)请求微信支付服务器时需 ... [详细]
  • AI玩微信跳一跳的正确姿势:跳一跳AutoJump算法详解
    最近,微信小游戏跳一跳可以说是火遍了全国,从小孩子到大孩子仿佛每一个人都在刷跳一跳,作为无(zhi)所 ... [详细]
  • 作为机器学习最重要的一个分支,近年来深度学习(DeepLearning)发展势头迅猛,借助庞大的数据 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • 本文介绍了一些好用的搜索引擎的替代品,包括网盘搜索工具、百度网盘搜索引擎等。同时还介绍了一些笑话大全、GIF笑话图片、动态图等资源的搜索引擎。此外,还推荐了一些迅雷快传搜索和360云盘资源搜索的网盘搜索引擎。 ... [详细]
author-avatar
小七
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有