热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

视频搜索会成为新的趋势吗?

以前回到过类似一个问题,先说结论,就像其他答主说的一样,趋势非常明显。听说抖音的搜索UV占比已经超过30%了,虽然其中应该有不少用户是去看抖音热搜,类似微博热榜的行为逻辑,还不能和

以前回到过类似一个问题,先说结论,就像其他答主说的一样,趋势非常明显。听说抖音的搜索UV占比已经超过30%了,虽然其中应该有不少用户是去看抖音热搜,类似微博热榜的行为逻辑,还不能和真正的搜索引擎相提并论。但从UV量级来看已经很夸张了。

其他方面大家讲了很多,和大家分享下视频搜索命令的更具体的产品和技术挑战。这两年因为工作的关系,我们自己的业务以直播为主,从直播中迭代出电商讲解短视频,从产品和技术上踩了不少坑。

首先,内容在哪里,搜索就在哪里,而内容视频化后,有两个值得重视的问题。



  1. 大部分视频内容生态,都是围绕推荐场景,创作者都很少考虑搜索的特点,即结构化特别弱,即SEO远远不足。对于原先以图文内容物料类型为主的搜索技术提出了新的挑战。



  2. 搜索场景中,用户侧获取信息的效率变的更重要了,而视频流式的获取信息方式是线性时间序列,反而低效。



举几个例子:

对于电商商品来讲,商品标题是非常重要的,下面两张图片一个是我们蘑菇街的商品图,一个是淘宝ifashion的。由于我们大部分的商品都是来自于直播之后的讲解视频,有很多商品的标题就非常简单,更详细的信息藏在的视频流里面。而商品标题对于搜索非常重要,就会对召回产生比较大的影响。这就导致用户搜一些搭配,明明有非常优质的讲解,但是经常搜不出来。

图片

图片

再看下抖音的搜索,举例抖音是因为大部分抖音的视频是没有封面的,而且泛娱乐、泛品类的搜索场景,视频封面能起到的作用非常有限。因此在产品设计上,只能尽快的让搜到的视频自动播放起来,就需要采用这种单列横条式的下拉设计,无法使用双列瀑布流(一屏四个视频动起来会让用户很懵逼)。

图片

对于搜索算法,比如我们电商场景,天然适合多模态学习,用户在接受内容平台的教育后,搜索用词上也表现出更内容化的搜索倾向,比如我们top query中会有很多梨型身材怎么搭、野餐风等等,由于主播本身都是网红,非常熟悉用户的需求场景和网络用语,在讲解过程会大量的穿插着类似的内容,且表达非常口语化,让原先从标题、属性、tag中抽取词用户召回策略表现不好。

比如服装中的穿搭、适合什么场合穿,都必须能够有效的从视频中结构化出来,再对query侧做较好的用户理解,才能够比较好的满足用户体验。

总而言之,该场景非常适合多模态。实践中,一开始我们比较关注语音转文本。ASR技术比较成熟,虽然主播口语化比较严重,和网易那边合作做了几版修正,识别效果还不错。增加ASR TEXT后,召回明显扩大,相关性下降的厉害,主要原因是讲解过程中主播个人发挥比较随性。下一步增加了图片,由于视频流处理起来比较费资源,我们将视频取关键帧得到图片再处理,大概的方案架构如下。

图片

多模态的实际调参过程比较痛苦,目前还远未达到预期的目标,但已经对搜索体验帮助很大。

除了技术上,产品本身也有很多值得创新的部分。商品视频化后,约等于详情页视频化,那么原先基于图文为主的视频化设计方案就不再使用。手机屏幕空间有限,做了各种尝试,目前主要留下了下图中的结构:

图片

在搜索结果页,由于同质化的内容难以区分,很多用户应该有感觉,搜索结果页的第一条很多时候不如被推荐到的好。告诉用户这条视频符合搜索预期就变的比较重要,除了产品样式上的设计,针对视频做精华片段提取,然后做自动播放,也值得尝试。

总而言之,在实践的过程发现挑战很大。而我们的业务只是在垂直的电商领域,相信泛内容平台的搜索挑战更大。如果大家是youtube重度用户,应该有所体验它的搜索其实也做得一般,经常会有关注和推荐的内容质量很高,但是搜不到。

再一次,任重而道远!

如果觉得有用,就请分享到朋友圈吧!

对白的算法屋

一位本科创业赚数百万的清华小哥哥,BAT算法工程师。日常分享AI前沿算法、创业心得和人生感悟。偶尔逗比,一直正能量! 关键词:机器学习、深度学习、推荐系统、自然语言处理

41篇原创内容

公众号

图片

你好,我是对白,清华计算机硕士毕业,现大厂算法工程师,拿过8家大厂算法岗SSP offer(含特殊计划),薪资40+W-80+W不等。

本科独立创业五年,两家公司创始人,拿过三百多万元融资(已到账),项目入选南京321高层次创业人才引进计划。创业做过无人机、机器人和互联网教育,保研清华后退居股东。

我每周至少更新三篇原创,分享人工智能前沿算法、创业心得和人生感悟。我正在努力实现人生中的第二个小目标,上方关注后可以加我微信交流****。

图片



推荐阅读
  • 【跨越鸿沟】学术界与工业界的GAP有多大?
    来自:美团技术团队2020年7月31日,由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV2020 ... [详细]
  • 图灵测试是什么?为什么AlphaGo那么牛却过不了?
    导读:本文将介绍人工智能的检测手段——图灵测试。作者:杜振东涂铭来源:大数据DT(ID:hzdashuju&# ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 早晨七点半。北京初秋的凉风叫醒了住在望京西的你,睁开眼睛,一想到又要为人类的信息化事业贡献满满的正能量,你不禁哼唱起那句“早晨起来 ... [详细]
  • 深度学习_机器学习 vs 深度学习到底有啥区别,为什么更多人选择机器学习
    本文由编程笔记#小编为大家整理,主要介绍了机器学习vs深度学习到底有啥区别,为什么更多人选择机器学习相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 世界移动通信大会上,IBM宣布要举办一场开发竞赛,用于推广IBMWatson认知计算平台上的移动客户和业务APP。\u0026#xD;\n比赛的获胜者将 ... [详细]
author-avatar
孜雪颖2000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有