热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

实现搜索历史_如何快速实现精准的个性化搜索服务

简介:用户行为数据如何实时地应用在搜索服务中呢?怎样在1天内就可实现【精准的个性化搜索系统】搭建呢?今天小编将通过【阿里云开放搜索】中的三

简介: 用户行为数据如何实时地应用在搜索服务中呢? 怎样在1天内就可实现【精准的个性化搜索系统】搭建呢? 今天小编将通过【阿里云开放搜索】中的三大“个性化搜索算法模型”给大家详细介绍,希望给予您更多解决思路~

一、个性化排序应用

类目预测

类目预测是开放搜索里基于物品/内容的类目信息改善搜索效果的算法功能
类目预测根据用户的查询词来预测用户想要查询哪个类目的结果,结合排序表达式,可以使得更符合搜索意图的结果排序更靠前基本原理:把历史上搜过的query收集起来,结合query查询之后的点击行为数据,与类目下的物品信息联系起来,使用这些数据来训练模型,由模型来刻画query与类目之间的数据规律。

例如:不同用户搜索“华为”
有些行为意图搜索“配件”,有些意图是搜索“手机”,那根据用户的行为数据就可以通过类目进行判断,从而在排序效果上实现个性化展示;

bf6e6174b26404b101ba84e714a659fa.png

二、个性化搜索引导

搜索中引导--下拉提示

功能介绍
下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query。

例如:不同用户在搜索框输入“包”,下拉提示都是不同的,优先展示该用户搜索过的query,从而增加业务转化的机会;

3163d1c442760ec08cdbd44682d97887.png
ea6f08fafeee0bd568d49ed05d0ea7f1.png

• query生成规则
针对过去N(默认7)天的历史query,结合该query的词权重,召回结果数,历史搜索次数,近一天查询是否有结果等条件,选出一些热门历史查询词,作为下拉提示的候选词。
系统支持两种规则生成候选query:抽取生成和原值保留。抽取生成:使用阿里nlp团队基于海量自然语言训练的分析器,对字段内容进行分词,抽取有意义的term进行组合,得到候选query,这种方式尽量保证生成的候选query能召回对应的文档。原值保留:该规则对字段内容不做分词处理,直接将其作为下拉提示的候选query。• 行业模板
根据不同行业数据特点提供了相应优化模板:通用行业模板,电商行业模板,内容行业模板• 干预功能
对数据源应用文档设置过滤条件;对候选query结果进行干预,包括黑名单和白名单;• 业务报表:
下拉提示进行的数据统计指标包括:核心指标,流量指标,点击指标, 引导搜索指标,Query分析指标,五个维度;
可以衡量下拉提示召回、排序、加购转化、内容丰富度等效果。

搜索前引导-热搜和底纹

• 功能介绍
热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。

768044a6981b36686a1c339a5574e389.png

从用户的角度来看,热搜底纹一般可以满足如下的需求:

  1. 给我推荐一些优质的查询词;
  2. 想知道大家都搜了些什么;
  3. 既想看我感兴趣的内容,又想探索一些兴趣之外的内容;

从运营者的角度,热搜和底纹可以提供这样的价值:

  1. 哪些query被搜得最多,热门query是用户兴趣的风向标,通过分析热门query我们可以把握用户的兴趣走向,对制定运营策略;
  2. 给用户推荐一些优质query;
  3. 给用户推荐热门query,一方面兼顾用户体验,另一方面给部分次热门query增加曝光机会;

• 配置流程

8885a81249137bfed149309069891b42.png

• 业务报表
热搜底纹业务运营报表,可以清晰反映搜索引导结果的点击情况,衡量其召回、排序的效果和质量,再通过系统的评估服务,找到对应的问题原因和解决方案。



推荐阅读
  • 计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述(上篇)
    本文介绍了计算机视觉领域的最新进展,特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点,为读者提供了全面的概述。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 本文主要参考《Python机器学习经典实例》  在介绍凝聚层次聚类之前,我们需要先理解层次聚类(hierarchicalclustering)。层次聚类是一组聚类算法,通过不断地分 ... [详细]
  • NLP篇【01】tfidf与bm25介绍与对比
    上一篇:自然语言处理【NLP】遇上电商——专栏导读下一篇:NLP篇【02】白话Word2vec原理以及层softmax、负采样的实现一、tfidf介 ... [详细]
  • 如何在jieba分词中加自定义词典_常见中文分词包比较
    1jiebajieba.cut方法接受三个输入参数:需要分词的字符串;cut_all参数用来控制是否采用全模式;HMM参数用来控制是否使用HMM模型ji ... [详细]
  • 本文介绍了如何使用Visual Studio Code、Sublime Text等编辑器批量删除MATLAB代码中的注释和空行,同时提供了一些高级技巧以确保代码的整洁。 ... [详细]
  • 拼多多的崛起之路
    随着4G通信技术的发展,互联网产品从PC端转向移动端,图像传输速度更快、更清晰,智能设备的应用提升了用户体验。移动互联网的普及为拼多多的崛起提供了时代背景。 ... [详细]
  • 深入解析国内AEB应用:摄像头和毫米波雷达融合技术的现状与前景
    本文作者程建伟,武汉极目智能技术有限公司CEO,入选武汉市“光谷3551人才计划”。文章详细探讨了国内自动紧急制动(AEB)系统中摄像头与毫米波雷达融合技术的现状及未来前景。通过分析当前技术的应用情况、存在的挑战以及潜在的解决方案,作者指出,随着传感器技术的不断进步和算法优化,AEB系统的性能将大幅提升,为交通安全带来显著改善。 ... [详细]
  • 搜索引擎技术概论(上篇):核心原理与应用分析
    搜索引擎技术概论(上篇)探讨了搜索的基本概念及其核心原理。搜索的本质在于信息检索,即用户通过输入关键词,利用特定的算法从海量数据中快速定位并提供所需信息。本文详细分析了搜索引擎的工作机制及其在实际应用中的表现。 ... [详细]
  • Candyland的糖果公园以其独特的结构吸引了众多喜爱糖果的小朋友。公园内设有多个游览点,每个点不仅景色宜人,还提供免费的糖果。这些游览点通过复杂的路径连接,形成了一棵包含n个节点的树状结构。为了优化游客体验,公园管理团队采用了一种基于树上动态修改的莫队算法,有效提升了糖果发放和游玩项目的管理效率。 ... [详细]
  • 中文分词_中文分词技术小结几大分词引擎的介绍与比较
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了中文分词技术小结几大分词引擎的介绍与比较相关的知识,希望对你有一定的参考价值。笔者想说:觉得英文与中文分词有很大的区别, ... [详细]
  • 上期使用LSTM做短文本分类效果不如CNN,或许有朋友会问什么场景下LSTM能体现出序列性的优势,本期使用双向LSTM-CNNs-CRF实现SequenceLabeling。CRF ... [详细]
  • 高清图解:神经网络、机器学习、数据科学一网打尽
    |导|读BY:AI-Beetle完全图解人工智能、NLP、机器学习、深度学习、大数据!这份备忘单涵盖了上述领域几乎全部的知识点,并使用信息图、脑图等多种可视化方式呈现,设计精美,实 ... [详细]
  •   作为一种编程语言,Python比C#,Java,C和C++更具吸引力。它被称为“胶水语言”,它也被喜欢它的程序员誉为“美丽”的编程语言。从云计算,客户端到物联网终端,Pytho ... [详细]
  • Linux负载均衡LVS(IPVS)
    一、LVS简介LVS是LinuxVirtualServer的简称,也就是Linux虚拟服务器,是一个由章文嵩博士发起的自由软件项目,现在已经是Linux ... [详细]
author-avatar
混迹潘_442
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有