简介: 用户行为数据如何实时地应用在搜索服务中呢? 怎样在1天内就可实现【精准的个性化搜索系统】搭建呢? 今天小编将通过【阿里云开放搜索】中的三大“个性化搜索算法模型”给大家详细介绍,希望给予您更多解决思路~
一、个性化排序应用类目预测
类目预测是开放搜索里基于物品/内容的类目信息改善搜索效果的算法功能。
类目预测根据用户的查询词来预测用户想要查询哪个类目的结果,结合排序表达式,可以使得更符合搜索意图的结果排序更靠前基本原理:把历史上搜过的query收集起来,结合query查询之后的点击行为数据,与类目下的物品信息联系起来,使用这些数据来训练模型,由模型来刻画query与类目之间的数据规律。
例如:不同用户搜索“华为”
有些行为意图搜索“配件”,有些意图是搜索“手机”,那根据用户的行为数据就可以通过类目进行判断,从而在排序效果上实现个性化展示;
二、个性化搜索引导搜索中引导--下拉提示
• 功能介绍
下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query。
例如:不同用户在搜索框输入“包”,下拉提示都是不同的,优先展示该用户搜索过的query,从而增加业务转化的机会;
• query生成规则
针对过去N(默认7)天的历史query,结合该query的词权重,召回结果数,历史搜索次数,近一天查询是否有结果等条件,选出一些热门历史查询词,作为下拉提示的候选词。
系统支持两种规则生成候选query:抽取生成和原值保留。抽取生成:使用阿里nlp团队基于海量自然语言训练的分析器,对字段内容进行分词,抽取有意义的term进行组合,得到候选query,这种方式尽量保证生成的候选query能召回对应的文档。原值保留:该规则对字段内容不做分词处理,直接将其作为下拉提示的候选query。• 行业模板
根据不同行业数据特点提供了相应优化模板:通用行业模板,电商行业模板,内容行业模板• 干预功能
对数据源应用文档设置过滤条件;对候选query结果进行干预,包括黑名单和白名单;• 业务报表:
下拉提示进行的数据统计指标包括:核心指标,流量指标,点击指标, 引导搜索指标,Query分析指标,五个维度;
可以衡量下拉提示召回、排序、加购转化、内容丰富度等效果。
搜索前引导-热搜和底纹
• 功能介绍
热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。
从用户的角度来看,热搜底纹一般可以满足如下的需求:
- 给我推荐一些优质的查询词;
- 想知道大家都搜了些什么;
- 既想看我感兴趣的内容,又想探索一些兴趣之外的内容;
从运营者的角度,热搜和底纹可以提供这样的价值:
- 哪些query被搜得最多,热门query是用户兴趣的风向标,通过分析热门query我们可以把握用户的兴趣走向,对制定运营策略;
- 给用户推荐一些优质query;
- 给用户推荐热门query,一方面兼顾用户体验,另一方面给部分次热门query增加曝光机会;
• 配置流程
• 业务报表
热搜底纹业务运营报表,可以清晰反映搜索引导结果的点击情况,衡量其召回、排序的效果和质量,再通过系统的评估服务,找到对应的问题原因和解决方案。