热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

超能搜索系统输入关键字_电商后台设计——搜索

编辑导语:我们在进行网上购物时,可以直接利用搜索功能查找想要的商品,十分快捷方便;为了方便我们的更快的找到,搜

编辑导语:我们在进行网上购物时,可以直接利用搜索功能查找想要的商品,十分快捷方便;为了方便我们的更快的找到,搜索后会根据系统内部的逻辑进行查找;本文作者详细介绍了电商平台的搜索原理以及搜索功能。

64565c8e7abeb5f71a247a7a6be2e109.png

电商平台商品成千上万,为了方便用户快速查找到自己想要的商品,平台中会设置有多种查询方式,如品类搜索、关键字搜索等。

但是无论前台页面样式如何改变,系统内部的搜索逻辑其实都是同一套,今天我们就来看看电商平台的搜索原理以及常见的搜索功能要点。

一、查询种类

如果按照内部逻辑划分,电商系统中的查询通常有两类:特定维度查询和关键字查询。

1. 特定维度查询

特定维度仅可查询由系统指定的部分可属性,如品类、品牌、价格、性别、材质等,并且用户无法输入查询值,仅能选择查询值。

由于这些数据在系统内部都维护有基础数据,并且保存在指定的字段中,所以对它们的查询相对比较简单。

用户在选中对应选项时,可以获得对应的唯一ID,之后根据ID查询相应字段获得结果,查询相对比较准确。

2. 关键字查询

整个搜索功能最重要的入口,允许用户随意输入要查询的关键字,通常仅有一个查询关键字长度限制。

相对于特定维度查询,关键字查询相对比较复杂,下图是搜索的原理图,下面来一一进行分析。

a929d77ab597be5ef184c703368165fa.png

二、逻辑层操作

当用户提交了查询关键字后,系统会将关键字交给搜索逻辑处理,逻辑层会进行一下几步操作:

1. 非法词过滤

由于关键字查询功能是对用户开放的,所以用户输入什么内容我们是不可控的。

我们在项目排查时经常会发现一些五花八门的关键字,其中有不少关键字比较敏感,比如涉黄、涉赌等等,这些关键字我们通常都会屏蔽,不进行数据搜索。

要屏蔽对应的关键字,后台就需要维护一套非法词库,当用户输入的关键字在非法词库中就不再做搜索,以减轻服务器压力。

网上一般有现成的词库可以直接导入系统,不满足的后台再进行维护扩充。

f4448aef6ebaf8e79c211321153187cf.png

2. 错误词纠正

在输入查询关键字时,用户可能会输入成拼音、或者错别字,如用户本意要输入“阿迪达斯”,实际输入成“阿迪斯”,但是结果依然能返回和“阿迪达斯”匹配的数据。

这是因为逻辑中有一套纠错词处理,当系统对比有错误时,会进行纠正处理。

同样后台也需要维护了一套纠错词库,当用户输入的关键字如果在纠错词库中,系统会自动将错误关键字替换为设置好的关键字;如:阿迪斯->阿迪达斯;阿达斯->阿迪达斯,之后查询实际采用的是转换后的关键字。

3. 特定跳转

有时我们在电商平台上输入查询关键字,会发现部分关键字结果不会跳转到结果列表页,而是跳转到一个商家店铺主页或者活动页;如输入关键字“阿迪达斯”,可能直接就进入到了阿迪达斯旗舰店页面,也有可能进入阿迪达斯活动专场页面。

要实现这个功能,后台同样需要维护一套跳转规则映射库;当用户的搜索关键字与规则库中的关键字匹配时,则返回规则所指定的跳转路径,前端页面直接跳转过去——通常这个跳转规则是有时间限定的。

e885a819308e10cc97aeca6d914feb48.png

4. 商品搜索

当用户输入的查询关键字通过非法词过滤、纠错词纠正、特定跳转匹配后,依然没有匹配结果,这时系统会将关键字交给商品搜索服务器。

搜索服务器首先会对关键字进行分词处理,然后再根据分词进行商品查询,并根据权重规则获得商品权重值,之后再进行权重值排序,最后返回查询结果。

在商品搜索中有三个非常重要的功能:分词、权重、以及搜索维度。

分词:分词是将一个比较长的关键字拆分成多个合理的比较短的关键字(如:阿迪达斯板鞋->阿迪达斯、板鞋、鞋);说起来只是简单的一句话,但是能做出一个好的分词项目并非易事,有兴趣的同学可以自己搜索中分分词原理,这里就不多说。项目中我们通常会引用第三方的分词软件获得分词,之后再去商品服务器中去查询数据并将结果展示出来。

权重:权重是衡量某一指标的重要程度,在电商平台里都是各家的商业机密,网上公开的资料也是少之又少;一个商品的权重高低,直接决定着商品排名情况,当然也就影响着销售额了;下一篇《权重设计》我会单独介绍电商平台是如何设计的。

需要注意的是上面提到的搜索服务器不是常见的关系型数据库(如mysql),而是全文检索服务器(如solr),一般的全文检索服务器也自带有分词功能,满足中小型电商的分析和搜索是没有问题的。

搜索维度:也就是用户可以通过哪些属性对商品进行搜索; 其中基础属性中的品牌、品类、价格都会参与搜索,还有特殊属性中后台明确规定参与搜索的属性(如果忘记了可以查看《属性管理》篇)。

商品搜索服务器会根据需要参与搜索的属性,对查询出的商品信息按各属性进行分组统计,然后由代码逻辑层进行数据整理,再由前端进行展示,最终就形成了搜索列表的样式。

00bb314e753b1a86251640fe0ba19301.png

不知道大家在JD上搜索时有没有发现,如果输入一个覆盖品类比较大的关键字,最终的返回结果只会是同一品类的商品。

如输入查询关键字【牛】,和牛相关的商品品类有牛肉、牛仔裤、牛油果等等,实际结果只有肉类产品。

这个主要就是不同品类的商品属性不同,无法做到公用的效果,业务上需要作出一些取舍;所以大家平时设计产品时,需要多和技术聊聊,能达到的效果尽量实现,不能话就需要作出一些妥协。

以上就是一个搜索功能的核心要点,一个看似简单的搜索框,其实内部是需要多个功能进行协同完成的;下次给技术要工作周期时,可不能直说我只想要个框,你就要几周时间,以免被人笑话。

上面这几个核心要点每个也是一个功能要点,都需要单独维护;除此之外还有一些功能,具体是否使用大家需要根据自己的业务来决定。

5. 搜索统计

做为平台重要的数据入口,对用户搜索词的统计功能有多重要就不在多说了。

通过对搜索词数据的统计,可以让运营人员直观的了解到用户对品类、品牌、价格的青睐趋势,为后期的活动运营、市场预测做好数据指导。

常见的统计维度有以下几个:

  1. 每日、每周、以及每月的搜索访问量统计;
  2. 搜索关键字的排名统计(组织方式:每日、最近一周、最近一个月、每月);
  3. 各品类、各品牌的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月);
  4. 各品类、各品牌排名占比(组织方式:每日、最近一周、最近一个月、每月);
  5. 各价格区间的的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月)。

6. 首页推荐词

在电商首页,平台为了推广活动,会在的搜索框下面显示一些热门搜索词或者推荐搜索词,而这些搜索词通常都会跳转到指定的专题或者活动页,以提升活动曝光率。

在上面讲解的【特定跳转】功能上增加一个首页推荐词字段加以区分就能实现这个功能。

7. 搜索历史

当用户选中搜索框时,下拉列表里面会出现之前的搜索词,方便用户快捷选择。

这个只需要在用户提交搜索词时,将搜索词保存起来,之后再调取出来即可,功能比较简单。

8928ff6f94a99de5fb6adb37290f3f13.png

8. 搜索推荐词

当用户选中搜索框并输入查询关键字,下拉列表中会出现相似的一些推荐词,并且推荐词后面有相应的商品数量。

这个功能是通过调用【商品搜索】功能的统计接口,实时获得的数据并显示前几位的数据。

ef7e3a6858e7c098fba05c44ce735bbe.png

9. 输入形式

通常查询关键字搜索默认的输入形式是文字形式,现在由于技术的发展,有实力的电商平台也引入了图片输入和语音输入方式。

其实内部逻辑一点都没有变,只是在原始的文字输入之上有加了一层识别组件,通过识别组件先将图片内容或者语音内容转为文字,再由文字进行搜索查询。

以上就是搜索功能的内容,还有遗漏的地方欢迎大家下方留言补充!

作者:JackLiu;个人微信公众号: 扬帆去远航(ID:Jackai_liu)

本文由 @Jack 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。



推荐阅读
  • 一生热爱回头太难。在mysql5.5之前,默认使用的是Myisam引擎,5.5之后,默认使用InnoDB引擎。关于二者区别一直是重要的问题 ... [详细]
  • 深入理解Redis中的字典实现
    本文详细介绍了Redis中字典的实现机制,包括其底层数据结构、哈希表与哈希节点的关系、元素添加方法及rehash操作的具体流程。 ... [详细]
  • Nacos 0.3 数据持久化详解与实践
    本文详细介绍了如何将 Nacos 0.3 的数据持久化到 MySQL 数据库,并提供了具体的步骤和注意事项。 ... [详细]
  • Cookie学习小结
    Cookie学习小结 ... [详细]
  • 包含phppdoerrorcode的词条 ... [详细]
  • 本文详细介绍了如何在PHP中记录和管理行为日志,包括ThinkPHP框架中的日志记录方法、日志的用途、实现原理以及相关配置。 ... [详细]
  • 在将Web服务器和MySQL服务器分离的情况下,是否需要在Web服务器上安装MySQL?如果安装了MySQL,如何解决PHP连接MySQL服务器时出现的连接失败问题? ... [详细]
  • EST:西湖大学鞠峰组污水厂病原菌与土著反硝化细菌是多重抗生素耐药基因的活跃表达者...
    点击蓝字关注我们编译:祝新宇校稿:鞠峰、袁凌论文ID原名:PathogenicandIndigenousDenitrifyingBacte ... [详细]
  • 本文详细介绍了MySQL数据库服务器(mysqld)和客户端(mysql)的区别,并提供了多种启动和关闭MySQL服务器的方法。通过这些方法,您可以更好地管理和维护MySQL数据库。 ... [详细]
  • Linux下MySQL 8.0.28安装指南
    本文详细介绍了在Linux系统上安装MySQL 8.0.28的步骤,包括下载数据库、解压数据包、安装必要组件和启动MySQL服务。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 微信小程序详解:概念、功能与优势
    微信公众平台近期向200位开发者发送了小程序的内测邀请。许多人对微信小程序的概念还不是很清楚。本文将详细介绍微信小程序的定义、功能及其独特优势。 ... [详细]
  • MySQL 5.7 学习指南:SQLyog 中的主键、列属性和数据类型
    本文介绍了 MySQL 5.7 中主键(Primary Key)和自增(Auto-Increment)的概念,以及如何在 SQLyog 中设置这些属性。同时,还探讨了数据类型的分类和选择,以及列属性的设置方法。 ... [详细]
  • 在《天天酷跑》中,腾讯微信宠物的升级技巧和策略对于提升游戏体验至关重要。本文详细解析了如何通过合理分配经验和资源,快速提升宠物等级,以及如何选择合适的宠物搭配,以增强角色的综合能力。此外,还介绍了游戏中的一些隐藏机制和优化建议,帮助玩家更好地利用微信宠物的优势,提高游戏成绩。 ... [详细]
  • 第二章:Kafka基础入门与核心概念解析
    本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统,以其卓越的性能和高吞吐量而著称。最初,Kafka被设计用于LinkedIn的活动流和运营数据处理,旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景,读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]
author-avatar
晨雨心秋-济微路唐姜合
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有