热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

超能搜索系统输入关键字_电商后台设计——搜索

编辑导语:我们在进行网上购物时,可以直接利用搜索功能查找想要的商品,十分快捷方便;为了方便我们的更快的找到,搜

编辑导语:我们在进行网上购物时,可以直接利用搜索功能查找想要的商品,十分快捷方便;为了方便我们的更快的找到,搜索后会根据系统内部的逻辑进行查找;本文作者详细介绍了电商平台的搜索原理以及搜索功能。

64565c8e7abeb5f71a247a7a6be2e109.png

电商平台商品成千上万,为了方便用户快速查找到自己想要的商品,平台中会设置有多种查询方式,如品类搜索、关键字搜索等。

但是无论前台页面样式如何改变,系统内部的搜索逻辑其实都是同一套,今天我们就来看看电商平台的搜索原理以及常见的搜索功能要点。

一、查询种类

如果按照内部逻辑划分,电商系统中的查询通常有两类:特定维度查询和关键字查询。

1. 特定维度查询

特定维度仅可查询由系统指定的部分可属性,如品类、品牌、价格、性别、材质等,并且用户无法输入查询值,仅能选择查询值。

由于这些数据在系统内部都维护有基础数据,并且保存在指定的字段中,所以对它们的查询相对比较简单。

用户在选中对应选项时,可以获得对应的唯一ID,之后根据ID查询相应字段获得结果,查询相对比较准确。

2. 关键字查询

整个搜索功能最重要的入口,允许用户随意输入要查询的关键字,通常仅有一个查询关键字长度限制。

相对于特定维度查询,关键字查询相对比较复杂,下图是搜索的原理图,下面来一一进行分析。

a929d77ab597be5ef184c703368165fa.png

二、逻辑层操作

当用户提交了查询关键字后,系统会将关键字交给搜索逻辑处理,逻辑层会进行一下几步操作:

1. 非法词过滤

由于关键字查询功能是对用户开放的,所以用户输入什么内容我们是不可控的。

我们在项目排查时经常会发现一些五花八门的关键字,其中有不少关键字比较敏感,比如涉黄、涉赌等等,这些关键字我们通常都会屏蔽,不进行数据搜索。

要屏蔽对应的关键字,后台就需要维护一套非法词库,当用户输入的关键字在非法词库中就不再做搜索,以减轻服务器压力。

网上一般有现成的词库可以直接导入系统,不满足的后台再进行维护扩充。

f4448aef6ebaf8e79c211321153187cf.png

2. 错误词纠正

在输入查询关键字时,用户可能会输入成拼音、或者错别字,如用户本意要输入“阿迪达斯”,实际输入成“阿迪斯”,但是结果依然能返回和“阿迪达斯”匹配的数据。

这是因为逻辑中有一套纠错词处理,当系统对比有错误时,会进行纠正处理。

同样后台也需要维护了一套纠错词库,当用户输入的关键字如果在纠错词库中,系统会自动将错误关键字替换为设置好的关键字;如:阿迪斯->阿迪达斯;阿达斯->阿迪达斯,之后查询实际采用的是转换后的关键字。

3. 特定跳转

有时我们在电商平台上输入查询关键字,会发现部分关键字结果不会跳转到结果列表页,而是跳转到一个商家店铺主页或者活动页;如输入关键字“阿迪达斯”,可能直接就进入到了阿迪达斯旗舰店页面,也有可能进入阿迪达斯活动专场页面。

要实现这个功能,后台同样需要维护一套跳转规则映射库;当用户的搜索关键字与规则库中的关键字匹配时,则返回规则所指定的跳转路径,前端页面直接跳转过去——通常这个跳转规则是有时间限定的。

e885a819308e10cc97aeca6d914feb48.png

4. 商品搜索

当用户输入的查询关键字通过非法词过滤、纠错词纠正、特定跳转匹配后,依然没有匹配结果,这时系统会将关键字交给商品搜索服务器。

搜索服务器首先会对关键字进行分词处理,然后再根据分词进行商品查询,并根据权重规则获得商品权重值,之后再进行权重值排序,最后返回查询结果。

在商品搜索中有三个非常重要的功能:分词、权重、以及搜索维度。

分词:分词是将一个比较长的关键字拆分成多个合理的比较短的关键字(如:阿迪达斯板鞋->阿迪达斯、板鞋、鞋);说起来只是简单的一句话,但是能做出一个好的分词项目并非易事,有兴趣的同学可以自己搜索中分分词原理,这里就不多说。项目中我们通常会引用第三方的分词软件获得分词,之后再去商品服务器中去查询数据并将结果展示出来。

权重:权重是衡量某一指标的重要程度,在电商平台里都是各家的商业机密,网上公开的资料也是少之又少;一个商品的权重高低,直接决定着商品排名情况,当然也就影响着销售额了;下一篇《权重设计》我会单独介绍电商平台是如何设计的。

需要注意的是上面提到的搜索服务器不是常见的关系型数据库(如mysql),而是全文检索服务器(如solr),一般的全文检索服务器也自带有分词功能,满足中小型电商的分析和搜索是没有问题的。

搜索维度:也就是用户可以通过哪些属性对商品进行搜索; 其中基础属性中的品牌、品类、价格都会参与搜索,还有特殊属性中后台明确规定参与搜索的属性(如果忘记了可以查看《属性管理》篇)。

商品搜索服务器会根据需要参与搜索的属性,对查询出的商品信息按各属性进行分组统计,然后由代码逻辑层进行数据整理,再由前端进行展示,最终就形成了搜索列表的样式。

00bb314e753b1a86251640fe0ba19301.png

不知道大家在JD上搜索时有没有发现,如果输入一个覆盖品类比较大的关键字,最终的返回结果只会是同一品类的商品。

如输入查询关键字【牛】,和牛相关的商品品类有牛肉、牛仔裤、牛油果等等,实际结果只有肉类产品。

这个主要就是不同品类的商品属性不同,无法做到公用的效果,业务上需要作出一些取舍;所以大家平时设计产品时,需要多和技术聊聊,能达到的效果尽量实现,不能话就需要作出一些妥协。

以上就是一个搜索功能的核心要点,一个看似简单的搜索框,其实内部是需要多个功能进行协同完成的;下次给技术要工作周期时,可不能直说我只想要个框,你就要几周时间,以免被人笑话。

上面这几个核心要点每个也是一个功能要点,都需要单独维护;除此之外还有一些功能,具体是否使用大家需要根据自己的业务来决定。

5. 搜索统计

做为平台重要的数据入口,对用户搜索词的统计功能有多重要就不在多说了。

通过对搜索词数据的统计,可以让运营人员直观的了解到用户对品类、品牌、价格的青睐趋势,为后期的活动运营、市场预测做好数据指导。

常见的统计维度有以下几个:

  1. 每日、每周、以及每月的搜索访问量统计;
  2. 搜索关键字的排名统计(组织方式:每日、最近一周、最近一个月、每月);
  3. 各品类、各品牌的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月);
  4. 各品类、各品牌排名占比(组织方式:每日、最近一周、最近一个月、每月);
  5. 各价格区间的的搜索排名统计(组织方式:每日、最近一周、最近一个月、每月)。

6. 首页推荐词

在电商首页,平台为了推广活动,会在的搜索框下面显示一些热门搜索词或者推荐搜索词,而这些搜索词通常都会跳转到指定的专题或者活动页,以提升活动曝光率。

在上面讲解的【特定跳转】功能上增加一个首页推荐词字段加以区分就能实现这个功能。

7. 搜索历史

当用户选中搜索框时,下拉列表里面会出现之前的搜索词,方便用户快捷选择。

这个只需要在用户提交搜索词时,将搜索词保存起来,之后再调取出来即可,功能比较简单。

8928ff6f94a99de5fb6adb37290f3f13.png

8. 搜索推荐词

当用户选中搜索框并输入查询关键字,下拉列表中会出现相似的一些推荐词,并且推荐词后面有相应的商品数量。

这个功能是通过调用【商品搜索】功能的统计接口,实时获得的数据并显示前几位的数据。

ef7e3a6858e7c098fba05c44ce735bbe.png

9. 输入形式

通常查询关键字搜索默认的输入形式是文字形式,现在由于技术的发展,有实力的电商平台也引入了图片输入和语音输入方式。

其实内部逻辑一点都没有变,只是在原始的文字输入之上有加了一层识别组件,通过识别组件先将图片内容或者语音内容转为文字,再由文字进行搜索查询。

以上就是搜索功能的内容,还有遗漏的地方欢迎大家下方留言补充!

作者:JackLiu;个人微信公众号: 扬帆去远航(ID:Jackai_liu)

本文由 @Jack 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。



推荐阅读
  • 解决MySQL Administrator 登录失败问题
    本文提供了解决在使用MySQL Administrator时遇到的登录错误的方法,包括启动变量和服务部分禁用的问题。同时,文章还介绍了通过安全配置模式来解决问题的具体步骤。 ... [详细]
  • 本文探讨了缓存系统中的两个关键问题——缓存穿透与缓存失效时的雪崩效应,以及这些问题的解决方案。此外,文章还介绍了数据处理、数据库拆分策略、缓存优化、拆分策略、应用架构演进及通信协议的选择等内容。 ... [详细]
  • 地理信息、定位技术及其在物联网中的应用
    地理位置信息是物联网系统中不可或缺的关键要素,它不仅提供了物理世界的坐标,还增强了物联网应用的实用性和准确性。本文探讨了位置服务的基本概念、关键技术及其在物联网中的重要作用,特别介绍了定位技术的最新进展。 ... [详细]
  • Pikachu平台SQL注入漏洞详解
    本文详细介绍了SQL注入漏洞的基本原理、攻击流程、不同类型注入点的识别与利用方法,以及基于union联合查询、报错信息、布尔盲注、时间盲注等多种技术手段的信息获取方式。同时,探讨了如何通过SQL注入获取操作系统权限,以及HTTP Header注入和宽字节注入等高级技巧。最后,提供了使用SQLMap自动化工具进行漏洞测试的方法和常见的SQL注入防御措施。 ... [详细]
  • 开发笔记:三分钟快速搭建分布式高可用的Redis集群
    开发笔记:三分钟快速搭建分布式高可用的Redis集群 ... [详细]
  • Linux环境下PostgreSQL的安装、配置及日常管理
    本文详细介绍了在Linux环境下安装、配置PostgreSQL数据库的过程,包括环境准备、安装步骤、配置数据库访问以及日常服务管理等方面的内容。适合初学者和有一定经验的数据库管理员参考。 ... [详细]
  • MHA 架构详解与实践
    MHA(Master High Availability)是一种高效的主从切换解决方案,确保了数据的一致性和系统的高可用性。本文将详细介绍MHA的功能、主从切换流程以及配置步骤,并探讨其优缺点。 ... [详细]
  • 本文详细记录了在Ubuntu 9.10操作系统上从零开始搭建LAMP(Linux, Apache, MySQL, PHP)环境的过程,包括遇到的问题及解决方案。旨在为初次尝试搭建LAMP环境的开发者提供参考。 ... [详细]
  • 本文详细介绍了MySQL 5.5及以上版本中事务管理的全过程,包括事务的启动、设置、锁机制以及解锁方法,旨在为开发者提供一个清晰、全面的操作指南,避免因网络资料分散而导致的学习障碍。 ... [详细]
  • 开发笔记:Mongodb副本集集群搭建 ... [详细]
  • 2023年最新:PHP本地端口配置详解
    本文详细介绍了PHP在不同环境下的本地端口配置方法及常见问题解决方案,帮助开发者更好地理解和配置PHP端口。 ... [详细]
  • 深度解析:任务宝裂变营销的成功之道
    任务宝裂变作为一种高效用户增长手段,在微信生态下被广泛应用。本文将通过实际案例,探讨如何设计和实施任务宝裂变策略,以实现持续获客的目标。 ... [详细]
  • Python与MySQL交互指南:从基础到进阶
    本文深入探讨了Python与MySQL数据库的集成方法,包括数据库连接、数据表创建、索引管理、数据操作以及如何防止SQL注入等关键内容。适合初学者及希望提升数据库操作技能的开发者。 ... [详细]
  • 使用Python模拟登录教务系统抓取成绩并分析存储
    本文详细介绍如何使用Python编程语言模拟登录学校教务系统,抓取学生的成绩信息,并进行数据分析和可视化处理,最终将数据存储到MySQL数据库中。 ... [详细]
  • 本文详细介绍了如何解决在使用本地SQlyog客户端尝试连接阿里云上的MariaDB数据库时遇到的2003错误,即无法连接到MySQL服务器的问题。 ... [详细]
author-avatar
晨雨心秋-济微路唐姜合
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有