首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
shell
command
cSharp
random
char
version
less
sum
import
express
audio
hashtable
php5
spring
go
process
bit
merge
lua
settings
chat
heap
dockerfile
subset
python3
flutter
default
select
bash
list
数组
yaml
loops
utf-8
grid
jsp
instance
actionscrip
tags
bitmap
hash
cmd
future
web3
fetch
const
filter
join
object
int
erlang
vba
bytecode
rsa
php
emoji
copy
jar
hashset
include
scala
frameworks
export
cpython
callback
cookie
header
foreach
cPlusPlus
request
iostream
perl
string
require
python
tree
regex
dll
blob
当前位置:
开发笔记
>
编程语言
> 正文
阿里飞猪旅行搜索技术的革新与实践
作者:木扎尔特2502918527 | 来源:互联网 | 2024-12-14 08:56
本文由林睿(阿里飞猪)分享,经杜正海、Hoh编辑整理,并由DataFunTalk平台发布。文章探讨了旅行搜索技术从满足基本需求到集成高级功能的发展历程,特别是在阿里飞猪平台上的应用与创新。
### 导读
旅行搜索技术最初旨在满足用户的特定需求,如查询航班、火车票或预订酒店等。随着技术的进步,用户对搜索体验的要求不断提高,促使旅行搜索技术不断演进,成为集多种搜索策略于一体的全文检索系统。本文将深入探讨阿里飞猪在旅行搜索领域的技术应用与创新。
#### 一、飞猪搜索背景
1. **全局搜索与行业小搜**
- 全局搜索:涵盖飞猪内部所有内容的搜索入口。
- 行业小搜:专注于特定领域,如酒店、机票和旅游度假产品的垂直搜索。
- 随着业务发展,用户越来越多地使用全局搜索,因为它能一站式满足跨类别的需求,减少用户操作步骤。
2. **猪搜框架**
- 主要流程包括:Query处理(QP)、分页服务(SP)、倒排索引(HA3)、粗排序、加权排序和最终结果展示。
- QP负责Query理解与召回生成,是整个搜索流程的关键环节。
3. **QP挑战**
- 性能要求高:响应时间需控制在总响应时间的1/10以内。
- 文本理解:提供文本相关性支持。
- 特殊要求:处理LBS与POI的理解,提供空间相关性。
- 用户特征:支持个性化相关性,满足多样化需求。
#### 二、基础建设
1. **Query Tagging**
- 功能:识别Query中的目的地和用户意图。
- 层次:数据层、算法层和应用层。
- 数据层通过离线挖掘建立tagging词库,算法层利用Tag消歧和CRF等技术进行在线打标,应用层则用于Query丢词和改写。
2. **商品POI挖掘**
- 从商品标题和详情中提取有价值的POI信息,扩充词表,提高召回质量。
- 使用CRF++模型进行序列标注,准确率超过99%,召回率超过95%。
3. **同义词挖掘**
- 处理翻译类、中英文词、包含关系和错别字等类型的同义词。
- 基于用户点击行为和word2vec模型生成候选词,通过特征工程和二分类模型进行筛选。
4. **纠错**
- 解决全Query级别的错误,采用隐马尔科夫模型进行统计纠错。
- 包括同音字和形近字的识别,通过字体图像和结构计算相似度。
#### 三、召回策略
1. **经典召回**
- 利用同义词挖掘、相似Query改写和商品POI挖掘等技术,提高召回质量。
- Learning To Rewrite:通过多路改写生成候选集合,再用Learning To Rank选取最佳结果。
2. **LBS召回**
- 识别用户地理位置,召回附近的相关商品。
- 通过POI识别、文本相似性和用户位置等特征进行建模,准确率可达95%。
3. **向量召回**
- 引入深度学习模型,通过Query和商品的embedding进行相似性计算。
- 在无结果情况下,通过向量召回补充召回结果,降低无结果率。
4. **个性化召回**
- 针对泛需求搜索和不明确的搜索意图,引入个性化召回策略。
- 结合推荐系统和用户行为数据,提供更符合用户需求的搜索结果。
#### 四、总结与展望
1. **Query & User Planer**
- 计划升级QP为Query & User Planer,增强个性化搜索能力。
2. **可解释性升级**
- 提升搜索结果的可解释性,更细致地理解用户意图,预测用户行为,提供更精准的服务。
### 结语
本文详细介绍了阿里飞猪在旅行搜索技术上的最新进展,展示了从基础建设到高级召回策略的全面技术体系,为提升用户体验提供了有力支持。
搜索
人工智能
算法
html
ip
深度
架构
io
case
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
spring
收割机|篇幅_国内最牛逼的笔记,不接受反驳!!
收割机|篇幅_国内最牛逼的笔记,不接受反驳!! ...
[详细]
蜡笔小新 2024-12-14 10:20:42
go
a16z 推出加密研究实验室
a16z 宣布成立全新的加密研究实验室,旨在推动加密技术和 Web3 领域的科学发展。 ...
[详细]
蜡笔小新 2024-12-11 10:17:03
default
Go 通过 Map/Filter/ForEach 等流式 API 高效处理数据
go,通过,map,filter,foreach,等,流,式,ap ...
[详细]
蜡笔小新 2024-12-14 12:54:15
import
【度量学习】Siamese Network
基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章:《LearningtoCompar ...
[详细]
蜡笔小新 2024-12-12 19:11:33
go
黑客如何利用AI在暗网重建你的数字身份
随着技术的发展,黑客开始利用AI技术在暗网中创建用户的‘数字孪生’,这一现象引起了安全专家的高度关注。 ...
[详细]
蜡笔小新 2024-12-12 17:45:26
version
VB.NET 版机房收费系统实现数据导出至Excel
本文介绍了如何在VB.NET版机房收费系统中实现数据从DataGridView导出至Excel的功能,包括环境配置、代码实现及常见问题解决方法。 ...
[详细]
蜡笔小新 2024-12-11 14:30:02
version
智能全栈云风暴:AI引领的企业转型之路
当提及AI,人们脑海中常浮现的是天才少年独自编写算法,瞬间点亮机器人的双眼。然而,真正的AI革命正由大型企业和机构推动,它们利用全栈全场景AI技术,实现数字化与智能化的深度转型。 ...
[详细]
蜡笔小新 2024-12-09 17:35:15
spring
Spring Boot 自定义默认首页访问配置
本文介绍了如何通过自定义配置类,利用 `WebMvcConfigurer` 接口来扩展 Spring MVC 的功能,实现默认首页的自动跳转,同时避免使用 `@EnableWebMvc` 注解全面接管 Spring MVC 的默认配置。 ...
[详细]
蜡笔小新 2024-12-14 14:53:27
spring
免费获取:全面更新的Linux集群视频教程及配套资源
本资源包含最新的Linux集群视频教程、详细的教学资料、实用的学习课件、完整的源代码及多种软件开发工具。百度网盘链接:https://pan.baidu.com/s/1roYoSM0jHqa3PrCfaaaqUQ,提取码:41py。关注我们的公众号,获取更多更新的技术教程。 ...
[详细]
蜡笔小新 2024-12-14 11:51:16
select
Oracle 审计日志配置与管理指南
本文详细介绍了Oracle数据库中审计日志(audit trail)的配置方法及各参数选项的功能,包括如何启用系统范围的审计记录,以及如何将审计数据存储在不同的位置和格式。 ...
[详细]
蜡笔小新 2024-12-14 11:19:41
sum
前端常用的布局类型——前端布局
1.Static静态布局固定宽高:2.Liquid流式布局宽高用百分比,按屏幕分辨率调整,布局不发生变化3.Adaptive自适应 ...
[详细]
蜡笔小新 2024-12-14 10:35:02
sum
Vue 中的数据更新问题解析
探讨在 Vue 框架中遇到的数据更新延迟或失败的问题,并提供解决方案。 ...
[详细]
蜡笔小新 2024-12-14 10:21:49
char
使用邻接矩阵实现图的深度优先遍历
本文通过C++代码示例,详细介绍了如何利用邻接矩阵构建无向图,并实现图的深度优先遍历(DFS)。文章包括了完整的代码实现,以及对关键函数的解释。 ...
[详细]
蜡笔小新 2024-12-14 07:43:30
list
深入理解《Linux命令行与Shell脚本编程》第十一章
本文基于《Linux命令行与Shell脚本编程大全》第三版的第十一章内容,探讨了如何构建基本的Shell脚本,包括命令组合、脚本创建、消息显示、变量使用、输入输出重定向、管道、数学运算及脚本退出等方面的知识。 ...
[详细]
蜡笔小新 2024-12-13 19:51:51
sum
可能存在无限递归_递归算法看这一篇就够了|多图
前言递归是一种非常重要的算法思想,无论你是前端开发,还是后端开发,都需要掌握它。在日常工作中,统计文件夹大小, ...
[详细]
蜡笔小新 2024-12-13 10:24:12
木扎尔特2502918527
这个家伙很懒,什么也没留下!
Tags | 热门标签
shell
command
cSharp
random
char
version
less
sum
import
express
audio
hashtable
php5
spring
go
process
bit
merge
lua
settings
chat
heap
dockerfile
subset
python3
flutter
default
select
bash
list
RankList | 热门文章
1
网络模型_地铁时刻表建模之事件活动网络模型
2
危险的森林里
3
开发笔记:C++动态库的打包与使用
4
vuecli webpack2项目打包优化
5
mysql bulk insert_MySql 使用MySqlBulkLoader批量插入
6
计算机网络与通信pdf谢希仁_2021年西北工业大学801计算机专业基础考研全套
7
《念奴娇 秣陵吊古》翻译 原文赏析诗人清屈大均
8
十三、FBV和CBV和数据序列化
9
Pokemon Go Go (状压dp)
10
php如何在两个特定关键字中获取html文件的所有文本
11
荣耀手机无法升级鸿蒙,荣耀手机不能升级鸿蒙了?博主给出升级名单
12
Nginx 文件名逻辑漏洞(CVE20134547)漏洞复现
13
TOMCAT 7新特性
14
开发笔记:高效算法求解数独
15
c – 在luabind :: object中存储父类的lua类
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有