意图识别（规则模板解析、深度学习意图识别）

作者：育诚家瑋逸群 | 来源：互联网 | 2023-09-06 05:15

一、意图识别应用领域1、搜索引擎2、对话系统：基于意图识别了解用户想要什么业务或者闲聊，并采用不用的子模型来处理1.1闲聊技术：闲聊机

一、意图识别应用领域

1、搜索引擎 2、对话系统&＃xff1a;基于意图识别了解用户想要什么业务或者闲聊&＃xff0c;并采用不用的子模型来处理1.1 闲聊技术&＃xff1a;闲聊机器人需要有较高的召回率&＃xff0c;因此常常用&＃xff1a;seq2seq &＃43; attention / transformer / bert .... 1.2 基于业务&＃xff0c;例如电商、买票、查询天气技术&＃xff1a;基于上述应用场景需要极高的精确率&＃xff0c;因此常常用&＃xff1a;① 基于业务规则模板、基于语义匹配 ② 3、智能物联网 4、机器人
二、意图识别的难点

1、用户输入不规范&＃xff0c;输入方式多样化&＃xff0c;甚至非标准的自然语言 2、表意表现出多意图仙剑奇侠传游戏&＃xff1f;--> 游戏软件&＃xff1f;……电视剧&＃xff1f;--> 电视剧下载&＃xff1f;相关新闻&＃xff1f;…… 3、意图强度&＃xff0c;表述不同表现出不同的需求强度天气很好啊-->弱意图&＃xff08;心情&＃xff0c;闲聊模式&＃xff09; 今天天气怎么样-->强意图&＃xff08;业务模式&＃xff09; 4、意图存在时效性变化&＃xff0c;就是随着时间的推移相同问题的意图会发生变化 ******* 难点 5、没有固定的评估的标准
三、意图识别的主要方法

1、意图识别的类别

&＃xff08;1&＃xff09;导航型将用户导航到相应的领域或相应的流程中例&＃xff1a;百度 *** 导入到某个网站 &＃xff08;2&＃xff09;信息型提供给用户想知道的信息例&＃xff1a;百度 *** 的个人信息 ----- 类似百度百科 &＃xff08;3&＃xff09;事务型给用户提供流程中的各个实现环节例&＃xff1a;百度 *** 坏了 ----- 类似百度知道

2、规则模板意图识别

&＃xff08;1&＃xff09;词表穷举法

特点&＃xff1a;必须一一命中才行&＃xff0c;因此模型的召回率较低&＃xff0c;精确率极高

&＃xff08;2&＃xff09;规则模板解析

规则模板解析&＃xff1a; 需要基于分词、词性标注、命名实体识别、依存句法分析、语义分析的前提下才能完成

而且数据中使用的也是字典形式&＃xff08;key hash 结构&＃xff09;&＃xff0c;查询速度较快。

1、适用于查询非常符合规则的类别&＃xff0c;通过规则解析的方式来获取查询的意图。例&＃xff1a;北京到上海今天的机票价格&＃xff0c;可以转换为&＃xff1a;[地点]到[地点][日期][汽车票/机票/火车票]。执行过程&＃xff1a;第一步&＃xff1a;寻找领域&＃xff0c;获取子类模板字典第二步&＃xff1a;选取模板&＃xff0c;这里面命中模板不是所有的内容都全部命中&＃xff0c;只需要命中一部分。第三步&＃xff1a;采取反问模板与用户沟通缺失了模板的那些内容&＃xff0c;并补全这些内容&＃xff08;即上述问句没有日期&＃xff09;第四步&＃xff1a;给出完整的模板信息并等待用户确认。1吨等于多少公斤&＃xff0c;可以转换为&＃xff1a;[数字][计量单位]等于[数字][计量单位]。对规则性较强的query有较好的识别精度&＃xff0c;能够较好的提取准确信息。缺点&＃xff1a;需要人工参与较多&＃xff0c;很难自动化实现。实用指数&＃xff1a;4★场景&＃xff1a;搜狗通用搜索、小i智能客服、机器人、智能物联网、支付宝分控系统有10000多个模板。

特点&＃xff1a;规则性较强的query精确率较高&＃xff0c;召回率也不错

案例&＃xff1a;搜狗搜索意图识别

规则意图识别的一般技术

1. 判断领域&＃xff1a;采用实体-主域-模板的整体框架来判别识别领域

注意&＃xff1a;主题 ------ 大类别 &＃xff1b;主域 ------- 子类别 &＃xff1b; 模板

2. 判断意图&＃xff1a;命中主域后&＃xff0c;模板采用意图动词(下载、查询等)或意图疑问词(怎么样、为什么等)判别意图

3. 区分弱意图和强意图&＃xff0c;针对性提供解决方案&＃xff1b;判断实体强度

搜索引擎意图识别领域判别表&＃xff1a;仙剑奇侠传

计算过程

第一步&＃xff1a;主体&＃xff08;大类&＃xff09;计算

第二步&＃xff1a;主域&＃xff08;子类&＃xff09;计算

规则模板解析优化

4. query改写包括&＃xff1a;query纠错&＃xff0c;query扩展&＃xff0c;query删除&＃xff0c;query转换。a. 进行同义词扩展 eg&＃xff1a;我去旅游我要旅游 ------- 技术&＃xff1a;① word2vec ② b. 删除一些修饰&＃xff0c;扩大召回 ------- 技术&＃xff1a;① booststriping信息抽取 ② 语义分析&＃xff08;三元组&＃xff09;c. 通过近义或同义转化&＃xff0c;扩大召回 ------- 技术&＃xff1a;① word2vec ②

3、深度学习意图识别

1、机器学习和深度学习方法意图识别可以看做是一个分类问题&＃xff0c;针对于垂直产品的特点&＃xff0c;定义不同的查询意图类别。对于用户输入的query&＃xff0c;根据统计分类模型计算出每一个意图的概率&＃xff0c;最终给出查询的意图。缺点&＃xff1a;主要是数据获取和更新较困难&＃xff0c;数据的标注也需要较准确才能训练出较好地模型。实用指数&＃xff1a;4★场景&＃xff1a;京东JIMI、美团垂直搜索2、深度学习意图识别常见模型&＃xff1a;① LSTM &＃43; attention② BERT网络分类意图识别

特点&＃xff1a;模型召回率很高

案例&＃xff1a;京东JIMI 意图识别

一、大致结构

二、模型网络

京东JIMI意图识别(baseline)深度学习CNN模型&＃xff0c;可用于求解一个分类问题&＃xff0c;将用户的问题映射到一个具体的分类。最终在算法选型上&＃xff0c;采用深度学习CNN模型&＃xff0c;其中模型参数&＃xff1a;词向量采用100维每个样本限定30个字以内&＃xff0c;超出30截断&＃xff0c;不足30补充随机向量单层CNN网络&＃xff0c;第一层卷积核大小3*50

推荐阅读

match
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
char
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
tags
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
sum
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
rsa
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
tags
DLP数据泄露检测原理浅析

最近团队在部署DLP，作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么，他们都以商业秘密为由避而不谈，不得已只能自己查资料学习，于是有了下面的浅见。身为甲方，虽然不需要开发DLP产品，但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器，只有在懂这个工具的原理之后才能更加灵活地使用这个工具，即使出现意外情况也能快速排错，越接近底层，越接近真相。根据DLP的实际用途，本文将DLP检测分为2部分，泄露关键字检测和近似重复文档检测。 ... [详细]

蜡笔小新 2024-12-25 18:19:32
match
深入理解Redis的数据结构与对象系统

本文详细探讨了Redis中的数据结构和对象系统的实现，包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型，以及它们所使用的底层数据结构。通过分析源码和相关文献，帮助读者更好地理解Redis的设计原理。 ... [详细]

蜡笔小新 2024-12-25 04:11:22
ascii
HBase运维工具全解析

本文深入探讨了HBase常用的运维工具，详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说，这些工具是日常管理和故障排查的重要手段。 ... [详细]

蜡笔小新 2024-12-24 17:00:59
match
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
char
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
schema
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
schema
libsodium 1.0.15 发布：引入重大不兼容更新

最新发布的 libsodium 1.0.15 版本带来了若干不兼容的变更，其中包括默认密码散列算法的更改和其他重要调整。 ... [详细]

蜡笔小新 2024-12-26 11:03:58
match
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
flutter
Flutter | Key 的深度解析

在 Flutter 开发过程中，开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说，理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景，并通过实例帮助你更好地掌握这一重要工具。 ... [详细]

蜡笔小新 2024-12-25 08:05:15
flutter
深入理解一致性哈希算法及其应用

本文详细介绍了分布式系统中的一致性哈希算法，探讨其原理、优势及应用场景，帮助读者全面掌握这一关键技术。 ... [详细]

蜡笔小新 2024-12-24 14:08:10

育诚家瑋逸群

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章