关于人工智能:此苹果非彼苹果看意图识别的那些事儿

作者：黑m泽猫咪2009 | 来源：互联网 | 2023-05-19 17:02

“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战我的项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感剖析、文本问答、结构化数据问答、文本翻译、机器同传、对话零碎等实际我的项目的全流程解说，旨在帮忙开发者更全面清晰地把握百度飞桨框架在NLP畛域的用法，并可能触类旁通、灵

我的项目简介

6月，百度飞桨 & 自然语言解决部携手推出了12节NLP视频课，课程中具体解说了本实际我的项目。

观看课程回放请戳：https://aistudio.baidu.com/aistudio/course/introduce/24177

欢送来课程QQ群（群号:758287592）交换吧~~

用意辨认原来如此

用意辨认是指剖析用户的外围需要，输入与查问输出最相干的信息，例如在搜寻中要找电影、查快递、市政办公等需要，这些需要在底层的检索策略会有很大的不同，谬误的辨认简直能够确定找不到能满足用户需要的内容，导致产生十分差的用户体验；在对话过程中要精确了解对方所想表白的意思，这是具备很大挑战性的工作。

例如用户输出查问“仙剑奇侠传”时，咱们晓得“仙剑奇侠传”既有游戏又有电视剧还有新闻、图片等等，如果咱们通过用户用意辨认发现该用户是想看“仙剑奇侠传”电视剧的，那咱们间接把电视剧作为后果返回给用户，就会节俭用户的搜寻点击次数，缩短搜寻工夫，大大晋升应用体验。而在对话中如果对方说“我的苹果从不呈现卡顿”，那么咱们就能通过用意辨认判断出此刻的苹果是一个电子设备，而非水果，这样对话就能顺利进行上来。

总之，用意辨认的准确性能在很大水平上影响着搜寻的准确性和对话零碎的智能性。

本示例将展现如何应用ERNIE预训练模型实现工作型对话中的槽位填充和用意辨认工作，这两个工作是一个pipeline型工作对话零碎的基石。

本示例应用的数据集为CrossWOC中文对话数据集。该数据集蕴含多个畛域，包含景点，餐馆，酒店，交通等。

疾速实际

本我的项目基于飞桨PaddleNLP实现，记得给PaddleNLP点个小小的Star⭐

开源不易，心愿大家多多反对~

GitHub地址：

https://github.com/PaddlePadd&＃8230;https://github.com/PaddlePaddle/PaddleNLP
PaddleNLP文档：

https://paddlenlp.readthedocs.io

与大多数NLP工作雷同，本次示例的展现流程分为以下四步：

2.1 数据筹备

数据筹备流程如下：

1.应用load_dataset()自定义数据集

应用官网脚本预处理过的数据集曾经上传至AI Studio中此我的项目中（我的项目链接在文末），通过观察数据集格局，咱们能够写出数据文件读取函数，传入load_dataset()。即可创立数据集。

2.加载 paddlenlp.transformers.ErnieTokenizer用于数据处理
文本数据在输出ERNIE预训练模型之前，须要通过数据处理转化为Feature。这一过程通常包含分词，token to id，add special token等步骤。

PaddleNLP对于各种预训练模型曾经内置了相应的tokenizer，指定想要应用的模型名字即可加载对应的tokenizer。

能够通过调用tokenizer中的办法简略的实现上述数据处理。

3.调用map()办法批量解决数据

因为咱们传入了lazy=False，所以咱们应用load_dataset()自定义的数据集是MapDataset对象。

MapDataset是paddle.io.Dataset的性能加强版本。其内置的map()办法适宜用来进行批量数据集解决。

map()办法传入的是一个用于数据处理的function。正好能够与tokenizer相配合。

4.Batchify和数据读入

应用paddle.io.BatchSampler和paddlenlp.data中提供的办法把数据组成batch。

而后应用paddle.io.DataLoader接口多线程异步加载数据。

Batchify性能详解：

到这里数据集筹备就全副实现了，下一步咱们须要组网并设计loss function。

2.2 模型构造

1.应用PaddleNLP一键加载预训练模型
以下我的项目以ERNIE为例，介绍如何将预训练模型多任务学习同时实现用意辨认和槽位填充工作。

本例中的用意辨认和槽位填充实质上是一个句子分类工作和一个序列标注工作。将两者的loss联合即可实现多任务学习。

    from src.models import JointErnie
    model = JointErnie.from_pretrained( 'ernie-1.0' , 
                               intent_dim=len(intent2id), 
                               slot_dim=len(slot2id), 
                               dropout=0.1, 
                               use_history=use_history)

2.设计loss function
JointErnie模型会取出ErnieModel的sequence_output接入一个输入维度为槽位类别数的线性层失去slot_logits，并将pooled_output接入一个输入维度为用意类别数的线性层失去intent_logit。

所以本示例中的loss由slot_loss和intent_loss两局部组成，咱们须要本人定义loss function。

槽位填充相当于在每个token的地位进行一次多分类工作，用意辨认相当于对整句话做一个多标签分类工作。所以设计的loss function如下：

#结构损失函数
class NLULoss(paddle.nn.Layer):
def __init__(self, pos_weight):
    super(NLULoss, self).__init__()

    self.intent_loss_fn = paddle.nn.BCEWithLogitsLoss(pos_weight=paddle.to_tensor(pos_weight))
    self.slot_loss_fct = paddle.nn.CrossEntropyLoss()

def forward(self, logits, slot_labels, intent_labels):
    slot_logits, intent_logits = logits

    slot_loss = self.slot_loss_fct(slot_logits, slot_labels)
    intent_loss = self.intent_loss_fn(intent_logits, intent_labels)

    return slot_loss + intent_loss

抉择网络结构后，咱们须要设置Fine-Tune优化策略。

2.3 设置Fine-Tune优化策略

实用于ERNIE/BERT这类Transformer模型的学习率为warmup的动静学习率。

动静学习率示意图

# 训练过程中的最大学习率
learning_rate = 3e-5 
# 训练轮次
epochs = 10
# 学习率预热比例
warmup_proportion = 0.0
# 权重衰减系数，相似模型正则项策略，防止模型过拟合
weight_decay = 0.0
max_grad_norm = 1.0
num_training_steps = len(train_data_loader) * epochs
# 学习率衰减策略
lr_scheduler = paddlenlp.transformers.LinearDecayWithWarmup(learning_rate, num_training_steps,warmup_proportion)

decay_params = [
p.name for n, p in model.named_parameters()
    if not any(nd in n for nd in ["bias", "norm"])
]
# 定义优化器
optimizer = paddle.optimizer.AdamW(
learning_rate=lr_scheduler,
parameters=model.parameters(),
weight_decay=weight_decay,
apply_decay_param_fun=lambda x: x in decay_params,
grad_clip=paddle.nn.ClipGradByGlobalNorm(max_grad_norm))

当初万事俱备，咱们能够开始训练模型。

2.4 模型训练与评估

模型训练的过程通常有以下步骤：

从dataloader中取出一个batch data；
将batch data喂给model，做前向计算；
将前向计算结果传给损失函数，计算loss；
loss反向回传，更新梯度。反复以上步骤。

每训练一个epoch后，程序对调用evaluation()办法别离计算两个工作的F1 score。

入手试一试

是不是感觉很乏味呀。小编强烈建议初学者参考下面的代码亲手敲一遍，因为只有这样，能力加深你对代码的了解呦。

本次我的项目对应的代码：

https://aistudio.baidu.com/aistudio/projectdetail/2017202

更多PaddleNLP信息，欢送拜访GitHub点star珍藏后体验：

https://github.com/PaddlePaddle/PaddleNLP

百度AI开发者社区https://ai.baidu.com/forum ，为全国各地开发者提供一个交换、分享、答疑解惑的平台，让开发者在研发路上不再“孤军奋战”，通过一直地交换与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开辟利用场景，赶快退出百度AI社区，你对 AI 的所有畅想，在这里都能够实现！

扫描下方二维码，增加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~

推荐阅读

io
CCF 100w+奖池大赛启动！百度高级工程师带你玩转NLP 、CV赛题！

2021年大数据与AI领域年度盛事——第九届CCF大数据与计算智能大赛已开赛近一个月，你的队伍是否已荣登top榜！百度发布NLP领域“千言-问题匹配鲁棒 ... [详细]

蜡笔小新 2024-09-28 11:59:18
utf-8
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
utf-8
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
utf-8
华为200万年薪招聘AI应届生——有多少本事，给多少钱

据新浪科技报道，阿里AIlabs年薪百万美元引进两位科学家。除AI顶尖科学家外，华为也是为多位AI应届博士开出了200万的高价年薪。19年9月，各大互联招聘企业陆续发布2019年人 ... [详细]

蜡笔小新 2023-10-11 14:19:53
utf-8
PaddleX全流程开发工具公开邀测啦！

产业智能化升级的浪潮并没有因为疫情等原因停滞不前，作为带来人工智能应用井喷式发展的深度学习技术在近几年也可谓是“时代宠儿”，想要尝试应用深度学习技术解决 ... [详细]

蜡笔小新 2023-10-09 23:10:46
utf-8
本周AI热点回顾：和欧阳娜娜一起搞研发？强大的神经网络新算子involution，超越卷积、自注意力机制！...

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们01我和欧阳娜娜一起搞研发AI新闻播报，开车明星导航，现如今根据文本生成语音的AI技术 ... [详细]

蜡笔小新 2023-10-09 19:54:32
utf-8
六个接私活的平台，技术在手，财富自由！值得推荐给每一位专业人士！

本文将介绍六个适合专业人士接私活的平台，帮助技术人才实现财富自由。这些平台不仅提供了丰富的项目机会，还为用户搭建了高效的合作桥梁，是每位技术人士不容错过的资源。 ... [详细]

蜡笔小新 2024-10-30 15:15:44
function
MVVM架构~mvc,mvp,mvvm大话开篇

返回目录百度百科的定义：MVP是从经典的模式MVC演变而来，它们的基本思想有相通的地方：ControllerPresenter负责逻辑的处理，Model提供数据，View负责显示。作为一种新的模 ... [详细]

蜡笔小新 2024-10-30 09:25:56
utf-8
Django框架进阶教程：掌握Ajax请求的基础知识与应用技巧

本教程深入探讨了Django框架中Ajax请求的核心概念与实用技巧，帮助开发者掌握异步数据交互的方法，提升Web应用的响应速度和用户体验。通过实例解析，详细介绍了如何在Django项目中高效实现Ajax请求，涵盖从基础配置到复杂场景的应用。 ... [详细]

蜡笔小新 2024-10-28 17:50:02
const
深入解析 Unity URP/SRP 渲染管线：匠心打造的全面指南

本文深入探讨了Unity中的URP、SRP和HDRP渲染管线，详细解析了它们之间的关系及各自的特点。首先介绍了SRP的基本概念及其在Unity渲染架构中的作用，随后重点阐述了URP和HDRP的设计理念与应用场景。文章还分析了SRP诞生的背景，解释了为何Unity需要引入这一灵活的渲染框架，以满足不同项目的需求。通过对比URP和HDRP，读者可以更好地理解如何选择合适的渲染管线，以优化项目的性能和视觉效果。 ... [详细]

蜡笔小新 2024-10-28 09:54:14
web
链游未来前景广阔，潜力无限

链游未来前景广阔，潜力无限 ... [详细]

蜡笔小新 2024-10-25 21:37:56
function
如何在 Node.js 中高效管理和优化通用实例对象（如 Redis）的使用？

如何在 Node.js 中高效管理和优化通用实例对象（如 Redis）的使用？ ... [详细]

蜡笔小新 2024-10-22 17:01:23
ip
百度AI的2020

百度AI的2020-世界的2020，是充满不确定性的变局之年；中国的2020，是团结一心、共克时艰、于变局中开新局的希望之年；百度AI的2020，是坚定信念，拥抱变化，践行“科技为 ... [详细]

蜡笔小新 2023-10-10 21:47:29
function
词表|句子_自然语言处理（NLP）基于序列到序列的中英机器翻译

篇首语：本文由编程笔记#小编为大家整理，主要介绍了自然语言处理（NLP）基于序列到序列的中-英机器翻译相关的知识，希望对你有一定的参考价值。【自然语言处理&#x ... [详细]

蜡笔小新 2023-10-10 10:04:54
function
从信息流推荐到控制领域百度PaddlePaddle技术能力再升级

人工智能技术越来越广泛的应用于各行各业，而这一切都离不开底层深度学习框架的支持。近日，百度深度学习P ... [详细]

蜡笔小新 2023-09-25 12:35:43

黑m泽猫咪2009

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章