当前位置: 开发笔记 > 编程语言 > 正文

NLP如何理解隐马尔可夫求解过程？

作者：mobiledu2502880517 | 来源：互联网 | 2023-07-22 15:14

文章目录一、引言二、模型引入1、为了模型的使用做如下假设2、模型图概览3、分析三、实战预测一、引言HMM对于自然语言处理和语音识别等方面有着重大意义，其三个经典问题

文章目录

- 一、引言
- 二、模型引入
- - 1、为了模型的使用做如下假设
  - 2、模型图概览
  - 3、分析
- 三、实战预测

一、引言

HMM对于自然语言处理和语音识别等方面有着重大意义&＃xff0c;其三个经典问题

在已知序列的情况下推理出隐藏序列
参数估计
计算可能序列的边缘概率

在诸多文章中被提及&＃xff0c;但是对于如何求解却很少提及&＃xff01;
本文主要通过一个简单的小例子说明如何在已知序列的情况下推理出隐藏序列 。

二、模型引入

1、为了模型的使用做如下假设

观测序列和隐含序列有关系
序列符合马尔科夫过程

2、模型图概览

3、分析

隐含序列范围 :state $ϵ\epsilon$ [a,b,c]
观测序列范围 :observe $ \epsilon$ [1,2,3]

为了根据观测序列求出隐含的序列&＃xff0c;必须求出三个参数&＃xff0c;分别如下

参数1&＃xff1a; $π\pi$

$π\pi$ :表示隐含序列每一位的为序列开头的概率&＃xff0c;比如有4个序列
a,b,c
a,c,c
b,a,c
c,a,b
如序列a,b,c的初始概率 $π&＃61;[24,14,14]&＃61;[0.5,0.25,0.25]\pi&＃61;[\frac{2}{4},\frac{1}{4},\frac{1}{4}]&＃61;[0.5,0.25,0.25]$

参数2&＃xff1a;隐含序列之间的转移概率矩阵 $t r a n s P$

仍以状态a,b,c的序列为例,a->a转移了0次&＃xff0c;a->b转移了2次…

	a	b	c
a	0	2	2
b	1	0	1
c	1	0	1

那么 $t r a n s P$ 为&＃xff1a;

	a	b	c
a	0	0.5	0.5
b	0.5	0	0.5
c	0.5	0	0.5

参数3&＃xff1a;隐含序列到观测序列的发射概率矩阵 $e m i t P$

如隐含序列和观测序列的对应关系如下&＃xff1a;
a,b,c->1,2,3
a,c,c->1,3,2
b,a,c->2,2,3
c,a,b->1,1,2
a->1发射了3次&＃xff0c;a->2发射了1次…

	1	2	3
a	3	1	0
b	0	3	0
c	1	1	2

那么 $e m i t P$ 为&＃xff1a;

	1	2	3
a	0.75	0.25	0
b	0	1	0
c	0.25	0.25	0.5

到此为止模型的三个参数处理完毕&＃xff0c;根据三个参数&＃43;维特比算法就可以根据输入值求出预测值&＃xff0c;比如输入一个序列 2,1,1&＃xff0c;那么需要计算的表格是

	a	b	c
2	$p(a∥2)&＃61;π[a]∗emitP[a][2]p(a\\|2)&＃61;\pi[a]*emitP[a][2]$	$p(b∥2)&＃61;π[b]∗emitP[b][2]p(b\\|2)&＃61;\pi[b]*emitP[b][2]$	$p(c∥2)&＃61;π[c]∗emitP[c][2]p(c\\|2)&＃61;\pi[c]*emitP[c][2]$
1	$p(a∥1)&＃61;max(transP[a][a]∗emitP[a][1]∗p(a∥2),transP[b][a]∗emitP[a][1]∗p(b∥2),transP[c][a]∗emitP[a][1]∗p(c∥2))p(a\\|1)&＃61;max(transP[a][a]emitP[a][1]p(a\\|2),transP[b][a]emitP[a][1]p(b\\|2),transP[c][a]emitP[a][1]p(c\\|2))$	…	…
1	…	…	…

在首行&＃xff0c;根据初始概率和发射概率进行初始化
首先计算序列2,1,1的首位2的状态有可能是a,b,c的概率 $p (a ∣ 2) 、 p (b ∣ 2) 、 p (c ∣ 2)$
首位的影响因素为两个&＃xff0c;一个是a,b,c分别为首的概率&＃xff0c;一个是隐含状态a,b,c可能生成观测值1,2,3的概率&＃xff0c;那么

$p (a ∣ 2) &＃61; p (a 为首位) * p (a 发射程 2)$

从第二行开始&＃xff0c;使用发射概率和来自有状态转移的最大概率进行概率填充&＃xff0c;并记录最大概率来自方状态确定路径,特别说明一下&＃xff08;以 $p (a ∣ 1)$ 为例&＃xff09;&＃xff1a;

$p (a ∣ 1) &＃61; M a x ($
$t r a n s P [a] [a] * e m i t P [a] [1] * p (a ∣ 2),$
$t r a n s P [b] [a] * e m i t P [a] [1] * p (b ∣ 2),$
$t r a n s P [c] [a] * e m i t P [a] [1] * p (c ∣ 2)$
$)$

$p (a ∣ 1)$ 表示在观测值为1的条件下隐含状态为a的概率&＃xff0c;在此不仅要考虑a发射为1的概率&＃xff0c;还要考虑上一个状态a,b,c转移为a的概率&＃xff0c;基于动态规划的思想&＃xff0c;确保局部路径最优&＃xff0c;还要考虑上一个状态的最终概率

三、实战预测

安装环境

pip install hmmlearn

根据二的方法计算模型参数
导入hmmlearn

from hmmlearn import hmm

模型求解

model&＃61;hmm.MultinomialHMM(n_components&＃61;隐含状态数量) model.startprob_&＃61;startP model.transmat_&＃61;tranP model.emissionprob_&＃61;emitP 预测结果&＃61;model.predict(输入序列.reshape(-1,1))

本文如果有什么错误还望大神指正&＃xff01;

推荐阅读

get
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
express
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
python
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42
python
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
python
Python操作MySQL（pymysql模块）详解及示例代码

本文介绍了使用Python操作MySQL数据库的方法，详细讲解了pymysql模块的安装和连接MySQL数据库的步骤，并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作，帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]

蜡笔小新 2023-12-10 17:50:06
python
开源Keras Faster RCNN模型介绍及代码结构解析

本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]

蜡笔小新 2023-12-10 17:44:07
python
Python程序安全运行的三个条件及预防措施

Python已成为全球最受欢迎的编程语言之一，然而Python程序的安全运行存在一定的风险。本文介绍了Python程序安全运行需要满足的三个条件，即系统路径上的每个条目都处于安全的位置、"主脚本"所在的目录始终位于系统路径中、若python命令使用-c和-m选项，调用程序的目录也必须是安全的。同时，文章还提出了一些预防措施，如避免将下载文件夹作为当前工作目录、使用pip所在路径而不是直接使用python命令等。对于初学Python的读者来说，这些内容将有所帮助。 ... [详细]

蜡笔小新 2023-12-09 10:20:23
python
协程greenletyieldasyncioasync / await协程意义异步编程事件循环快速上手awaitTask对象

本文介绍了协程的概念和意义，以及使用greenlet、yield、asyncio、async/await等技术实现协程编程的方法。同时还介绍了事件循环的作用和使用方法，以及如何使用await关键字和Task对象来实现异步编程。最后还提供了一些快速上手的示例代码。 ... [详细]

蜡笔小新 2023-12-09 01:35:03
python
【疑难杂症】allennlp安装报错：Installing build dependencies ... error

背景：配置PURE的算法环境，安装allennlp0.9.0（pipinstallallennlp0.9.0）报错ÿ ... [详细]

蜡笔小新 2023-10-17 16:20:30
python
ReactJS UI Ant 设计空组件

ReactJSUIAnt设计空组件原文:https://w ... [详细]

蜡笔小新 2023-10-16 22:08:13
python
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
copy
python结构化程序设计风格_Python自然语言处理04 编写结构化程序

前言4.1回到基础赋值(略)barfoo[:]copy.deepcopy()等式(略)is条件语句ifelifall()any()4.2序列字符串链表元组序列类型上的操作表4-1P ... [详细]

蜡笔小新 2023-10-13 16:40:29
copy
顶尖AI技术人才稀缺，在校生还能追上这波浪潮吗？

作为机器学习最重要的一个分支，近年来深度学习(DeepLearning)发展势头迅猛，借助庞大的数据 ... [详细]

蜡笔小新 2023-10-12 16:30:34
copy
微信民众号商城/小顺序商城开源项目介绍及使用教程

本文介绍了一个基于WeiPHP5.0开发的微信民众号商城/小顺序商城的开源项目，包括前端和后端的目录结构，以及所使用的技术栈。同时提供了项目的运行和打包方法，并分享了一些调试和开发经验。最后还附上了在线预览和GitHub商城源码的链接，以及加入前端交流QQ群的方式。 ... [详细]

蜡笔小新 2023-12-09 08:45:47
require
webpack二刷之二、loader资源模块加载器

loader资源模块加载器webpack资源模块加载webpack内部(内部loader)默认只会处理javascript文件，也就是说它会把打包过程中所有遇到的 ... [详细]

蜡笔小新 2023-10-17 21:26:42

mobiledu2502880517

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章