热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

从PGM到HMM再到CRF(self_note)

问:有一点不太明白想请教:MRF和CRF看起来好像就是p(x,y)和p(y|x)的差别,为什么他们两个模型的应用差距那么的大呢?MRF广泛运用在各种领域,CRF大部分都用的lin

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
问:
有一点不太明白 想请教:MRF和CRF看起来好像就是p(x,y)和p(y|x)的差别,为什么他们两个模型的应用差距那么的大呢?MRF广泛运用在各种领域,CRF大部分都用的linear

答:
忽略掉生成模型和判别模型的差别,如果只是给定了观测变量X要计算隐变量Y的概率话,而不需要生成一个新的样本的话,MRF和CRF确实是一样的。很多论文里用MRF,其实就是把MRF当成CRF用的,所以你说他们用的是MRF也行,说他们用的是general CRF也行。
Linear-Chain CRF的强势主要是在自然语言处理中的强势吧,因为句子是一个单词的序列嘛,自然是一维的线性结构(暂时不考虑语言中的从句等递归结构或者其他信息),不像图像那样是二维的,因此用不着general CRF。当然自然语言处理中也有用general CRF的,比如做命名实体识别,有一句话开头是Green,你不知道这是个人名“格林”还是“绿色”这个词放在句首所以要大写。但如果这句话后面又出现了一个首字母大写的Green,那就说明句首的Green很可能是个人名。所以可以除了在相邻单词之间连边外,再加上在同一个词的不同出现之间连边,这时图模型就有环了,变成了general CRF(这种叫skip-chain CRF)。
不过general CRF很难训练呀,图像处理里面的MRF很多都是形状规则的(格点形成一个矩形,近似推断的时候可以固定其他点每次求某一列或者某一行变量的marginal),而skip-chain CRF边的连接是不规则的,不同的句子的图里面环的个数和大小都可能不一样,这就很麻烦了。(当然图像处理的时候也有的用超像素把相似节点合并,这时候MRF的训练就很麻烦了)加上也没有什么特别成熟的工具包来做skip-chain CRF的推断(印象中CRF++和CRFSuite都只能处理LC-CRF),研究这个的人也就很少了。要建模那些复杂的递归或者引用关系的话,用CRF那么复杂,现在大家都改用神经网络了,比如LSTM,反正Keras搭个神经网络也就几十行代码都不到,很快的。
——摘自知乎https://www.zhihu.com/people/SeptEnds/answers的回答。


推荐阅读
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 原文地址:https:www.cnblogs.combaoyipSpringBoot_YML.html1.在springboot中,有两种配置文件,一种 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
author-avatar
初升的太阳1866
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有