当前位置: 开发笔记 > 程序员 > 正文

参数估计：最大似然估计、贝叶斯估计与最大后验估计

作者：rui1大姑娘_939 | 来源：互联网 | 2023-05-19 14:58

简介：在概率统计中有两种主要的方法：参数统计和非参数统计（或者说参数估计和非参数估计）。其中，参数估计是概率统计的一种方法。主要在样本知道情况下，一般知道或假设样本服从某种

简介：

在概率统计中有两种主要的方法：参数统计和非参数统计（或者说参数估计和非参数估计）。其中，参数估计是概率统计的一种方法。主要在样本知道情况下，一般知道或假设样本服从某种概率分布，但不知到具体参数（或者知道具体模型，但不知道模型的参数）。参数估计就是通过多次试验，观察其结果，利用结果推出参数的大概值。（当你推出参数的极大可能值时，就相当于知道了分布及其参数情况，就可以利用它来推测其他样例出现的概率了。这属于应用了）

参数估计的方法有多种，这里我们分析三种基于概率的方法，分别是最大似然估计（Maximum Likelihood）、贝叶斯估计（Bayes）和最大后验估计（Maximum a posteriori）。我们假设我们观察的变量是 $x$ ，观察的变量取值（样本）为，要估计的参数是， $x$ 的分布函数是（我们用条件概率来显式地说明这个分布是依赖于取值的）。实际中， $x$ 和都可以是几个变量的向量，这里我们不妨认为它们都是标量（theta若是标量求导，若是向量求偏导）。这里的p(x|θ)可以是高斯分布或其他分布。

最大似然估计 Maximum Likelihood (ML)

“likelihood/似然”的意思就是“事件（即观察数据）发生的可能性”，最大似然估计就是要找到的一个估计值，使“事件发生的可能性”最大，也就是使最大。一般来说，我们认为多次取样得到的 $x$ 是独立同分布的（iid），这样

由于一般都比较小，且N一般都比较大，因此连乘容易造成浮点运算下溢，所以通常我们都去最大化对应的对数形式

具体求解释时，可对右式对求导数，然后令为0，求出值即为。

这时一般知道具体的分布，再加上参数theta，然后可以用含theta的式子表示每一次（独立的）出现的概率。这样L(theta）就是一个含theta参数的式子，最后求导（或偏导），解方程（组）就OK了。

注意：最大似然把待估的参数看做是确定性的量，只是其取值未知。最佳估计就是使得产生以观测到的样本的概率最大的那个值。

该估计是最大可能性估计，但不是无偏估计。

最大似然估计属于点估计，只能得到待估计参数的一个值。(1) 但是在有的时候我们不仅仅希望知道，我们还希望知道取其它值得概率，即我们希望知道整个在获得观察数据后的分布情况. (2) 最大似然估计仅仅根据（有限的）观察数据对总体分布进行估计，在数据量不大的情况下，可能不准确。例如我们要估计人的平均体重，但是抽样的人都是小孩，这样我们得到的平均体重就不能反映总体的分布，而我们应该把“小孩之占总人口20%”的先验考虑进去。这时我们可以用贝叶斯方法。

贝叶斯估计 Bayes

使用Bayes公式，我们可以把我们关于的先验知识以及在观察数据结合起来，用以确定的后验概率：

其中是累积因子，以保证和为1。要使用Bayes方法，我们需有关于的先验知识，即不同取值的概率。比如表示下雨，表示不下雨，根据以往的经验我们大体上有、，在这种知识不足的时候，可以假设是均匀分布的，即取各值的概率相等。

在某个确定的取值下，事件x的概率就是，这是关于的函数，比如一元正态分布。与上一节中的一样，我们认为各次取样是独立的，可以分开来写，这样我们就可以得到的一个表达式，不同的对应不同的值。

根据获得的，我们边可以取使其最大化的那个取值，记为。可能有人已经看出问题来了：我们做了很多额外功，为了求得一个，我们把取其它值的情况也考虑了。当然在有的时候分布是有用的，但是有的时候我们取并不需要知道，我们只要那个。最大后验估计这个时候就上场了。

备注：贝叶斯估计则把待估计的参数看成是符合某种先验概率分布的随机变量。对样本进行观测的过程，就是把先验概率密度转化为后验概率密度，这样就利用样本的信息修正了对参数的初始估计值。在贝叶斯估计中，一个典型的效果就是，每得到新的观测样本，都使得后验概率密度函数变得更加尖锐，使其在待估参数的真实值附近形成最大的尖峰。

最大后验估计 MAP

最大后验估计运用了贝叶斯估计的思想，但是它并不去求解，而是直接获得。从贝叶斯估计的公式可以看出， $Z_D$ 是与无关的，要求得使最的的，等价于求解下面的式子：

与最大似然估计中一样，我们通常最大化对应的对数形式：

这样，我们便无需去计算，也不需要求得具体的部分，便可以得到想要的。

和最大似然很相似，也是假定参数未知，但是为确定数值。只是优化函数为后验概率形式，多了一个先验概率项。

区别与总结：

区别：而贝叶斯估计和二者最大的不同在于，假定参数也是随机变量，不是确定值。在样本分布D上，计算参数所有可能的情况，并通过基于参数期望，计算类条件概率密度。

也就是说贝叶斯估计不是想极大似然估计那样找到使观测到的样本的概率最大的那个参数值。而是找到所有可能的参数值及其相应的可信值（暂且怎么称呼吧）。这样你就可以知道不同参数值的可信程度。例如：①有三个分别为0.8,0.05,0.05; 则决然的选最大的0.8。例如②三个参数值的可信值为0.4,0.39， 0.39；则选第一个参数值就要慎重了。

但是，当参数分布为尖峰（如例①），且该参数对应样本分布比较平坦时，极大似然近似于贝叶斯。

总结：

三种方法各有千秋，使用于不同的场合。当对先验概率的估计没有信心，可以使用最大似然估计（当然也可以使用其它两种）。贝叶斯估计得到了后验概率的分布，最大似然估计适用于只需要知道使后验概率最大的那个。总体上，极大似然计算简单，而贝叶斯在某些特殊情况下，效果好于极大似然。

另外一方面，我们可以感觉到，最大似然估计和Bayes/MAP有很大的不同，原因在于后两种估计方法利用了先验知识，如果利用恰当，可以得到更好的结果。其实这也是两大派别（Frequentists and Bayesians)的一个区别。

最后附上一张参数估计与非参数估计的对比图：

参考文献：

http://guangchun.wordpress.com/2011/10/13/ml-bayes-map/

图片版：

因为该死的blog居然不支持latex公式编辑，导致公式显示不出来，下面是图片版

图片

推荐阅读

图片
C语言初学者指南：利用二维数组与结构体实现贪食蛇游戏

本文面向非计算机专业背景的编程爱好者，介绍如何仅使用基础的C语言知识——二维数组和结构体，无需掌握复杂的数据结构如链表，即可编写一款经典的贪食蛇游戏。通过本教程，您将了解游戏开发的基本原理和实现方法。 ... [详细]

蜡笔小新 2024-11-27 18:05:55
图片
iOS 开发技巧：实现高效高斯模糊背景

本文基于前文的内容，进一步探讨如何在 iOS 应用中高效地实现高斯模糊背景效果。我们将通过具体代码示例，展示如何利用 Swift 和 UIKit 创建具有毛玻璃效果的界面背景。 ... [详细]

蜡笔小新 2024-11-27 16:58:10
图片
探索HTML5：十五个关键的新特性

本文深入探讨了HTML5中十五个重要的新特性，为开发者提供了详细的指南。 ... [详细]

蜡笔小新 2024-11-26 19:09:22
login
帝国cms各数据表有什么用

CMS教程|帝国CMS帝国cmsCMS教程-帝国CMS精易编程助手源码,ubuntu桥接设置,500错误是tomcat吗,爬虫c原理,php会话包括什么,营销seo关键词优化一般多 ... [详细]

蜡笔小新 2024-11-26 18:27:32
图片
Mac环境下Python与MySQL交互指南

本文详细介绍了在Mac操作系统中使用Python连接MySQL数据库的方法，包括常见的错误处理及解决方案。 ... [详细]

蜡笔小新 2024-11-26 17:41:41
图片
CSS技巧：创建带有背景图的按钮

本文详细探讨了使用CSS创建带有背景图片的按钮的方法，并提供了具体的实例代码，帮助开发者解决实际开发中的相关问题。 ... [详细]

蜡笔小新 2024-11-26 16:48:44
图片
配置PicGo与Gitee结合Typora打造高效写作环境

本文详细介绍了如何通过PicGo和Gitee搭建个人图床，并结合Typora实现高效的文章撰写。包括创建图床项目、生成访问令牌、安装配置PicGo和Typora等步骤。 ... [详细]

蜡笔小新 2024-11-26 16:42:35
图片
jquery java 文件上传_jQuery文件上传

插件描述：这是一个文件上传的展示，看很多插件，并不满意就自己写了一个，可能兼容性不是很好，没有准确进行测试过& ... [详细]

蜡笔小新 2024-11-26 16:41:31
图片
精选Eclipse插件概览

本文介绍了多种Eclipse插件，包括XML Schema Infoset Model (XSD)、Graphical Editing Framework (GEF)、Eclipse Modeling Framework (EMF)等，涵盖了从Web开发到图形界面编辑的多个方面。 ... [详细]

蜡笔小新 2024-11-26 16:20:20
widget
Android图片轮播实现指南：利用ViewPager实现动态图片展示

本教程旨在指导开发者如何在Android应用中通过ViewPager组件实现图片轮播功能，适用于初学者和有一定经验的开发者，帮助提升应用的视觉吸引力。 ... [详细]

蜡笔小新 2024-11-26 14:14:30
图片
Backup Exec 11d 初学者使用心得与技巧

随着企业应用程序的不断扩展，数据备份的需求日益增加。本文通过介绍Symantec Backup Exec 11d的实际应用体验，旨在为初学者提供一些实用的操作指南和建议。 ... [详细]

蜡笔小新 2024-11-26 10:48:27
图片
利用SVG和CSS3打造简洁向上的箭头图标

在开发H5页面时，为了减少资源请求和简化工作流程，直接使用SVG和CSS3来创建简单的图形元素是一个高效的选择。本文将探讨如何不依赖于第三方图标库，仅通过HTML和CSS技术实现一个‘返回顶部’的图标。 ... [详细]

蜡笔小新 2024-11-25 23:39:34
图片
五分钟掌握高效算法：判断4的幂

深入探讨LeetCode上的一道经典算法题——判断一个整数是否为4的幂，提供高效解决方案。 ... [详细]

蜡笔小新 2024-11-25 20:51:26
图片
解决Bootstrap 4中按钮图标与文本对齐问题

在创建带有左侧图标的按钮时，遇到了文本与图标对齐的问题。本文提供了几种使用Bootstrap 4解决此问题的方法。 ... [详细]

蜡笔小新 2024-11-25 19:20:18
图片
提升手机性能的小技巧，轻松让手机焕然一新

通过几个简单的设置调整，可以显著提高手机的运行速度，让您的设备像刚买时一样流畅。 ... [详细]

蜡笔小新 2024-11-25 14:20:08

rui1大姑娘_939

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章