概率与期望动态规划的深入探讨与应用分析

作者：望天打股 | 来源：互联网 | 2024-11-04 12:57

本文深入探讨了概率与期望动态规划的基本原理及其在实际问题中的应用。概率是指某一事件发生的可能性大小，用P(A)表示。若某一事件的所有可能结果共有n种，且每种结果出现的概率相等，而事件A包含其中的m种结果，则该事件的概率P(A)为m/n。例如，在投掷骰子的情况下，如果事件A定义为掷出偶数点，由于共有3种偶数点（2、4、6），而总共有6种可能的结果，因此P(A)为1/2。文章进一步分析了概率与期望动态规划在复杂场景下的建模方法和求解策略，并通过具体实例展示了其在决策优化和风险管理中的应用价值。

概率与期望dp

概率

某个事件A发生的可能性的大小，称之为事件A的概率，记作P(A)。

假设某事的所有可能结果有n种，每种结果都是等概率，事件A涵盖其中的m种，那么P(A)=m/n。

例如投掷一枚骰子，点数小于3的概率为2/6=1/3。

如果两个事件A和B所涵盖的结果没有交集，那么P(A或B发生)=P(A)+P(B)

还是掷骰子

P(点数小于3或点数大于4)=2/6+2/6=2/3

如果A和B所涵盖的结果有交集

那么P(A或B发生)=P(A)+P(B)-P(A与B同时发生)

P(点数小于3或点数为偶数)=2/6+3/6-1/6=2/3

记事件B为“事件A不发生”

那么P(A)+P(B)=1，即P(B)=1-P(A)

P(点数不小于3)=1-2/6=2/3

在两个互不干扰的事中，事件A在其中一件事中，事件B在另外一件事中

那么P(A与B同时发生)=P(A)*P(B)

掷两个骰子， P(第一个点数小于3且第二个点数为偶数)=(2/6)×(3/6)=1/6

期望

事件A有多种结果，记其结果的大小为x，那么x的期望值表示事件A的结果的平均大小，记作E(x)。

E(x)=每种结果的大小与其概率的乘积的和。

例如，记掷一枚骰子的点数为x

E(x)=1*(1/6)+2*(1/6)+3*(1/6)+4*(1/6)+5*(1/6)+6*(1/6)=7/2

若c为常数，那么：

E(x+c)=E(x)+c， E(c*x)=c*E(x)

E(x+c)=(1+c)*(1/6)*……*(6+c)*(1/6);

记两个事件的结果分别为x,y

E(x+y)=E(x)+E(y)

例如： E(语文成绩+数学成绩)=E(语文成绩)+E(数学成绩)

可以举一个例子证明是正确的;

若两个事件互相独立， E(x*y)=E(x)*E(y)

E(语文成绩*数学成绩)=E(语文成绩)*E(数学成绩)

概率与期望的计算有一个共同的计算技巧：

若事件所产生的所有方案都是等概率的，那么一些概率与期望即可转化为一个计数问题，算出后再除以总方案数即可。

如求事件符合条件A的概率，则转化为对符合A的方案数的计数问题；若求方案的价值的期望值，则转化为所有方案的价值总和的计数问题。

解释：E（x）=case1*p1+case*p2+case3*p3……+casen*pn,因为是等概率问题，p1=p2=……=pn，因此我们可以把所有case值加起来然后再*p;

概率和期望的计算

概率与期望的计算也经常用的其加法和乘法规则。

尤其是期望的加法规则，在期望的计算中十分常用。 如求最大值与最小值之差的期望，则分别求二者的期望值再作差即可。

乘法规则时，要注意事件是否互相独立

概率与期望还可以通过列方程的方法计算。

有4张卡片，写着0,1,2,3，每次抽出一张并放回，反复抽，抽出0为止。问抽取的次数的期望值。

设抽取次数为x，则：

x=1+x*3/4

x=4

1表示第一次一定需要抽一次，然后对于一个状态，有1/4概率抽到0，那么继续抽取的次数是0，因此为1/4*0，有3/4的概率抽到其余的，需要继续抽，此时期望还是x个，所以就是3/4*x

技术分享图片

就差不多↑的感觉

BZOJ1867 钉子和小球

技术分享图片

n<=50；

比较简单的概率dp

如果某一个的钉子(x,y)不见了，那么小球垂直下落，就转移到了(x+2,j+1);

设$f[i][j]$为小球经过第i行第j列的概率。

$f[1][1]=1 $（即起状态概率为1

$f[i][j]=f[i-1][j-1] * [(i-1,j-1)有钉子]*1/2 +f[i-1][j] * [(i-1,j)有钉子]*1/2 +f[i-2][j-1] * [(i-2,j-1)没有钉子]$

$[(i-1,j-1)有钉子]$可以看做一个bool的0/1数组，有钉子为1，没钉子为0；

至于分数输出，自定义分数数据类型并用gcd化简分数即可。

Bzoj5004 开锁魔法II

有 n 个箱子，每个箱子里有且仅有一把钥匙，每个箱子有且仅有一把钥匙可以将其打开。现在随机打开 m 个箱子，求能够将所有箱子打开的概率。

100组数据， k<=n<=300。

总方案数C~n~^m^

题目约定了每个点的入度和出度均为1，因此最终的图一定是若干个环。每个环都至少选择一个点即可满足要求。求概率，实际上就是求方案数，最后再除以总方案数即可。

预处理出每个环的点数 c[i] 以及其后缀和 sum[i] 。

设$ f[i][j] $表示前 i 个环中选出 j 个点，满足最终条件每个环都选的方案数。初始化$ f[0][0]=1$ 。

枚举 i 和前 i 个环选的点数 j 、第 i 个环选的点数 k

可得$f[i][j]=\sum\limits_{k=1}^{c[i]}f[i-1][j-k]*C^k_{c[i]}$

BZOJ5091 摘苹果

在花园中有n棵苹果树以及m条双向道路，每条道路的两端连接着两棵不同的苹果树。假设第i棵苹果树连接着di条道路。小Q将会按照以下方式去

采摘苹果：

1.随机移动到一棵苹果树下，移动到第i棵苹果树下的概率为di/2m，但不在此采摘。

2.重复以下操作k次：等概率随机选择一条与当前苹果树相连的一条道路，移动到另一棵苹果树下，假设当前位于第i棵苹果树下，则他会采摘ai个苹果，多次经过同一棵苹果树下会重复采摘。

请计算小Q期望摘到多少苹果。 n,k<=100000,m<=200000

首先证明这是等概率事件：

设$f[i][j]$表示进行了i次操作走到j的概率，易知$f[0][j]=\frac{dj}{2m}$（从哪个点开始摘1）

然后考虑转移：第一步从起点走与起点相连的每一条边的概率都是$\frac{1}{d_j}$

然后对于整个图来说，第一步走每条边的概率就是第0步（1操作）选择这个点的概率*$\frac{1}{d_j}$，也就是$\frac{d_j}{2m} * \frac{1}{d_j}=\frac{1}{2m}$

于是$f[1][j]=\sum\limits_{(u,j)∈e}\frac{1}{2m}=\frac{d_j}{2m}$

同理：$f[i][j]=\sum\limits_{(u,j)∈e}\frac{1}{2m}=\frac{d_j}{2m}$

此时概率相同了。

$E(x_1+x_2+……+x_n)=\sum\limits_{i=1}^nE(x_i)=\sum\limits_{i=1}^n\sum\limits_{j=1}^kx_i*f[j][i]*a_i$ 技术分享图片

（依照定义还是比较好想的）其中xi表示是否在第i棵苹果树下0/1显然0的情况舍弃；

还有一步化简但是并不想写w

BZOJ4832 抵制克苏恩

你有一个英雄和若干奴隶主，对方每次攻击会从你的英雄和奴隶主中随机选一个造成一点伤害。奴隶主受到攻击后，体力为0则死亡，否则若场上奴隶主少于7个，则召唤一个3点血量的奴隶主。

有T局游戏，每局给出初始奴隶主的数量(<=7)和血量(<=3)，给出k，求对方攻击k次后你的英雄受到的总伤害值的期望。

T<=100， k<=50。

设$f[i][a][b][c]$表示还要进行i轮攻击，三种血量的奴隶主数量分别为a(血量为1)b(血量2)c(血量3)时，接下来英雄受到的期望总伤害。

设当前共有s=a+b+c个人，那么有1/s的概率打到英雄，a/s的概率打到血量为1的人，b/s的概率打到血量为2的人，c/s的概率打到血量为3的人。

咋的要这样设计状态倒着dp

打到英雄$f[i-1][a][b][c]+=(f[i][a][b][c]+1)*\frac{1}{s+1};$

打到a $f[i-1][a-1][b][c/c+1]+=f[i][a][b][c]*\frac{a}{s+1};$ 此处c考虑奴隶主数是否<7

打到b $f[i-1][a+1][b-1][c/c+1]+=f[i][a][b][c]*\frac{b}{s+1}$ 此处c考虑奴隶主数是否<7

打到c $f[i-1][a][b+1][c-1/c]+=f[i][a][b][c]*\frac{c}{s+1}$ 此处c考虑奴隶主数是否<7

NOIP2016 换教室

小A的学校可以视为一个v个点的无向图，他有n门课程要按顺序上课，其中第i门课程要在节点ai进行，但还有一个备选地点bi。

现在小A有m个申请机会，若申请第i门课，那么将有ki的概率使课程搬到bi进行。每门课最多申请一次，而且要在全部申请完成后才知道是否成功，m次机会不必全部用完。他如何申请才能最小化在上课地点间移动的距离的期望值。求该期望值。

v<=300， n,m<=2000

f[i][j][0/1]表示前i个课程申请了j次，且第i个是否申请时的最小期望值。

$f[i][j][0]=Min(f[i-1][j][0]+dis(a[i-1],a[i]) ,

f[i-1][j][1]+k[i-1]dis(b[i-1],a[i])+(1-k[i-1])dis(a[i-1],a[i])) $

$f[i][j][1]=Min(f[i-1][j-1][0]+dis(a[i-1],b[i])*k[i]+(1-k[i])*dis(a[i-1],a[i]),\\f[i-1][j-1][1]+dis(b[i-1],b[i])*k[i]*k[i-1]+dis(a[i-1]*b[i])*(1-k[i-1])*k[i]\\+dis(b[i-1],a[i])*k[i-1]*(1-k[i])+dis(a[i-1],a[i])*(1-k[i-1])*(1-k[i]));$

时间复杂度O(v^3+nm)

BZOJ1076 奖励关

有n轮游戏和m种宝物，每种宝物有分数Pi（可以为负），每轮游戏会等概率抛出一种宝物，你可以选择吃或不吃。第i种宝物还有一个限制集合Si，表示只有在Si中的宝物都吃过后，才能吃第i种宝物。

求最优策略下的期望得分。

n<=100， m<=15

设$f[i][S]$为还剩下i轮游戏，吃过的宝物集合为S时，接下来能得到的最大期望得分。

==s=--i--

然后同样是倒着搞，最后答案就是当前一轮游戏都没进行，吃过的宝物为0的情况$f[n][0]$；初始状态是$f[0][S]$其中S是全集；

然后枚举第n-i轮游戏是不是吃了宝物；

如果没吃，显然第n-i轮和第n-i+1轮的结果相同，即$f[i][S]=f[i-1][S]$

如果吃了宝物，那么显然第n-i+1轮就多了一个宝物，又因为倒着转移，所以第n-i+1轮的结果要并上第n-i轮吃掉的宝物k，并且加上这个宝物的分数。即\(f[i][S]=f[i-1][S|(i<

合起来：\(f[i][S]=max\{f[i-1][S],f[i-1][S|(i<

网络题解：

技术分享图片

推荐阅读

jsp
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
jsp
深入理解 Oracle 存储函数：计算员工年收入

本文介绍如何使用 Oracle 存储函数查询特定员工的年收入。我们将详细解释存储函数的创建过程，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 09:49:42
jsp
2018回顾与2019展望

本文总结了2018年的关键成就，包括职业变动、购车、考取驾照等重要事件，并分享了读书、工作、家庭和朋友方面的感悟。同时，展望2019年，制定了健康、软实力提升和技术学习的具体目标。 ... [详细]

蜡笔小新 2024-12-28 09:10:26
jsp
四载相伴，与51CTO学院共成长

在计算机技术的学习道路上，51CTO学院以其专业性和专注度给我留下了深刻印象。从2012年接触计算机到2014年开始系统学习网络技术和安全领域，51CTO学院始终是我信赖的学习平台。 ... [详细]

蜡笔小新 2024-12-28 08:20:07
jsp
CSS 布局：液态三栏混合宽度布局

本文介绍了如何使用 CSS 实现液态的三栏布局，其中各栏具有不同的宽度设置。通过调整容器和内容区域的属性，可以实现灵活且响应式的网页设计。 ... [详细]

蜡笔小新 2024-12-28 02:40:28
install
Linux 系统启动故障排除指南：MBR 和 GRUB 问题

本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案，涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]

蜡笔小新 2024-12-27 20:40:29
jsp
通过类型和标签选择元素

本文介绍了如何使用jQuery根据元素的类型（如复选框）和标签名（如段落）来获取DOM对象。这有助于更高效地操作网页中的特定元素。 ... [详细]

蜡笔小新 2024-12-27 19:44:14
command
Xcode 中多行代码缩进技巧

本文介绍如何在 Xcode 中使用快捷键和菜单命令对多行代码进行缩进，包括右缩进和左缩进的具体操作方法。 ... [详细]

蜡笔小新 2024-12-27 17:52:34
jsp
在Linux系统中配置并启动ActiveMQ

本文详细介绍了如何在Linux环境中安装和配置ActiveMQ，包括端口开放及防火墙设置。通过本文，您可以掌握完整的ActiveMQ部署流程，确保其在网络环境中正常运行。 ... [详细]

蜡笔小新 2024-12-27 14:38:54
jar
使用Windows批处理脚本监控并重启Java应用程序

本文介绍如何通过Windows批处理脚本定期检查并重启Java应用程序，确保其持续稳定运行。脚本每30分钟检查一次，并在需要时重启Java程序。同时，它会将任务结果发送到Redis。 ... [详细]

蜡笔小新 2024-12-27 10:44:39
jsp
从JDE系统中提取完整字典数据

本文介绍如何通过SQL查询从JDE（JD Edwards）系统中提取所有字典数据，涵盖关键表的关联和字段选择。具体包括F0004和F0005系列表的数据提取方法。 ... [详细]

蜡笔小新 2024-12-26 21:04:46
jsp
QUIC协议：快速UDP互联网连接

QUIC（Quick UDP Internet Connections）是谷歌开发的一种旨在提高网络性能和安全性的传输层协议。它基于UDP，并结合了TLS级别的安全性，提供了更高效、更可靠的互联网通信方式。 ... [详细]

蜡笔小新 2024-12-28 12:33:18
jsp
2023 ARM嵌入式系统全国技术巡讲

2023 ARM嵌入式系统全国技术巡讲旨在分享ARM公司在半导体知识产权(IP)领域的最新进展。作为全球领先的IP提供商，ARM在嵌入式处理器市场占据主导地位，其产品广泛应用于90%以上的嵌入式设备中。此次巡讲将邀请来自ARM、飞思卡尔以及华清远见教育集团的行业专家，共同探讨当前嵌入式系统的前沿技术和应用。 ... [详细]

蜡笔小新 2024-12-28 11:58:48
jsp
MySQL中枚举类型的所有可能值获取方法

本文介绍了一种在MySQL数据库中查询枚举（ENUM）类型字段所有可能取值的方法，帮助开发者更好地理解和利用这一数据类型。 ... [详细]

蜡笔小新 2024-12-27 10:36:44
char
实现密码输入框的掩码设置

本文介绍如何在应用程序中使用文本输入框创建密码输入框，并通过设置掩码来隐藏用户输入的内容。我们将详细解释代码实现，并提供专业的补充说明。 ... [详细]

蜡笔小新 2024-12-27 02:22:09

望天打股

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章