算法证明_CFR+算法证明过程

作者：拍友2602911553 | 来源：互联网 | 2023-10-13 12:13

在介绍CFR算法之前，我们首先介绍一下基础概念。在CFR算法中，counterfactualutility被定义为以下形式：然后在regr

在介绍CFR&＃43;算法之前&＃xff0c;我们首先介绍一下基础概念。

在CFR&＃43;算法中&＃xff0c;counterfactual utility被定义为以下形式&＃xff1a;

然后在regret的基础上&＃xff0c;CFR&＃43;算法定义了一个regretlike value&＃xff0c;注意在这里CFR&＃43;算法的regret为一个累加值&＃xff0c;而CFR算法定义的regret为平均值&＃xff0c;需要乘以1t&＃xff1a;

,where

另外&＃xff0c;在CFR&＃43;算法中&＃xff0c;最后输出的平均策略为以下形式&＃xff1a;

然后CFR&＃43;算法的bound为&＃xff1a;

bound证明

在对Lemma 1的证明过程中&＃xff0c;我们可以得出以下结论&＃xff1a;

我们得到了

&＃xff0c;之后我们可以从Lemma 1可知

&＃xff0c;于是&＃xff0c;我们得出以下结论&＃xff1a;

然后我们引入Lemma 3&＃xff0c; Lemma 3很容易证明&＃xff0c;可以直接看出&＃xff1a;

然后证明Lemma 4&＃xff1a;

Lemma 4的证明就是将原有的序列扩充为1&＃xff0c;2&＃xff0c;3&＃xff0c;。。。&＃xff0c;T&＃xff0c;这样的话等于有&＃xff08;T^2&＃43;T&＃xff09;/2的过程&＃xff0c;然后我们再引入Lemma 3&＃xff0c;这样的就可以求出新的bound&＃xff1a;

然后我们由CFR算法的定义可知

于是可以得到新的

结论

从CFR算法和CFR&＃43;算法的证明过程中我们可以获取以下证明过程范式。

首先定义average overall regret&＃xff1a;

因为直接优化average overall regret困难&＃xff0c;然后我们定义immediate counterfactual regret&＃xff0c;并且最优化他&＃xff0c;但是优化这个困难&＃xff0c;于是我们优化他的拟合项counterfactual regret&＃xff0c;使其小于

&＃xff0c;就可以得到

。记住这样的话&＃xff0c;counterfactual regret必须除t作为一个平均值&＃xff0c;而CFR&＃43;算法直接将其作为了累加项。

在CFR&＃43;算法中&＃xff0c;我们的counterfactual regret没有除t。但是我们得到了一个结论&＃xff1a;

然后我们计算累加的counterfactual regret&＃xff1a;

为了求出上面公式的bound&＃xff0c;我们一般需要Lemma 3&＃xff0c;而在LCFR中&＃xff0c;需要在Lemma 3的基础上进行进一步的扩展。

然后我们证明

&＃xff0c;于是得到

。

推荐阅读

算法
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
算法
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
算法
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
算法
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
算法
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
算法
三星W799：2011年双模手机的巅峰之作

三星W799在2011年的表现堪称经典，以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]

蜡笔小新 2024-12-28 01:27:47
算法
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
算法
如何在剪映中进行视频镜像处理

本文将详细介绍如何使用剪映应用中的镜像功能，帮助用户轻松实现视频的镜像效果。通过简单的步骤，您可以快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 18:56:09
算法
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
机器学习
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
机器学习
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
机器学习
解决PHP与MySQL连接时出现500错误的方法

本文详细探讨了当使用PHP连接MySQL数据库时遇到500内部服务器错误的多种解决方案，提供了详尽的操作步骤和专业建议。无论是初学者还是有经验的开发者，都能从中受益。 ... [详细]

蜡笔小新 2024-12-27 15:48:52
机器学习
Java内存管理与优化：自动与手动释放策略

本文深入探讨了Java中的内存管理机制，包括自动垃圾回收和手动释放内存的方法。通过理解这些机制，开发者可以更好地优化程序性能并避免内存泄漏。 ... [详细]

蜡笔小新 2024-12-27 14:43:05
机器学习
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
机器学习
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20

拍友2602911553

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章