当前位置: 开发笔记 > 程序员 > 正文

用于Multinoulli（多项分布）输出分布的softmax单元

作者：手机用户2602898385 | 来源：互联网 | 2023-06-24 21:35

转自：https:blog.csdn.netweixin_40516558articledetails79962674单独拿一篇文章出来讲softmax单元是因为昨

转自&＃xff1a;https://blog.csdn.net/weixin_40516558/article/details/79962674

单独拿一篇文章出来讲softmax单元是因为昨天去鹅厂面试&＃xff0c;被要求给softmax求导&＃xff0c;这么简单的事情&＃xff0c;我竟然没有做到&＃xff0c;所以只好以文铭志了。

话不多说。

任何时候&＃xff0c;当我们想要表示一个具有n个可能取值的离散型随机变量的分布时&＃xff0c;都可以使用softmax函数。它可以看作sigmoid函数的扩展&＃xff0c;sigmoid函数用来表示二值型变量的分布。

softmax函数的形式如下&＃xff1a;

当使用最大化对数似然训练softmax来输出目标值y时&＃xff0c;使用指数函数工作地非常好。

对softmax函数取对数&＃xff0c;之后的结果很容易得到。而且&＃xff0c;我们容易观察出&＃xff0c;当样本分类正确时&＃xff0c;它对于整体训练代价贡献很小&＃xff0c;这个代价主要由其他的未本正确分类的样本产生。

对于softmax的情况&＃xff0c;它有多个输出值。当输入值之间的差异变得极端时&＃xff0c;这些输出值可能饱和。从softmax函数中可以得到。

softmax函数更接近于argmax函数而不是max函数。“soft”这个术语来源于softmax函数是连续可微的。“agemax”函数的结果表示为一个one-hot向量&＃xff0c;不是连续可微的。softmax函数因此提供了argmax的“软化版本”。可能最好是把softmax函数称为“softargmax”。

https://blog.csdn.net/u014422406/article/details/52805924

sigmoid将一个real value映射到&＃xff08;0,1&＃xff09;的区间&＃xff08;当然也可以是&＃xff08;-1,1&＃xff09;&＃xff09;&＃xff0c;这样可以用来做二分类。
而softmax把一个k维的real value向量&＃xff08;a1,a2,a3,a4….&＃xff09;映射成一个&＃xff08;b1,b2,b3,b4….&＃xff09;其中bi是一个0-1的常数&＃xff0c;然后可以根据bi的大小来进行多分类的任务&＃xff0c;如取权重最大的一维

https
扩展

推荐阅读

seo
2023年全球运营商网络设备市场预计突破202亿美元

尽管某些细分市场如WAN优化表现不佳，但全球运营商路由器和交换机市场持续增长。根据最新研究，该市场预计在2023年达到202亿美元的规模。 ... [详细]

蜡笔小新 2024-12-27 12:44:44
seo
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
扩展
美国主要财团概览

本文详细介绍了美国最具影响力的十大财团，包括洛克菲勒、摩根、花旗银行等。这些财团在历史发展过程中逐渐形成，并对美国的经济、政治和社会产生深远影响。 ... [详细]

蜡笔小新 2024-12-26 13:32:29
cpu
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
扩展
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
widget
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
编译
解决PHP与MySQL连接时出现500错误的方法

本文详细探讨了当使用PHP连接MySQL数据库时遇到500内部服务器错误的多种解决方案，提供了详尽的操作步骤和专业建议。无论是初学者还是有经验的开发者，都能从中受益。 ... [详细]

蜡笔小新 2024-12-27 15:48:52
扩展
Java内存管理与优化：自动与手动释放策略

本文深入探讨了Java中的内存管理机制，包括自动垃圾回收和手动释放内存的方法。通过理解这些机制，开发者可以更好地优化程序性能并避免内存泄漏。 ... [详细]

蜡笔小新 2024-12-27 14:43:05
编译
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
扩展
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
编译
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
编译
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
扩展
解析与处理 JSON 中的空数组

本文探讨了如何在编程中正确处理包含空数组的 JSON 对象，提供了详细的代码示例和解决方案。 ... [详细]

蜡笔小新 2024-12-26 16:33:40
架构
Ralph的Kubernetes进阶之旅：集群架构与对象解析

本文深入探讨了Kubernetes集群的架构和核心对象，详细介绍了Pod、Service、Volume等基本组件，以及更高层次的抽象如Deployment、StatefulSet等，帮助读者全面理解Kubernetes的工作原理。 ... [详细]

蜡笔小新 2024-12-26 14:15:32
扩展
android知识杂记（三）

andr ... [详细]

蜡笔小新 2024-12-26 13:29:32

手机用户2602898385

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章