在机器学习中,面对二分类问题我们经常采用逻辑回归来预测一个对象的所属类别,逻辑回归中一个经典之处就是使用逻辑函数将线性回归方程得到的结果转化成一个概率值,我们往往根据一个阈值(比如0.5)来判断一个对象所属的类,如果预测的概率大于0.5则将其分为一类(正类),若小于0.5则判定为负类,当等于0.5时,我们往往是将其随机判定为某一类。越了解逻辑回归,越感觉到它的奇妙之处。
我们从很小就学习到,抛一枚硬币时,要么出现反面,要么出现正面,极端情况就是硬币竖直(既不表现正面也不表现反面)。我们用随机变量X表示硬币出现的某个面,X=1表示出现正面,X=0表示硬币出现反面。这个是我们从小学到大学一直习以为常的方式。现在我们不考虑硬币竖直的情况,即认为在每一次抛硬币后,结果只会出现正面或反面,这样一来X的取值为集合{0,1}。这一切都是这么的自然。那么你是否想过,X为什么只能取0或者1呢,为什么不能取0.2,0.3等等。我们可以想象存在着这样一个硬币,它的面不止正面和反面,而存在很多很多面,这些面介于正面和反面之间,这些面在某个空间中是均匀连续变化的,即相邻面之间不存在间隙,而正面和反面是这个连续面集的两个极端面。意思就是X取值可以取[0,1]区间上的任何一个数,X此时是连续的。我们把这个硬币姑且称之为W币吧。
我们手上现在有这么一个W币,用它来做抛硬币实验。当你抛出去之后,这个硬币应该随机出现[0,1]区间内的任意一个面。如果你不好想象这样一个W币是什么样子,那么我们这样考率一个没有重力场的实验环境。硬币抛出去之后到底哪一面会朝上?这种情况就不像有重力场的时候出现绝对的正面或反面。这时你会发现硬币可以呈现任何姿态,即当它的正面朝上时,不会绝对向上,而是与水平面呈现一定偏斜角度。角度最大是90°,此时硬盘竖直。此时,突然外加一个重力场,那么硬币立马变为水平状态,即偏斜角度变为0.在重力场的作用下,W币的最终结果面被强制转换为正面1或反面0.当W币恰好竖直向上时,此时及时外加了重力场,W币还是会竖直向上,我们只能随机判定其属于正面还是反面。。这个过程跟我们根据逻辑函数值是否大于阈值完全是相同的做法。在这个抛掷W币的过程中,重力场成为了判定W币是属于正面还是反面的映射机制。
那么为什么我们在抛硬币过程中,硬币会时而正面,时而反面呢?我觉得任何一个现象背后都存在一些列影响着该现象的因素,如果我们能够准确、完全的将这些因素找出来,求得一个真实的方程,那么在每一次抛掷W币时,我们就能根据所有因素的取值预测W币最终会出现哪一面。那在实际抛掷硬币时,如果我想得到某个面wi,那么我们根据真实方程来计算出每一个影响因素的取值,然后在抛掷W币时设置好这些参数值,那结果必然会出现wi面。但是实际中,我们虽然常说做一个独立重复试验,但是我们永远无法做到各次独立实验的环境相同,比如空气中分子的分布、运动状态,重力场的状态、温度值、甚至硬币内部分子、电子等等的状态,这些我们都无法保证达到相同条件。这就出现了有些因素的随机取值,所以无法精确预测结果。就像在回归分析中,我们总是只能找到一些主要影响因素,而无法确定或是无法找到的因素带来的影响结果只能用统计误差表示。那么,当利用一部分主要影响因素和一个只能说接近于真实的方程来预测W币的最终结果时,我们只能预测到W比的最终面会落在哪些区间,当预测的W币的结果面落在[0,0.5)时,我们就用重力场将其强制转为反面0,反之将其转换为正面1.
以上这些纯属我个人遐想。希望有感兴趣的朋友。