李航《统计学习方法》第二版第2章感知机浅见

作者：fjfzfisher | 来源：互联网 | 2023-10-12 10:44

李航《统计学习方法》第二版-第2章感知机浅见2.1感知机模型2.2感知机学习策略2.3感知机学习方法总结2.1感知机模型感知机是二分类线性模型，输入为实例的特征向量

李航《统计学习方法》第二版-第2章感知机浅见

2.1 感知机模型
2.2 感知机学习策略
2.3 感知机学习方法
- 总结

2.1 感知机模型

感知机是二分类线性模型&＃xff0c;输入为实例的特征向量&＃xff0c;输出为类别&＃xff0c;-1和1。

目的是求出将数据分离的超平面&＃xff0c;基于误分类的损失函数&＃xff0c;用梯度下降法进行最小化&＃xff0c;求得感知机模型。

感知机的定义简单就是输入空间X&＃xff0c;输出Y&＃61;{1,-1}。即:
$f(x)&＃61;sign(w⋅x&＃43;b)f(x)&＃61;sign(w\cdot x&＃43;b)$
w叫权重&＃xff0c;就是影响程度&＃xff0c;b叫偏置&＃xff0c;就是修正偏差用的。其实后面更新的就这两个参数&＃xff0c;w就是斜率&＃xff0c;旋转多少&＃xff0c;w就是平移多少&＃xff0c;sign是符号函数&＃xff0c;即&＃xff1a;
$sign(x)&＃61;{&＃43;1,x≥0−1,<0sign(x)&＃61;\left\{ \begin{aligned} &&＃43;1,x \geq 0 \\ &-1 ,<0 \\ \end{aligned} \right.$

线性方程 $w⋅x&＃43;b&＃61;0w\cdot x&＃43;b&＃61;0$ 对应于特征空间的一个超平面&＃xff0c;w是法向量&＃xff0c;b是截距。二维就是一条线将样本分成两类&＃xff0c;三维空间就是一个平面分割成两部分。简单可以如图所示&＃xff1a;
在这里插入图片描述

2.2 感知机学习策略

我们应该选择怎么样的感知机呢&＃xff0c;就是要定个损失函数。我们当然希望能够分清所有的样本&＃xff0c;没有偏差&＃xff0c;所以损失函数可以定义成有偏差&＃xff0c;就是某个样本到超平面的距离&＃xff0c;首先要先选出分类分错的样本&＃xff0c;即做 $x_i,y_i)$ &＃xff0c;则分错就是真实的类别和错分的类别相反了&＃xff0c;也就是相乘是<0。所以可以是这样:
$−yi(w⋅xi&＃43;b)>0-y_i(w\cdot x_i&＃43;b)>0$
即真实的和预测的结果异号。因此到超平面的距离是&＃xff1a; $−1∣∣w∣∣yi(w⋅xi&＃43;b)-{\frac {1} {||w||}y_i(w\cdot x_i&＃43;b)}$

这样所有分类错的点的集合设为M&＃xff0c;到超平面的总距离为: $−1∣∣w∣∣∑xi∈Myi(w⋅xi&＃43;b)-\frac{1}{||w||} \sum_{x_i \in M} y_i(w\cdot x_i&＃43;b)$

不考虑 $1∣∣w∣∣\frac {1} {||w||}$ ,这个是常数&＃xff0c;就得可以得到感知机学习的损失函数。

对于给定训练集 $T&＃61;{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}$
其中 $xi∈X&＃61;Rnx_i \in X&＃61;R^n$ , $yi∈Y&＃61;{1,−1}y_i\in Y&＃61;\{1,-1\}$ &＃xff0c; $i &＃61; 1, 2, . ., N$ 。则损失函数定义为:
$\sum_{x_i \in M} y_i(w\cdot x_i&＃43;b)$
其中M为分类错误点的集合。

2.3 感知机学习方法

当然采用梯度下降法啦&＃xff0c;而且是随机梯度下降法&＃xff0c;每次随机选一个错分类的点来进行梯度下降&＃xff0c;损失函数的梯度由:
$∇wL(w,b)&＃61;−∑xi∈Myixi\nabla_wL(w,b)&＃61;-\sum_{x_i \in M} y_ix_i$
$∇bL(w,b)&＃61;−∑xi∈Myi\nabla_bL(w,b)&＃61;-\sum_{x_i \in M} y_i$
给出。

随机选取一个错分类点 $x_i,y_i)$ ,对w&＃xff0c;b进行更新&＃xff1a;
$\leftarrow w&＃43;\eta y_ix_i$
$\leftarrow b&＃43;\eta y_i$

其中 $η\eta$ 是步长&＃xff0c;也就是学习率&＃xff0c;这样就不断的进行&＃xff0c;使得最后损失函数不断减小&＃xff0c;直到为0。

基本算法就是:
1.选取初值 $w_0,b_0$ ;
2.在训练集上选取数据 $x_i,y_i)$ ;
3.如果 $1∣∣w∣∣yi(w⋅xi&＃43;b)≤0{\frac {1} {||w||}y_i(w\cdot x_i&＃43;b)} \leq0$ ,
$\leftarrow w&＃43;\eta y_ix_i$
$\leftarrow b&＃43;\eta y_i$
4.转至2&＃xff0c;直至训练集中没有错分类的.

很容易理解&＃xff0c;就不多说了。做实验会发现&＃xff0c;采取不同的初值或者选取不同的错分类点&＃xff0c;解可以不同&＃xff0c;并且该算法也右收敛性的理论证明&＃xff0c;具体可以去看书&＃xff0c;我就不写了&＃xff0c;因为写了大多人也不会看的哈哈。

还有中算法就是叫对偶形式&＃xff0c;名字比较奇怪&＃xff0c;其实因为是收敛的&＃xff0c;那必定是有限次更新可以完成&＃xff0c;所以可以写出训练集之间内积的形式&＃xff0c;而且内积可以服用&＃xff0c;存在一个矩阵里&＃xff0c;其他原理和上面的算法一样。

总结

感知就模型就是二分类的线性模型&＃xff0c;利用梯度下降法将错分类降到最低。

好了&＃xff0c;今天就到这里了&＃xff0c;希望对学习理解有帮助&＃xff0c;大神看见勿喷&＃xff0c;仅为自己的学习理解&＃xff0c;能力有限&＃xff0c;请多包涵&＃xff0c;部分图片来自网络,侵删。

推荐阅读

sum
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
bit
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
bit
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
python
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
python
理解感受野与锚框在目标检测中的应用

本文探讨了卷积神经网络（CNN）中感受野的概念及其与锚框（anchor box）的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小，而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]

蜡笔小新 2024-12-27 12:03:44
python
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
sum
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
string
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
sum
长春大学软件工程：二叉排序树实验报告

本实验主要探讨了二叉排序树（BST）的基本操作，包括创建、查找和删除节点。通过具体实例和代码实现，详细介绍了如何使用递归和非递归方法进行关键字查找，并展示了删除特定节点后的树结构变化。 ... [详细]

蜡笔小新 2024-12-26 15:32:56
install
从零开始构建完整手机站：Vue CLI 3 实战指南（第一部分）

本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点，并确保这些内容与实际工作中的需求紧密结合。 ... [详细]

蜡笔小新 2024-12-26 13:30:37
install
帝国CMS多图上传插件详解及使用指南

本文介绍了一款用于帝国CMS的多图上传插件，该插件通过Flash技术实现批量图片上传功能，显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]

蜡笔小新 2024-12-26 13:30:01
sum
PHP 5.5.0rc1 发布：深入解析 Zend OPcache

2013年5月9日，PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版，这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]

蜡笔小新 2024-12-26 12:56:20
sum
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
int
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
int
Photoshop 教程全解

掌握 Photoshop 是学习网页设计的重要一步。本文将详细介绍 Photoshop 的基础与进阶功能，帮助您更好地进行图像处理和网页设计。推荐使用最新版本的 Photoshop，以体验更强大的功能和更高的效率。 ... [详细]

蜡笔小新 2024-12-26 09:08:14