svm高斯核为什么惩罚项越大_SVM分类、核函数、损失函数

作者：拍友2502869293 | 来源：互联网 | 2023-10-17 16:42

1、支持向量机：支持向量机（SupportVectorMachine,SVM）是一类按监督学习（supervisedlear

1、支持向量机&＃xff1a;

支持向量机&＃xff08;Support Vector Machine, SVM&＃xff09;是一类按监督学习&＃xff08;supervised learning&＃xff09;方式对数据进行二元分类&＃xff08;binary classification&＃xff09;的广义线性分类器&＃xff08;generalized linear classifier&＃xff09;&＃xff0c;其决策边界是对学习样本求解的最大边距超平面&＃xff08;maximum-margin hyperplane&＃xff09;。

SVM的目的&＃xff1a;寻找到一个超平面使样本分成两类&＃xff0c;并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数。边界上的样本点就是支持向量&＃xff0c;这些点很关键&＃xff0c;这也是”支持向量机“命名的由来。

什么是线性可分&＃xff1f;

在分类问题中给定输入数据和学习目标

&＃xff0c;其中输入数据的每个样本都包含多个特征并由此构成特征空间&＃xff08;feature space&＃xff09;&＃xff1a;

&＃xff0c;而学习目标为二元变量

表示负类&＃xff08;negative class&＃xff09;和正类&＃xff08;positive class&＃xff09;。

若输入数据所在的特征空间存在作为决策边界&＃xff08;decision boundary&＃xff09;的超平面&＃xff08;hyperplane&＃xff09;&＃xff1a;

将学习目标按正类和负类分开&＃xff0c;并使

任意样本的点到平面距离大于等于1:

则称该分类问题具有线性可分性&＃xff0c;参数

分别为超平面的法向量和截距。

满足该条件的决策边界实际上构造了2个平行的超平面&＃xff1a;

作为间隔边界以判别样本的分类&＃xff1a;

, if

所有在上间隔边界上方的样本属于正类&＃xff0c;在下间隔边界下方的样本属于负类。两个间隔边界的距离

被定义为边距&＃xff08;margin&＃xff09;&＃xff0c;位于间隔边界上的正类和负类样本为支持向量&＃xff08;support vector&＃xff09;。

2、损失函数&＃xff1a;

在一个分类问题不具有线性可分性时&＃xff0c;使用超平面作为决策边界会带来分类损失&＃xff0c;即部分支持向量不再位于间隔边界上&＃xff0c;而是进入了间隔边界内部&＃xff0c;或落入决策边界的错误一侧。损失函数可以对分类损失进行量化&＃xff0c;常用的损失函数有&＃xff1a;铰链损失函数&＃xff08;hinge loss&＃xff09;、logistic损失函数&＃xff08;logistic loss&＃xff09;、指数损失函数&＃xff08;exponential loss&＃xff09;。

hinge:

logistic:

exponential:

其中SVM使用的是铰链损失函数。

图中

分类器的经验风险描述了分类器所给出的分类结果的准确程度&＃xff1b;结构风险描述了分类器自身的稳定程度&＃xff0c;复杂的分类器容易产生过拟合&＃xff0c;因此是不稳定的。

最终的SVM损失函数既要考虑到经验风险&＃xff0c;也要考虑到结构风险&＃xff0c;因此最终的损失函数为&＃xff1a;

第一项为经验风险&＃xff0c;度量了模型对训练数据的拟合程度&＃xff1b;第二项为结构风险&＃xff0c;也称正则化项&＃xff0c;度量了模型自身的复杂度&＃xff0c;可以降低过拟合风险&＃xff0c;由于该项为二次幂形式&＃xff0c;所以又叫作L2正则项。

是一个可调参数&＃xff0c;用来权衡经验风险和结构风险&＃xff0c;以加大某一项的惩罚力度。

3、核函数&＃xff1a;

SVM可以通过核方法&＃xff08;kernel method&＃xff09;进行非线性分类&＃xff0c;是常见的核学习&＃xff08;kernel learning&＃xff09;方法之一。常见的核函数有&＃xff1a;多项式核、径向基函数核、拉普拉斯核、Sigmoid核。

一些线性不可分的问题可能是非线性可分的&＃xff0c;即特征空间存在超曲面&＃xff08;hypersurface&＃xff09;将正类和负类分开。使用非线性函数可以将非线性可分问题从原始的特征空间映射至更高维的希尔伯特空间&＃xff08;Hilbert space&＃xff09;H &＃xff0c;从而转化为线性可分问题&＃xff0c;此时作为决策边界的超平面表示如下&＃xff1a;

式中&＃xff1a;

为映射函数

由于映射函数是复杂的非线性函数&＃xff0c;因此其内积的计算是困难的&＃xff0c;此时可使用核方法&＃xff08;kernel method&＃xff09;&＃xff0c;即定义映射函数的内积为核函数&＃xff08;kernel function&＃xff09;。

多项式核&＃xff1a;

径向基函数核(RBF核)又被称为高斯核&＃xff1a;

拉普拉斯核:

Sigmoid核&＃xff1a;

当多项式核的阶为1时&＃xff0c;其被称为线性核&＃xff0c;对应的非线性分类器退化为线性分类器。RBF核也被称为高斯核&＃xff08;Gaussian kernel&＃xff09;&＃xff0c;其对应的映射函数将样本空间映射至无限维空间。

推荐阅读

function
Qt中信号与槽机制对比传统回调函数的优势

在Qt框架中，信号与槽机制是一种独特的组件间通信方式。本文探讨了这一机制相较于传统的C风格回调函数所具有的优势，并分析了其潜在的不足之处。 ... [详细]

蜡笔小新 2024-11-20 10:48:37
utf-8
Struts2 + json+ jquery 实现三级联动action和jsp代码竟然有小红叉，提示缺双引号，检查了转义符号也没缺啊，求解

publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]

蜡笔小新 2024-11-21 16:25:41
function
使用 Node.js 和 Nodemailer 实现邮件发送功能

本文详细介绍了如何在 Node.js 环境中利用 Nodemailer 库实现邮件发送功能，包括环境配置、代码实现及常见问题解决方法。 ... [详细]

蜡笔小新 2024-11-20 10:43:50
random
数据分析(4)sklearn入门

如何选择机器学习方法http:scikit-learn.orgstabletutorialmachine_learning_mapindex.html通用学习模式只需要先定义 ... [详细]

蜡笔小新 2024-10-21 03:54:07
search
弱监督目标检测之一最小熵隐变量模型

目标检测是计算机视觉一个非常重要的子任务。目标检测需要发现并准确定位自然图片中的物体。在2012年之前，目标检测主要基于手工设计的特征以及传统分类器。2012年以后，出现了 ... [详细]

蜡笔小新 2024-10-20 17:50:44
function
深度学习: 目标函数

Introduction目标函数是深度学习之心，是模型训练的发动机。目标函数(objectfunction)损失函数(lossfunction)代价函数(costfunction) ... [详细]

蜡笔小新 2024-10-18 18:45:28
default
scikitlearn学习之SVM算法

分隔超平面：将数据集分割开来的直线叫做分隔超平面。超平面：如果数据集是N维的，那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面，也就是分类的决策边界。间隔：一个点 ... [详细]

蜡笔小新 2024-10-14 22:47:51
function
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
search
深入解析JQuery Mobile特有的事件与方法

本文详细介绍了JQuery Mobile框架中特有的事件和方法，帮助开发者更好地理解和应用这些特性，提升移动Web开发的效率。 ... [详细]

蜡笔小新 2024-11-21 14:24:21
future
Ryanair Expands Frankfurt Operations, Challenges Lufthansa's Dominance

Irish budget airline Ryanair announced plans to significantly increase its route network from Frankfurt Airport, marking a direct challenge to Lufthansa, Germany's leading carrier. ... [详细]

蜡笔小新 2024-11-21 13:09:01
future
优化市场篮子分析性能

在执行市场篮子分析时遇到性能瓶颈，尤其是在设定频繁项集的支持度阈值为1%时。本文探讨了如何通过调整代码和参数来提高分析效率。 ... [详细]

蜡笔小新 2024-11-21 12:31:46
future
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19
function
如何从BAM文件绘制ATAC-seq插入片段长度分布图？

在ATAC-seq数据处理中，插入片段长度的分布图是一个重要的质量控制指标，它能反映出核小体的周期性排列。本文将详细介绍如何从BAM文件中提取并绘制这些数据。 ... [详细]

蜡笔小新 2024-11-20 22:35:16
perl
[OReilly_Learning_Perl_5th_Edition]_Chap06_Exercises

3.[15]Writeaprogramtolistallofthekeysandvaluesin%ENV.PrinttheresultsintwocolumnsinASCIIbet ... [详细]

蜡笔小新 2024-11-20 18:28:56
search
深入解析 Bootstrap Table 的使用技巧

本文详细介绍了如何利用 Bootstrap Table 实现数据展示与操作，包括数据加载、表格配置及前后端交互等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 17:21:26

拍友2502869293

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章