热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

SVM中的对偶问题原理

0.摘要本文仅从SVM的“对偶问题”出发去阐述优化求解问题中的数学原理。1.“对偶原理”1.1原问题:minimize:f0(x)minimize:f_0(x)m

0.摘要

本文仅从SVM的“对偶问题”出发去阐述优化求解问题中的数学原理。

1.“对偶原理”


1.1 原问题:

minimize:f0(x)minimize: f_0(x)minimize:f0(x)
s.t.gi(x),i=1,2...,ms.t. \quad g_i(x),i=1,2...,ms.t.gi(x),i=1,2...,m
hj(x),j=1,2,...n\qquad h_j(x),j=1,2,...nhj(x),j=1,2,...n
原问题在于将生活中的优化问题和其需要满足的条件以一般化的数学语言表达出来


1.2拉格朗日对偶问题:

L(x,α,β)=f(x)+αTg(x)+βTh(x)L(x,\alpha,\beta)=f(x)+\alpha^Tg(x)+\beta^Th(x)L(x,α,β)=f(x)+αTg(x)+βTh(x)
人为设定
1.αi>=01.\alpha_i>=01.αi>=0
2.g(α,β)=infL(x,α,β)2.g(\alpha,\beta)=infL(x,\alpha,\beta)2.g(α,β)=infL(x,α,β)


1.3 对偶问题的对偶间隙

f(x∗)=minf(x)≥L(x,α,β)≥infL(x,α,β)=d(α,β)f(x^*)=minf(x)\geq L(x,\alpha,\beta)\geq infL(x,\alpha,\beta)= d(\alpha,\beta)f(x)=minf(x)L(x,α,β)infL(x,α,β)=d(α,β)
f(x∗)=P∗≥Q∗=d(α∗,β∗)f(x^*)=P^*\geq Q^*=d(\alpha^*,\beta^*)f(x)=PQ=d(α,β)
定义:gep=P∗−Q∗gep = P^* - Q^*gep=PQ为对偶间隙,由此引发除了弱对偶定理和强对偶定理(strong duality).
定理:slater条件
在这里插入图片描述


  1. 任意问题的弱对偶均成立
  2. 对于部分问题的强对偶成立:凸优化问题成立,非凸优化问题部分成立

1.4KKT条件的推导

其中互补性的证明:
在这里插入图片描述
在这里插入图片描述


推荐阅读
  • 本文详细介绍了如何在技嘉M52LT-D3主板上为不同类型的CPU启用VT(虚拟化技术)功能,包括Intel和AMD平台的具体步骤。 ... [详细]
  • 支持向量机(SVM)算法综述
    支持向量机(Support Vector Machine, SVM)是由Cortes和Vapnik于1995年首次提出的一种机器学习算法。SVM在处理小样本、非线性及高维模式识别问题上表现出显著的优势,并广泛应用于函数拟合等其他机器学习任务中。 ... [详细]
  • 在VMware虚拟机中正确安装和配置VMware Tools是提升系统性能和扩展功能的关键步骤。首先,通过虚拟机菜单选择“VM”选项,然后点击“Install VMware Tools”。接下来,在终端中执行命令 `cd ~` 和 `cp /media/VMware\ Tools/VMwareTools-*.tar.gz .`,解压文件并按照提示完成安装过程。这将确保虚拟机与主机之间的高效交互,提高资源利用率和用户体验。 ... [详细]
  • 探索学习曲线函数的深度解析与应用 ... [详细]
  • 如何选择机器学习方法http:scikit-learn.orgstabletutorialmachine_learning_mapindex.html通用学习模式只需要先定义 ... [详细]
  •     目标检测是计算机视觉一个非常重要的子任务。目标检测需要发现并准确定位自然图片中的物体。在2012年之前,目标检测主要基于手工设计的特征以及传统分类器。2012年以后,出现了 ... [详细]
  • 深度学习: 目标函数
    Introduction目标函数是深度学习之心,是模型训练的发动机。目标函数(objectfunction)损失函数(lossfunction)代价函数(costfunction) ... [详细]
  • vmware workstation14嵌套安装kvm
    vmware workstation14嵌套安装kvm ... [详细]
  • 分隔超平面:将数据集分割开来的直线叫做分隔超平面。超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。间隔:一个点 ... [详细]
  • NLP篇【01】tfidf与bm25介绍与对比
    上一篇:自然语言处理【NLP】遇上电商——专栏导读下一篇:NLP篇【02】白话Word2vec原理以及层softmax、负采样的实现一、tfidf介 ... [详细]
  • 这是我在复习时整理的笔记,过一遍就稳了,建议还是把PPT过一遍,老师考的都是基础题,大部分都在PPT上,特别是 ... [详细]
  • 概述SVM(支持向量机)是一个二分类的模型,它的主要思想就是间隔最大化,那么问题来了,什么是间隔最大化&#x ... [详细]
  • 机器学习算法常见面试题目总结,Go语言社区,Golang程序员人脉社 ... [详细]
  • 导言好久没用Latex了,所以一用的时候就出问题了,在不赶deadline的时候先总结好,用的时候直接ctrlc,要是你也 ... [详细]
  •   作为一种编程语言,Python比C#,Java,C和C++更具吸引力。它被称为“胶水语言”,它也被喜欢它的程序员誉为“美丽”的编程语言。从云计算,客户端到物联网终端,Pytho ... [详细]
author-avatar
平凡天使心619
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有