热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

NLP入门|《统计学习方法》学习(二)|感知机模型梯度下降法

导读学习《统计学习方法》第二版的第二章,mark其中一些重要的部分。声明:以下截图来自书本以及b站课程(up主:简博士&#
导读

学习《统计学习方法》第二版的第二章,mark其中一些重要的部分。
声明:以下截图来自书本以及b站课程(up主:简博士)。

一、感知机

第二章的主要内容是感知机算法。感知机是一种线性分类模型,属于判别模型。其目标是通过训练得到包含w和b两个参数的感知机模型,然后对于新的实例进行预测,从而得到其类别。

定义及函数表示:在这里插入图片描述


几何含义:在这里插入图片描述

注:1)w是法向量;
2)特征空间为n维,则超平面为n-1维。

二、条件


1. 数据集的线性可分性

能够将数据集完全划分到正类和负类。

2. 损失函数在这里插入图片描述


3. 算法收敛性

经过有限次迭代可以得到一个将训练数据集完全划分的分离超平面及感知机模型。

Novikoff定理:

在这里插入图片描述
但如果想要分割得到唯一的超平面,则需要增加约束条件,这也是算法的依赖性。

三、梯度下降法


1. 梯度:

梯度是某一函数在该点处最大的方向导数,沿着该方向可取得最大的变化率。
若函数是凸函数,则可以通过梯度下降法进行优化。

2. 算法:

在这里插入图片描述

2.1 批量梯度下降法:

每次迭代时使用所有误分类点来进行参数更新。
在这里插入图片描述

2.2 随机梯度下降法:

每次随机选取一个误分类点。【速度相对较快】在这里插入图片描述

四、感知机算法

1. 原始形式

假设初始模型为下图右侧的蓝色线&#xff0c;则存在两个误分类点&#xff08;分别&#61;0和<0&#xff09;。
最后得到的可能是黄色线&#xff0c;也可能是黑色线&#xff0c;由此可以看出感知机模型得到的超平面不唯一。
在这里插入图片描述

2. 对偶形式

在这里插入图片描述


推荐阅读
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 我整理了HMOV四大5G旗舰的参数,可依然没能拯救我的选择困难症
    伊瓢茕茕发自凹非寺量子位报道|公众号QbitAI报道了那么多发布会,依然无法选出要换的第一部5G手机。这不,随着华为P40系列发布,目前国 ... [详细]
  • 本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • C++实现经典排序算法
    本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出,帮助读者全面了解这些排序方法的特点。 ... [详细]
  • 本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现,详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 题目描述:给定n个半开区间[a, b),要求使用两个互不重叠的记录器,求最多可以记录多少个区间。解决方案采用贪心算法,通过排序和遍历实现最优解。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文探讨如何设计一个安全的加密和验证算法,确保生成的密码具有高随机性和低重复率,并提供相应的验证机制。 ... [详细]
  • python image stiching_Python自然语言处理,词云图生成
    自然语言处理本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个 ... [详细]
author-avatar
w果乐园地盘BSp
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有