热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文阅读笔记《LowShotLearningwithImprintedWeights》

小样本学习&元学习经典论文整理||持续更新核心思想本文提出一种基于特征提取线性分类器的小样本学习算法(imprinting)。首先作者提出一个观点&#

小样本学习&元学习经典论文整理||持续更新


核心思想

  本文提出一种基于特征提取+线性分类器的小样本学习算法(imprinting)。首先作者提出一个观点,他说其实许多基于特征提取+线性分类器的小样本分类算法和基于度量学习(特征提取+最近邻分类器)的算法在本质上是一样的,如下式所示
在这里插入图片描述
式中xxx表示样本特征,p(x)p(x)p(x)表示样本xxx对应的类别表征,我们最小化二者之间的距离(基于度量学习),就相当于最大化二者之间的内积(基于特征提取+线性分类器)。既然如此,作者认为就不需要再通过SGD的方式来训练线性分类器的权重了,我们直接用训练样本得到的特征向量来作为该类别对应的权重就可以了。在分类时只需要计算输入样本的特征向量与各个类别对应权重向量之间的内积,再利用softmax函数计算分类概率即可。算法的实现方式如下图所示
在这里插入图片描述
  整个网络包含两个部分:特征提取器和分类器。输入图像xxx经过深层卷积神经网络后得到对应的特征向量ϕ(x)\phi(x)ϕ(x),然后再利用L2规范化层,将其统一到单位长度。在大规模数据集上做预训练的过程中,每个类别的样本对应的特征向量ϕ(x)\phi(x)ϕ(x),都被作为该类别的权重向量wiw_iwi储存到权重矩阵WWW中,如果一个类别有多个样本,那么就取特征向量的平均值作为该类别对应的权重向量。在小样本数据集做微调训练时,新的类别对应的特征向量被作为权重向量,继续添加到权重矩阵W+W_+W+中,作者称这个过程叫做Imprinting。
  测试时只需要计算测试样本对应的特征向量ϕ(x)\phi(x)ϕ(x)和每个权重向量wiw_iwi之间的余弦相似性,因为余弦相似性被归一化到[−1,1][-1, 1][1,1]之间了,所以如果类别种类多,直接做softmax,得到的概率会很低,无法得到独热向量。为了解决这个问题,作者增加了一个放缩系数sss,则分类概率的计算方式如下
在这里插入图片描述

实现过程


网络结构

  特征提取网络采用InceptionV1结构

创新点


  • 提出一种Imprinting的小样本分类方法,利用样本的特征向量直接作为分类器中的权重向量
  • 增加了规范化层和放缩系数

算法评价

  第一次看这篇文章时,我认为这不就是基于外部记忆的方法吗?将每个类别的表征向量保存到矩阵中,分类时再去计算测试样本与各个表征向量之间的相似性。但其实本文中的权重矩阵WWW和基于外部记忆算法中的记忆矩阵MMM还是有一定区别的,记忆矩阵MMM中向量的更新是按照一定的规则,根据样本的特征向量来更新的,而本文中的权重矩阵WWW是通过SGD的方式来更新的,也就是说权重矩阵WWW还是属于模型内部的一部分,而不是一个独立的外部模块。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。在这里插入图片描述


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 知识图谱表示概念:知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
author-avatar
手机用户2502920971
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有