【笔记】论文阅读|Oneshotlearningwithmemoryaugmentedneuralnetworks

作者：手机用户2502917553 | 来源：互联网 | 2023-09-14 12:12

论文信息：SantoroA,BartunovS,BotvinickM,etal.Oneshotlearningwithmemoryaugmentedneuralnetworks[J

论文信息：Santoro A, Bartunov S, Botvinick M, et al. One-shot learning with memory-augmented neural networks[J]. arXiv preprint arXiv:1605.06065, 2016.

博文作者：Veagau

编辑时间：2020年01月07日

本文是2016年ICML的会议论文，作者来自谷歌的DeepMind。在论文中作者提出了一种记忆增强神经网络（memory-augmented neural networks，简记MANN）来快速吸收样本中蕴含的信息并利用这些信息对仅提供数个样本的情境做出准确的预测，即少样本学习（Few-Shot Learning）。由于使用了外部记忆部件，因此作者还提出一种有效获取外部记忆部件中内容的方法。

元学习过程主要划分为两个阶段：第一个阶段，元学习模型在不同的任务上，如在一个具体的数据集内实现准确的分类，进行快速学习；第二阶段，元学习模型提取跨任务的知识，并利用这些知识对第一阶段进行指导。上一篇论文中提及的网络模型就已经证实了带有记忆功能的神经网络适用于这种元学习场景，不过上文用到的LSTM神经网络只能暂时的存储学习到的知识表示，是一种内部记忆（Internal Memory）网络架构，而本文中借鉴神经图灵机（Neural Turing Machine）的思想，采用外部记忆（External Memory）网络架构对跨任务知识进行存取。

整个网络结构示意图如下。

技术分享图片

数据对（data pair）依然采用错位的方式输入到网络中，在前向传播的过程中，输入样本与目标标签的会进行绑定，经过编码后存储在外部记忆元件中，在下一个样本输入后，网络对记忆元件中内容进行检索，解析出相关的信息进行预测。这些信息在记忆元件中是以矩阵的形式进行存储的，每个样本对应的编码信息对应矩阵的一行数据，对矩阵存取即对其进行读写操作。读（read）时采用神经图灵机使用的策略——计算新的输入样本的编码表示，然后用于与矩阵中每一行数据进行相似度计算，最后加权得出最终的预测信息。写（Write）时采用LRUA（Least Recently Used Access）——最近最少使用策略，对最近最少使用的存储单元进行覆盖操作，从而节省存储空间与查询开支。

采用记忆增强网络架构能够很好的解决训练数据稀疏（少样本）的问题，不过本文中提出的记忆单元寻址策略灵活性尚有不足，能否让网络自主设计寻址策略，并且让其适应更大范围任务的学习以及与主动学习相结合还值得进一步研究。

推荐阅读

import
获取父类参数类型工具类

packagecom.panchan.tsmese.utils;importjava.lang.reflect.ParameterizedType;importjava.lang. ... [详细]

蜡笔小新 2024-11-15 09:33:44
jsp
蒜头君的倒水问题（矩阵快速幂优化）

蒜头君将两杯热水分别倒入两个杯子中，每杯水的初始量分别为a毫升和b毫升。为了使水冷却，蒜头君采用了一种特殊的方式，即每次将第一杯中的x%的水倒入第二杯，同时将第二杯中的y%的水倒入第一杯。这种操作会重复进行k次，最终求出两杯水中各自的水量。 ... [详细]

蜡笔小新 2024-11-14 19:31:55
jsp
支付平台异步风控系统架构设计

本文介绍了一种支付平台异步风控系统的架构模型，旨在为开发类似系统的工程师提供参考。 ... [详细]

蜡笔小新 2024-11-14 15:21:34
jsp
C++ 中的 malloc 函数详解

malloc 是 C 语言中的一个标准库函数，全称为 memory allocation，即动态内存分配。它用于在程序运行时申请一块指定大小的连续内存区域，并返回该区域的起始地址。当无法预先确定内存的具体位置时，可以通过 malloc 动态分配内存。 ... [详细]

蜡笔小新 2024-11-14 13:38:03
import
Python多线程详解与示例

本文介绍了Python中的多线程编程，包括僵尸进程和孤儿进程的概念，并提供了具体的代码示例。同时，详细解释了0号进程和1号进程在系统中的作用。 ... [详细]

蜡笔小新 2024-11-14 12:47:24
jsp
NX二次开发：UFUN点收集器UF_UI_select_point_collection详解

本文介绍了如何在NX中使用UFUN库进行点收集器的二次开发，包括必要的头文件包含、初始化和选择点集合的具体实现。 ... [详细]

蜡笔小新 2024-11-14 10:18:35
range
ASP.NET 中操作 Excel 的常见方法和属性

本文介绍了如何在 ASP.NET 中设置 Excel 单元格格式为文本，获取多个单元格区域并作为表头，以及进行单元格合并、赋值、格式设置等操作。 ... [详细]

蜡笔小新 2024-11-13 19:46:18
ip
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19
jsp
使用Postman构建API请求

本文介绍了如何使用Postman构建和发送HTTP请求，包括四个主要部分：方法（Method）、URL、头部（Headers）和主体（Body）。特别强调了Body部分的重要性，并详细说明了不同类型的请求体。 ... [详细]

蜡笔小新 2024-11-15 13:35:01
jsp
A*算法在AI路径规划中的应用

路径规划算法用于在地图上找到从起点到终点的最佳路径，特别是在存在障碍物的情况下。A*算法是一种高效且广泛使用的路径规划算法，适用于静态和动态环境。 ... [详细]

蜡笔小新 2024-11-14 10:53:20
jsp
MySQL 数据库连接方法

本文介绍了如何使用 MySQL 命令行工具连接到指定的数据库。 ... [详细]

蜡笔小新 2024-11-14 10:08:54
cmd
如何解决8080端口被占用问题

本文介绍了如何通过命令行和任务管理器查找并终止占用8080端口的进程，以确保该端口能够正常使用。 ... [详细]

蜡笔小新 2024-11-14 09:42:20
jsp
Excel 数据分析基础

Excel 是数据分析中最基本且强大的工具之一，具备多种实用功能和操作方法。本文将简要介绍 Excel 的不同版本及其兼容性问题，并探讨在处理大数据时的替代方案。 ... [详细]

蜡笔小新 2024-11-14 07:39:50
jsp
LDAP服务器配置与管理

本文介绍如何通过安装和配置SSSD服务来统一管理用户账户信息，并实现其他系统的登录调用。通过图形化交互界面配置LDAP服务器，确保用户账户信息的集中管理和安全访问。 ... [详细]

蜡笔小新 2024-11-13 18:19:52

手机用户2502917553

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章