当前位置: 开发笔记 > 编程语言 > 正文

CapsulebasedObjectTrackingwithNaturalLanguageSpecification

作者：sumer | 来源：互联网 | 2023-10-12 18:35

Capsule-basedObjectTrackingwithNaturalLanguageSpecification2021-12-18 19:28:39Paper: https

Capsule-based Object Tracking with Natural Language Specification

2021-12-18 19:28:39

Paper: https://dl.acm.org/doi/abs/10.1145/3474085.3475349

1. Background and Motivation:

本文提出一种 tracking-by-language 的算法，其中，visual encoder 用的是 Capsule network；然后将 text 和 img 交互。

2. Framework：

2.1. Visual and Textual Encoders

　　给定图像，作者利用 VGG 网络提取 conv4-3, conv5-3 的特征；给定文本，作者利用 word2vec model 将每一个单词映射为 300-D 的向量；然后将这些向量收集起来，并输入到 3个并行的卷积层中，卷积核的大小分别为 2, 3, 4。通过这种方式，尺寸为 300维的文本表示就可以通过 max-pooling layer 得到。给定视觉和文本特征，作者采用 matrix-capsule 的方法，进行 visual 和 texture capsule 的构建。每一个 capsule 通过一个 pose matrix 和 activation value 进行构建。

2.2. Visual and Textual Capsules Construction

Pose matrix. 作者利用 1*1 卷积，将 36*36*128 的特征图映射为 36*36*64, 然后将得到的特征图进行 reshape，得到 36*36*8*8, 表示该矩阵由 8 个 8-D 的向量组成；

Activation Values. 利用 1*1 卷积将特征图映射为 36*36*8，以匹配胶囊类型的数目。通过增加一个维度，作者将其表达为 36*36*8*1.

Capsule Construction. 通过将这两个东西，组合到一起，得到一个 36*36*8*9 的特征。

由于文本特征是一个向量，作者直接用一个 FC 来产生 8 pose matrices 和 8 activations。

2.3. Visual-textural Routing Module

如上图所示，给定 visual capsule，作者考虑到多尺度的信息，将其分别与 textual capsule 进行路由交互，然后融合这三路特征，得到 visual-textual-capsules。然后对其进行 resize，输入到文本解码器中，进行文本的重构。

2.4. Textural-visual Routing Module

如上图所示，给定 visual 和 textual capsule，作者首先将文本的特征进行重复堆叠，得到和 visual capsule 相同维度的特征。然后进行路由交互，最终也进行重构。

2.5 Decoder

作者将上述两个分支的结果，进行拼接。然后将其进行 resize，然后利用反卷积网络得到 288*288*1 的响应图。这里，还用到了 parameterized skip connections 来得到更加精确的预测。

2.6 Optimization and Tracking

作者将上述两个重构损失和响应图损失一起进行优化。

3. Experiments

Stay Hungry，Stay Foolish ...

推荐阅读

io
Java 中的 BigDecimal pow()方法，示例

Java 中的 BigDecimal pow()方法，示例 ... [详细]

蜡笔小新 2024-12-27 20:54:03
io
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
text
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
io
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
io
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
format
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
text
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
text
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
io
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
io
c# – UWP：BrightnessOverride StartOverride逻辑

c# – UWP：BrightnessOverride StartOverride逻辑 ... [详细]

蜡笔小新 2024-12-27 16:56:40
text
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
instance
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
format
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
text
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
io
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14

sumer

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章