热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

VisionTransformer(ViT)和DETR深度解析

本文详细介绍了VisionTransformer(ViT)和DETR的工作原理,并提供了相关的代码实现和参考资料。通过观看教学视频和阅读博客,对ViT的全流程进行了详细的笔记整理,包括代码详解和关键概念的解释。

通过观看教学视频和阅读博客,详细梳理了 Vision Transformer (ViT) 的各个方面。

(212条消息) ViT全流程笔记,附代码详解。_AI Studio的博客-CSDN博客_vit代码

参考资料

Vision Transformer (ViT) PyTorch代码全解析(附图解)_Adenialzz的博客-CSDN博客_vit-pytorch

//简单版

(212条消息) ViT: 视觉Transformer backbone网络ViT论文与代码详解_louwill12的博客-CSDN博客

//完整版

神经网络学习小记录67——Pytorch版 Vision Transformer (VIT)模型的复现详解_Bubbliiiing的博客-CSDN博客

11.1 Vision Transformer (vit)网络详解_哔哩哔哩_bilibili //整体

(212条消息) 一张图等于 16x16 个字,计算机视觉也用上 Transformer 了_公众号机器学习与生成对抗网络的博客-CSDN博客

//整体的补充 ,非常细节

ViT论文逐段精读【论文精读】_哔哩哔哩_bilibili //配套视频

ViT论文逐段精读【论文精读】 - 哔哩哔哩 (bilibili.com) //配套笔记

Yolo系列各个模块的讲解

深入浅出Yolo系列之Yolov5核心基础知识完整讲解 - 知乎 (zhihu.com)

//多个交互层多头注意力(MSA)和多层感知器(MLP)

Vision MLP 超详细解读 (原理分析+代码解读) (四) - 知乎 (zhihu.com)

(212条消息) ViT全流程笔记,附代码详解。_AI Studio的博客-CSDN博客_vit代码

//encoder,手写解释的很清楚

(212条消息) BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结_夏洛的网的博客-CSDN博客_layernorm和batchnorm

//为什么要选择layer normalization


推荐阅读
author-avatar
阿Love静_999
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有