热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

文献阅读(73)

文章目录1缩写&引用2abstract&introduction3提出的架构3.1PE架构4数据流5实现结果题目:ConvolutionalNeuralNetwork

文章目录

  • 1 缩写 & 引用
  • 2 abstract & introduction
  • 3 提出的架构
    • 3.1 PE架构
  • 4 数据流
  • 5 实现结果


  • 题目:Convolutional Neural Network Accelerator with Vector Quantization
  • 时间:2019
  • 会议:ISCAS
  • 研究机构:国立台湾大学
  • 参考链接:https://blog.csdn.net/lishuiwang/article/details/78483547

1 缩写 & 引用

Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems

2 abstract & introduction

本篇论文的主要贡献:

  1. 提出了DNN压缩方法:向量量化vector quantizaion
  2. 提出了accelerator,可以支持不同的codebook和kernel尺寸
  3. cycle-accurate python model来估计模拟这种dataflow,估计所需的cycle数

3 提出的架构

首先矢量量化vector quantization需要将数据分成好几个子空间,分割方法是每Cs′C_s'Cs个input channel分成一个子空间,比如下图是按照Cs′=4C_s'=4Cs=4分割的
在这里插入图片描述
分割完子空间,每个子空间有一个codebook,有K个可能的权重矢量

在这里插入图片描述

3.1 PE架构

因为有codebook,计算也可以通过查找表进行,所以PE计算流程分成预计算、dispatch、累加三步,预计算就是提前计算好查找表
在这里插入图片描述

4 数据流

数据流包括weight stationary、row stationary-like

5 实现结果
  • caffenet:Cs′=4C_s'=4Cs=4,K=128K=128K=128
  • VGG-16:Cs′=8C_s'=8Cs=8,K=128K=128K=128
    只是综合了,没有流片,还通过一个周期准确的python模型来仿真周期数

推荐阅读
  • 由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络(TP-GAN),该技术能通过单一侧面照片生成逼真的正面人脸图像,显著提升了不同姿态下的人脸识别效果。 ... [详细]
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • FinOps 与 Serverless 的结合:破解云成本难题
    本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理,提出了首个 Serverless 函数总成本估计模型,并分享了多种有效的成本优化策略。 ... [详细]
  • 社交网络中的级联行为 ... [详细]
  • 本文提供了一系列Python编程基础练习题,涵盖了列表操作、循环结构、字符串处理和元组特性等内容。通过这些练习题,读者可以巩固对Python语言的理解并提升编程技能。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • 信用评分卡的Python实现与评估
    本文介绍如何使用Python构建和评估信用评分卡模型,涵盖数据预处理、模型训练及验证指标选择。附带详细代码示例和视频教程链接。 ... [详细]
  • 解决C++编译错误C3867的方法
    本文详细介绍了在不同版本的Visual Studio中,如何正确处理成员函数指针以避免编译错误C3867。同时,提供了一个具体的代码示例及其优化方案。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储(DAS)、网络附加存储(NAS)和存储区域网络(SAN)的特点,帮助读者理解不同存储方式的优势与局限性。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 优化SQL Server批量数据插入存储过程的实现
    本文介绍了一种改进的SQL Server存储过程,用于生成批量插入语句。该方法不仅提高了性能,还支持单行和多行模式,适用于SQL Server 2005及以上版本。 ... [详细]
  • 本文探讨了如何在日常工作中通过优化效率和深入研究核心技术,将技术和知识转化为实际收益。文章结合个人经验,分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法,帮助读者更好地实现技术变现。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
author-avatar
mobiledu2502873187
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有