热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

文献阅读(73)

文章目录1缩写&引用2abstract&introduction3提出的架构3.1PE架构4数据流5实现结果题目:ConvolutionalNeuralNetwork

文章目录

  • 1 缩写 & 引用
  • 2 abstract & introduction
  • 3 提出的架构
    • 3.1 PE架构
  • 4 数据流
  • 5 实现结果


  • 题目:Convolutional Neural Network Accelerator with Vector Quantization
  • 时间:2019
  • 会议:ISCAS
  • 研究机构:国立台湾大学
  • 参考链接:https://blog.csdn.net/lishuiwang/article/details/78483547

1 缩写 & 引用

Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems

2 abstract & introduction

本篇论文的主要贡献:

  1. 提出了DNN压缩方法:向量量化vector quantizaion
  2. 提出了accelerator,可以支持不同的codebook和kernel尺寸
  3. cycle-accurate python model来估计模拟这种dataflow,估计所需的cycle数

3 提出的架构

首先矢量量化vector quantization需要将数据分成好几个子空间,分割方法是每Cs′C_s'Cs个input channel分成一个子空间,比如下图是按照Cs′=4C_s'=4Cs=4分割的
在这里插入图片描述
分割完子空间,每个子空间有一个codebook,有K个可能的权重矢量

在这里插入图片描述

3.1 PE架构

因为有codebook,计算也可以通过查找表进行,所以PE计算流程分成预计算、dispatch、累加三步,预计算就是提前计算好查找表
在这里插入图片描述

4 数据流

数据流包括weight stationary、row stationary-like

5 实现结果
  • caffenet:Cs′=4C_s'=4Cs=4,K=128K=128K=128
  • VGG-16:Cs′=8C_s'=8Cs=8,K=128K=128K=128
    只是综合了,没有流片,还通过一个周期准确的python模型来仿真周期数

推荐阅读
author-avatar
mobiledu2502873187
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有