文章目录
- 1 缩写 & 引用
- 2 abstract & introduction
- 3 提出的架构
- 4 数据流
- 5 实现结果
- 题目:Convolutional Neural Network Accelerator with Vector Quantization
- 时间:2019
- 会议:ISCAS
- 研究机构:国立台湾大学
- 参考链接:https://blog.csdn.net/lishuiwang/article/details/78483547
1 缩写 & 引用
Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems
2 abstract & introduction
本篇论文的主要贡献:
- 提出了DNN压缩方法:向量量化vector quantizaion
- 提出了accelerator,可以支持不同的codebook和kernel尺寸
- cycle-accurate python model来估计模拟这种dataflow,估计所需的cycle数
3 提出的架构
首先矢量量化vector quantization需要将数据分成好几个子空间,分割方法是每Cs′C_s'Cs′个input channel分成一个子空间,比如下图是按照Cs′=4C_s'=4Cs′=4分割的
分割完子空间,每个子空间有一个codebook,有K个可能的权重矢量
3.1 PE架构
因为有codebook,计算也可以通过查找表进行,所以PE计算流程分成预计算、dispatch、累加三步,预计算就是提前计算好查找表
4 数据流
数据流包括weight stationary、row stationary-like
5 实现结果
- caffenet:Cs′=4C_s'=4Cs′=4,K=128K=128K=128
- VGG-16:Cs′=8C_s'=8Cs′=8,K=128K=128K=128
只是综合了,没有流片,还通过一个周期准确的python模型来仿真周期数