热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

zynqhls定点数计算

在神经网络的fpga加速中,定点运算不仅比浮点运算更节省资源,还具有更快的速度,而且因为定点运算造成的神经网络的精度损失亦可忽略不计。本节

在神经网络的fpga加速中,定点运算不仅比浮点运算更节省资源,还具有更快的速度,而且因为定点运算造成的神经网络的精度损失亦可忽略不计。本节介绍如何使用HLS进行定点运算以及如何与zynq cpu交互。

HLS中,有头文件ap_fixed.h,极大的方便了我们使用定点数,具体情况略。

HLS代码示例

#include
#include
typedef ap_fixed<16,8, AP_RND, AP_SAT> data_t;
data_t fixed_test(volatile data_t *src1,volatile data_t *src2,volatile data_t *dest){
#pragma HLS INTERFACE m_axi depth&#61;100 port&#61;src1 offset&#61;slave bundle&#61;MASTER_BUS1
#pragma HLS INTERFACE m_axi depth&#61;100 port&#61;src2 offset&#61;slave bundle&#61;MASTER_BUS2
#pragma HLS INTERFACE m_axi depth&#61;100 port&#61;dest offset&#61;slave bundle&#61;MASTER_BUS3
#pragma HLS INTERFACE s_axilite port&#61;return bundle&#61;CRTL_BUS
data_t buff1[100];
data_t buff2[100];
data_t buff3[100];
memcpy(buff1,(const data_t*)src1,10*sizeof(data_t));
memcpy(buff2,(const data_t*)src2,10*sizeof(data_t));
int i;
for(i&#61;0;i<100;i&#43;&#43;){buff3[i]&#61;buff1[i]*buff2[i];
}
memcpy((data_t*)dest,(const data_t*)buff3,10*sizeof(data_t));
return buff1[0]*buff2[0];
}

上图中&#xff0c;data_t数据类型为16位有符号定点数&#xff0c;其中整数位占8位&#xff0c;AP_RND和AP_SAT分别表示舍入和溢出的设置。程序实现了读取两个16位定点数数组&#xff0c;并且求积赋值给另一个数组的简单功能。

PS端代码

ps端&#xff0c;因为没有16为定点数类型&#xff0c;因此我们使用short类型来表示16位定点数&#xff0c;设该定点数为a&#xff0c;定点数小数部分8位&#xff0c;则short b&#61;(short)(a*(2^8))的二进制表示即为该定点数的二进制表示。PL计算结束后将结果存在dest数组中&#xff0c;则float c&#61;dest[i]/256.0的值就是最终结果。


/******************************************************************************
*
* Copyright (C) 2009 - 2014 Xilinx, Inc. All rights reserved.
*
* Permission is hereby granted, free of charge, to any person obtaining a copy
* of this software and associated documentation files (the "Software"), to deal
* in the Software without restriction, including without limitation the rights
* to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
* copies of the Software, and to permit persons to whom the Software is
* furnished to do so, subject to the following conditions:
*
* The above copyright notice and this permission notice shall be included in
* all copies or substantial portions of the Software.
*
* Use of the Software is limited solely to applications:
* (a) running on a Xilinx device, or
* (b) that interact with a Xilinx device through a bus or interconnect.
*
* THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
* IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
* FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
* XILINX BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY,
* WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF
* OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
* SOFTWARE.
*
* Except as contained in this notice, the name of the Xilinx shall not be used
* in advertising or otherwise to promote the sale, use or other dealings in
* this Software without prior written authorization from Xilinx.
*
******************************************************************************/
/** helloworld.c: simple test application** This application configures UART 16550 to baud rate 9600.* PS7 UART (Zynq) is not initialized by this application, since* bootrom/bsp configures it to baud rate 115200** ------------------------------------------------* | UART TYPE BAUD RATE |* ------------------------------------------------* uartns550 9600* uartlite Configurable only in HW design* ps7_uart 115200 (configured by bootrom/bsp)*/#include
#include
#include "platform.h"
#include "xil_printf.h"
#include "xfixed_test_hw.h"
#include "xfixed_test.h"
#include "xil_cache.h"
int main()
{Xil_DCacheDisable();int i;short *src1&#61;(short*)malloc(10*sizeof(short));short *src2&#61;(short*)malloc(10*sizeof(short));short *dest&#61;(short*)malloc(10*sizeof(short));for(i&#61;0;i<10;i&#43;&#43;){src1[i]&#61;(short)((rand()%100-50)/10.0*256);src2[i]&#61;(short)((rand()%100-50)/10.0*256);}for(i&#61;0;i<5;i&#43;&#43;)printf("%f,",(float)src1[i]/256);printf("\n");for(i&#61;0;i<5;i&#43;&#43;)printf("%f,",(float)src2[i]/256);printf("\n");XFixed_test HlsXFixed_test;XFixed_test_Config *ExamplePtr;printf("Look Up the device configuration.\n");ExamplePtr &#61; XFixed_test_LookupConfig(XPAR_FIXED_TEST_0_DEVICE_ID);if (!ExamplePtr) {printf("ERROR: Lookup of accelerator configuration failed.\n\r");return XST_FAILURE;}printf("Initialize the Device\n");long status &#61; XFixed_test_CfgInitialize(&HlsXFixed_test, ExamplePtr);if (status !&#61; XST_SUCCESS) {printf("ERROR: Could not initialize accelerator.\n\r");return(-1);}XFixed_test_Set_src1_V(&HlsXFixed_test,(u32)src1);XFixed_test_Set_src2_V(&HlsXFixed_test,(u32)src2);XFixed_test_Set_dest_V(&HlsXFixed_test,(u32)dest);XFixed_test_Start(&HlsXFixed_test);while (XFixed_test_IsDone(&HlsXFixed_test) &#61;&#61; 0);xil_printf("***********************************\n");for(i&#61;0;i<5;i&#43;&#43;){printf("%f,",(float)dest[i]/256);fflush(stdout);}return 0;
}


推荐阅读
  • 本题探讨了在一个有向图中,如何根据特定规则将城市划分为若干个区域,使得每个区域内的城市之间能够相互到达,并且划分的区域数量最少。题目提供了时间限制和内存限制,要求在给定的城市和道路信息下,计算出最少需要划分的区域数量。 ... [详细]
  • 本次考试于2016年10月25日上午7:50至11:15举行,主要涉及数学专题,特别是斐波那契数列的性质及其在编程中的应用。本文将详细解析考试中的题目,并提供解题思路和代码实现。 ... [详细]
  • 优化局域网SSH连接延迟问题的解决方案
    本文介绍了解决局域网内SSH连接到服务器时出现长时间等待问题的方法。通过调整配置和优化网络设置,可以显著缩短SSH连接的时间。 ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 本题旨在通过给定的评级信息,利用拓扑排序和并查集算法来确定全球 Tetris 高手排行榜。题目要求判断是否可以根据提供的信息生成一个明确的排名表,或者是否存在冲突或信息不足的情况。 ... [详细]
  • 本文将深入探讨如何在不依赖第三方库的情况下,使用 React 处理表单输入和验证。我们将介绍一种高效且灵活的方法,涵盖表单提交、输入验证及错误处理等关键功能。 ... [详细]
  • 本文探讨了在C++中如何有效地清空输入缓冲区,确保程序只处理最近的输入并丢弃多余的输入。我们将介绍一种不阻塞的方法,并提供一个具体的实现方案。 ... [详细]
  • 本文详细介绍了 Java 中的 org.apache.hadoop.registry.client.impl.zk.ZKPathDumper 类,提供了丰富的代码示例和使用指南。通过这些示例,读者可以更好地理解如何在实际项目中利用 ZKPathDumper 类进行注册表树的转储操作。 ... [详细]
  • 本问题探讨了在特定条件下排列儿童队伍的方法数量。题目要求计算满足条件的队伍排列总数,并使用递推算法和大数处理技术来解决这一问题。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 在高并发需求的C++项目中,我们最初选择了JsonCpp进行JSON解析和序列化。然而,在处理大数据量时,JsonCpp频繁抛出异常,尤其是在多线程环境下问题更为突出。通过分析发现,旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估,我们最终选择了RapidJSON作为替代方案,并实现了显著的性能提升。 ... [详细]
  • 在 Flutter 开发过程中,开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说,理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景,并通过实例帮助你更好地掌握这一重要工具。 ... [详细]
  • 深入理解Shell脚本编程
    本文详细介绍了Shell脚本编程的基础概念、语法结构及其在操作系统中的应用。通过具体的示例代码,帮助读者掌握如何编写和执行Shell脚本。 ... [详细]
  • MySQL DateTime 类型数据处理及.0 尾数去除方法
    本文介绍如何在 MySQL 中处理 DateTime 类型的数据,并解决获取数据时出现的.0尾数问题。同时,探讨了不同场景下的解决方案,确保数据格式的一致性和准确性。 ... [详细]
  • Qt QTableView 内嵌控件的实现方法
    本文详细介绍了在 Qt QTableView 中嵌入控件的多种方法,包括使用 QItemDelegate、setIndexWidget 和 setIndexWidget 结合布局管理器。每种方法都有其适用场景和优缺点。 ... [详细]
author-avatar
寒江大哥_599
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有