FPGA学习笔记#4 Vitis HLS 入门的第一个工程

🕗 发布于 2024-11-12 02:43 fpga开发学习笔记 c++ 嵌入式硬件

本笔记使用的Vitis HLS版本为2022.2，在windows11下运行，仿真part为xcku15p_CIV-ffva1156-2LV-e，这一篇终于没有再大量使用别人的内容，是我自己从头捋到尾的结果，不过之后的笔记还是要参照别人的教程就是了。

学习笔记：《FPGA学习笔记》索引
FPGA学习笔记#1 HLS简介及相关概念
 FPGA学习笔记#2 基本组件——CLB、SLICE、LUT、MUX、进位链、DRAM、存储单元、BRAM
FPGA学习笔记#3 Vitis HLS编程规范、数据类型、基本运算
 FPGA学习笔记#4 Vitis HLS 入门的第一个工程
 FPGA学习笔记#5 Vitis HLS For循环的优化（1）
FPGA学习笔记#6 Vitis HLS For循环的优化（2）
FPGA学习笔记#7 Vitis HLS 数组优化和函数优化
 FPGA学习笔记#8 Vitis HLS优化总结和案例程序的优化

1.工程的创建

Vitis的安装请自行查找教程，本教程使用的Xilinx IDE为Vitis HLS，比较早的版本则可以使用Vivado HLS，功能都差不多。

首先点击Create Project创建工程。

输入工程名和工程目录，点击Next。

无视添加Design文件和Testbench文件，我们之后再加，直接点Next。

选择FPGA型号，根据自己需要写，如果想完整复现结果就选一样的，选完后点OK，再点Finish完成创建。

工程创建结束。

2.添加程序文件

在工程界面左上角是资源管理器，右键Source->New Source File，创建top.h和top.cpp（一次只能创建一个文件），然后同样的方式右键Test Bench->New Test Bench File，创建test.cpp文件。文件存储位置任意，可以放在工程根目录。

创建完成后如下图所示：

至于为什么不和其他教程里叫VectorAdd.h和.cpp，因为这样以后用这个工程直接跑别的测试没有啥违和感。

3.程序编写

我们用一个经典的测试例程，数组A的每一个元素+数据t，其结果输出到数组B中。

top.h：

// top.h
#define N 5
typedef int data_t;
void VectorAdd(data_t A[N],data_t t,data_t B[N]);

top.cpp：

// top.cpp
#include "top.h"

void VectorAdd(data_t A[N],data_t t,data_t B[N])
{
unsigned int i;
myloop:
for(i=0;i<N;i++)
{
B[i] = A[i] + t;
}
}

test.cpp：

#include <iostream>
#include <iomanip>
#include "top.h"

using namespace std;

int main(){
data_t A[N] = {-4,-3,0,1,2};
data_t c = 5;
data_t B[N] = {0};
data_t RefB[N] = {1,2,5,6,7};
unsigned int i = 0;
unsigned int errcnt = 0;

VectorAdd(A,c,B);

cout<<setfill('-')<<setw(30)<<'-'<<'\n';
cout<<setfill(' ')<<setw(10)<<left<<"A";
cout<<setfill(' ')<<setw(10)<<left<<"C";
cout<<setfill(' ')<<setw(10)<<left<<"B"<<'\n';
cout<<setfill('-')<<setw(30)<<'-'<<'\n';

for ( i = 0;i<N;i++)
{
cout<<setfill(' ')<<setw(10)<<left<<A[i];
cout<<setfill(' ')<<setw(10)<<left<<c;
cout<<setfill(' ')<<setw(10)<<left<<B[i];
if(B[i] == RefB[i])
{
cout<<'\n';
}
else
{
cout << "(" << RefB[i] << ")" << '\n';
errcnt ++ ;
}
}

cout << setfill('-') << setw(30) << '-' <<'\n';

if(errcnt > 0)
{
cout << "Test Failed" << '\n';
return 1;
}
else{
cout<< "Test Passed" << '\n';
return 0;
}
}

4.指定Top函数（第一次执行）

第一次执行前，我们要先配置程序的Top函数，HLS的程序分为内核代码（Top函数及其依赖）和主机代码（Test Bench及其依赖）。

点击菜单栏Project->Project Settings。

点击Synthesis->Browse，选择仿真的Top Fuction。

选择编写的VectorAdd函数，依次点击OK后配置完成。

5.程序运行

5.1.C仿真

点击左下角的Run C Simulation，执行C仿真，得到代码的执行结果。

直接点OK。

打印内容为下，说明仿真执行成功。

5.2.C综合

点击Run C Synthesis执行C综合。

点击OK。

可以看到C代码被综合成RTL代码后，会给出其性能指标、使用的硬件资源量，以及下面会给出接口等信息。

循环迭代延迟就是从上一轮循环结束到判断是否进入下一轮循环的延迟，比如for(int i=0; i<N; i++)中i++和i<N所需的时钟周期数，Interval就是循环之间的间隔周期数。

5.3.C/RTL联合仿真

进行RTL和C的联合仿真CoSimulation。

注意这里Dump Trace要选择port，仿真后才可以查看波形。

联合仿真结束后会打印报告，主要作用为显示执行性能指标Latency，同时如果Dump Trace为port，则左上角的波形图图标会亮起，点击可以查看仿真波形。

打开波形图后，首先将原来的展示部分全部删除，然后只将Top函数（VectorAdd）生成的结果拖动到波形窗口，然后点击图中的图标展开所有信号。

然后可以看到有一些值我们直接看看不懂，那是因为它默认按照十六进制显示，右键对应的数据，然后选择Signed Decimal，因为我们使用的是有符号数据，所以选择这个。

也可以设置Signal Color来配置不同数据的颜色，看起来更加方便一些。

从这张图可以很清晰的看到A数组、B数组取出的数据，用于取出数据的地址，以及运算得到的结果。

6.简单的优化

接下来我们对Top函数进行简单的优化，因为新版本的Vitis中对每个循环默认添加了PIPELINE（流水线）优化，因此我们对top.cpp的loop进行UNROLL（展开）优化。

首先New一个Solution：

编写solution的名称，并确定是否从其他solution中拷贝约束，因为solution1中没有配置任何约束，所以勾不勾选都可以。

添加solution后会自动切换到该solution，正在使用的solution图标左上角会有一个对钩。

选择top.cpp，点击右侧的Directive（没有的可以在Window->Show View->Directive打开），右键myloop标签，添加约束。

选择UNROLL，并点击OK，完成添加，这里选择Directive File会将约束语句放在solution_name/constraints/directive.tcl中，选择Source File会将约束语句直接写在程序中，这里以Source File为例，因为之后也会用到在程序中直接编写约束的情况。

添加Source约束后会在for循环左大括号的下一行添加#pragma HLS UNROLL，这也是我为什么目前更喜欢添加到源文件，因为学习起来更加直观一些，添加到directive文件的话测试移植等则更加方便。

再次执行C仿真，可以得到结果如下，应该是很明显有效率的提升，那我们该怎么更方便的对比呢？Vitis HLS提供了多个Solution仿真报告的比较功能。

点击Project->Compare Reports。

将左侧的可选报告双击或Add到右边，上下顺序在对比报告中会对应左右顺序，可以在这里调整。

生成的对比报告可以更清楚的区分和对比各个solution的性能，因为它把运行时间、Latency、资源消耗都分开展示，所以这个功能也可以用来分析单个报告，可以更直观一些。

性能对比：

资源使用量对比：

可以看到性能提升很明显，同时LUT的使用量也变多了，是用资源换取性能的操作。

原文地址：https://blog.csdn.net/qq_38876396/article/details/143645004

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：linux 进程调度学习笔记
下一篇：C++零基础入门&趣味学信息学奥赛_开发环境安装

关于强化学习的一份介绍
假设你在一家赌场里面对一台有 k 个摇臂的老虎机，每个摇臂都有不同的中奖概率。每次拉其中一个摇臂，你都会得到一个奖励（通常是金钱）。你的目标是在有限次尝试内最大化累计奖励。在这个问题中，“摇臂”代表不
阅读更多2024-11-17
ADS学习笔记 5. 微带天线设计
ADS学习笔记 5. 微带天线设计
阅读更多2024-11-17
D70【 python 接口自动化学习】- python 基础之数据库
1. 使用Python实现读取写入数据库操作ps.今天去看航展了，歼20简直不要太快，明天再来补作业~
阅读更多2024-11-17
AI写作（十）发展趋势与展望（10/10）
例如，在阅读一篇复杂的文章时，AI 写作工具可以提取出关键信息，让学生快速掌握文章的核心内容。AI 写作助手可以根据用户输入的主题和要求，自动生成文章的大纲和结构，帮助学生和教师快速了解文章的主要内容
阅读更多2024-11-17
用户自定义IP核——ZYNQ学习笔记6
通过自定义一个 LED IP 核，通过 PS 端的程序来控制底板上 PL 端 LED1 呈现呼吸灯的效果，并且 PS 可以通过 AXI 接口来控制呼吸灯的开关和呼吸的频率。
阅读更多2024-11-17
从零开始学习 sg200x 多核开发之 eth0 自动使能并配置静态IP
本文将介绍如何通过配置文件启动自动使能有线网络。
阅读更多2024-11-17
软考之RESTful 架构的特点
为了实现前后端分离，首先需要设计并定义 RESTful API。API 应该清晰地定义每个资源的 URI、支持的 HTTP 方法、请求和响应的格式等。资源建模：识别系统中需要哪些资源，并为每个资源分配
阅读更多2024-11-17
C++初阶——优先队列
/创建一个默认的优先队列//默认是priority_queue<int,vector<int>,less<int>()> pq1;//改为小根堆return 0;
阅读更多2024-11-17
【AI图像生成网站&Golang】JWT认证与令牌桶算法
在 JWT 中，Payload 就是 Token 的核心数据部分，用来存储那些需要在两方之间传递的信息。它包含了自定义的声明（Claims），例如用户的标识（user_id）或过期时间（exp）。单位
阅读更多2024-11-17
怎样遵守编程规范，减少和控制C++编程中出现的bug？
通过遵循 C++ 标准和最佳实践、编写规范的代码、进行防御性编程、使用静态分析和代码审查、编写单元测试和回归测试，以及记录日志和使用调试工具，你可以有效地减少和控制 C++ 编程中出现的 bug。这些
阅读更多2024-11-17