1、大家好,今天给大家带来的内容是,基于AXI4协议的采用AXI-HP通道完成PL侧数据发送至PS侧(PS侧数据发送至PL侧并没有实现,但是保留了PL读取PS测数据的接口)
2、如果大家用到SoC这种高级功能,那大家应该对于AXI4协议已经很熟悉了,但本文侧重点为初学者直接提供可以上手的硬件实验,大佬请忽略。
3、AXI4协议的基础内容:
之前对于AXI4协议已经做过一些总结,但是总结的不好,下面重新进行总结。
(1)关于AXI4协议的视频课以及博客
FPGA-ZCU106-PL侧读写ddr4(全网唯一)_发光的沙子的博客-CSDN博客本次给大带来了ZCU106的PL侧读写ddr4的教程,本教程是全网唯一ZCU106教程。本教程采用的是xilinx的ddr4的IP核的AXI4接口开发的,因此需要先了解AXI4总线协议。https://blog.csdn.net/qq_37912811/article/details/125952512?spm=1001.2014.3001.5502这是我之前对AXI4协议的总结nullSDK篇_58~62_AXI接口简介【Xilinx】+【Vivado】+【AXI4总线】+【FPGA】共计5条视频,包括:58_AXI接口简介(第一讲)、59_AXI接口简介(第二讲)、60_AXI接口简介(第三讲)等,UP主更多精彩视频,请关注UP账号。
https://www.bilibili.com/video/BV1gy4y1Y7zr/?spm_id_from=333.337.search-card.all.click&vd_source=6b401d1c7af4d19ac1a956340ac80699这是b站的课程,看完之后会对AXI4有更深的了解。
(2)AXI4协议的总结
①写时序

写时序,主机向从机写入数据。
一:aw开头的信号是写地址协议。主机告诉从机,我要向awaddr这个地址写数据。
二:w开头的信号是写数据协议。主机告诉从机,我要向awaddr这个地址写入wdata这个数据。
三:b开头的写响应协议。从机高速主机,你写的操作是否成功。
以上三个步骤,均需要ready以及valid双握手,这两个信号同时高电平时,协议才能正常传输。
注意:M_AXI_WR_awlen这个信号代表了每组数据需要传输的次数,在最后一次传输时,M_AXI_WR_wlas信号置为高电平。M_AXI_WR_awsize代表每次传输的字节数大小。例如,1024bit数据传输,通道最大传输为128bit;则需要传输1024bit/128bit=8次,128bit/8=16byte。
②读时序

读时序,从机向主机请求数据。
一:ar开头的信号是读地址协议。从机告诉主机,我要向araddr这个地址读数据。
二:r开头的信号是读数据协议。从机告诉主机,我要读取araddr这个地址对应的rdata这个数据。
三:没有读数据相应,rresp信号被包含在读数据协议中,用以指示读响应,表明读传输的状态。
4、PL侧向PS侧通过AXI-HP通道写入数据实验
(1)实验任务:PL侧生成数据,通过AXI-HP通道写入PS侧的ddr中。PS侧完成软件设计,完成对PL侧写来的数据处理。
(2)实验软硬件:Vivado 2019.1、ZCU106
(3)实验过程:
①建立工程:embedded_axi_hp,选择ZCU106器件
②进行PS侧设计:仅针对ZCU106
一、搜索ZYNQ添加器件后,点击红框自动布线
二、设置ddr,经本人亲测,我的ddr只能用这个设置,大家自己多调一下看看吧,这儿挺坑的。

四、添加HP0端口,位宽选择128位(HP支持32/64/128位,PG201) 。右键各个端口,点击Make External,变成下面这样。
五、添加地址,容量自己设定,我直接用的就是系统直接给分配好的。


六、添加debug,等待一会,点击左上角的
即可。

七、设置复位模块,并点击右上角的自动布线按钮。最终变成下图。


点击红框,弹出成功表示设计无误。

八、输出产品,生成HDL
九,编写PL侧数据生成代码以及AXI4读写协议,整个项目目录如下所示。

这里给出data_gen.v代码,其余代码请联系作者
`timescale 1ns / 1ps
//
// Company: 东北电力大学
// Engineer: Yang Zheng
//
// Create Date: 2022/11/27 14:18:57
// Design Name:
// Module Name: data_gen
// Project Name:
// Target Devices:
// Tool Versions:
// Description:
//
// Dependencies:
//
// Revision:
// Revision 0.01 - File Created
// Additional Comments:
//
//
module data_gen(
input sys_clk, //系统时钟
input sys_rst_n, //系统复位,低电平有效
//写
output reg wr_en, //写使能
output reg [1023:0] wr_data, //写数据
output read_enable, //写完成,开始读
//读
output reg rd_en, //读使能
input [1023:0] rd_data, //读数据
input rd_fifo_valid, //读出数据时为高电平,由于ddr是512位的,因此我们需要计数4次,即每次读回4条数据;512/128=4
input rd_fifo_wr_ack, //写入数据为高电平
//开始写入数据物理按钮
input start_bnt
);
//********************************************************************//
//****************** Parameter and Internal Signal *******************//
//********************************************************************//
//parameter define
parameter COUTER_MAX = 30'd5_000_000;//0.2s的时间计数器
reg [29:0] time_counter = 'd0;
//reg define
reg [29:0] count = 'd0; //写入计数器
reg wr_flag = 'd0; //写标志
//********************************************************************//
//***************************** Main Code ****************************//
//********************************************************************//
assign read_enable = wr_flag;
//生成64个32位的数据并且写入PS侧
//这里的 wr_data是输入到ddr的数据,wr_en是使能端口
//这里的 wr_flag是可以ddr存有数据,因此可读标志
always@(posedge sys_clk or negedge sys_rst_n) begin
if (sys_rst_n == 1'b0) begin
wr_data <= 1024'd0;
wr_en <= 1'd0;
wr_flag <= 1'b0;
count <= 'd0;
end
else begin
if (wr_flag == 1'b0 && count < 'd4 && start_bnt == 1'b0) begin
//wr_en <= 1'd1;
count <= count + 1'b1;// 1
end
else if(start_bnt == 1'b1) begin
if (wr_flag == 1'b0 && count == 'd4) begin
wr_data <= {
32'd1 ,32'd2 ,32'd3 ,32'd4 ,32'd5 ,32'd6 ,32'd7 ,32'd8 ,
32'd9 ,32'd10,32'd11,32'd12,32'd13,32'd14,32'd15,32'd15,
32'd17,32'd18,32'd19,32'd20,32'd21,32'd22,32'd23,32'd24,
32'd25,32'd26,32'd27,32'd28,32'd29,32'd30,32'd31,32'd32
};
wr_en <= 1'd1;
count <= count + 1'b1;// 2
end
else if (wr_flag == 1'b0 && count == 'd5) begin
wr_data <= {
32'd33,32'd34,32'd35,32'd36,32'd37,32'd38,32'd39,32'd40,
32'd41,32'd42,32'd43,32'd44,32'd45,32'd46,32'd47,32'd48,
32'd49,32'd50,32'd51,32'd52,32'd53,32'd54,32'd55,32'd56,
32'd57,32'd58,32'd59,32'd60,32'd61,32'd62,32'd63,32'd64
};
wr_en <= 1'd1;
count <= count + 1'b1;// 3
end
else if (wr_flag == 1'b0 && count == 'd6) begin
wr_data <= {
32'd1 ,32'd2 ,32'd3 ,32'd4 ,32'd5 ,32'd6 ,32'd7 ,32'd8 ,
32'd9 ,32'd10,32'd11,32'd12,32'd13,32'd14,32'd15,32'd15,
32'd17,32'd18,32'd19,32'd20,32'd21,32'd22,32'd23,32'd24,
32'd25,32'd26,32'd27,32'd28,32'd29,32'd30,32'd31,32'd32
};
wr_en <= 1'd1;
count <= count + 1'b1;// 3
end
else if (wr_flag == 1'b0 && count == 'd7) begin
wr_flag <= 1'b1;
wr_en <= 1'd0;
end
end
end
end
always@(posedge sys_clk or negedge sys_rst_n) begin
if(~sys_rst_n) begin
time_counter <= 30'd0;
end
else begin
if (wr_flag) begin
time_counter <= time_counter + 1;
if(time_counter == COUTER_MAX) begin
time_counter <= 30'd0;
end
end
end
end
//根据写完成拉高读使能数据
//这里的rd_en可以控制是否读取ddr,因此每次读取给出一个周期的高电平即可
//一直读取
always@(posedge sys_clk or negedge sys_rst_n) begin
if (~sys_rst_n) begin
rd_en <= 1'd0;
end
//写完后等待0.2s开始读取数据
else begin
if(wr_flag == 1'b1 && time_counter == COUTER_MAX) begin//写完后等待0.2s
rd_en<=1'd1;
end
else begin
rd_en<=1'd0;
end
end
end
endmodule
(4)实验结果:
一、仿真结果

可以看到数据已经写入到wdata信号,bresp响应0且bvalid为高电平说明已经将数据写入到PS侧。
二、硬件结果
这里给出helloword.c代码,由于传输数据量小,因此需要将缓存屏蔽掉。
#include <stdio.h>
#include "platform.h"
#include "xil_printf.h"
#include "xil_cache.h"
int main()
{
//init_platform();
Xil_DCacheDisable();
print("Hello World\n\r");
//cleanup_platform();
return 0;
}
基于axi-hp通道的pl与ps数据交互

5、结论及展望
以上就是本实验的全部内容。本实验完成了,PL侧自定义数据传输到PS侧,并在PS侧写加软件,完成了PL侧传入数据的求和功能,发挥了整个SoC的功能,为后续PL侧加速计算,PS侧数据分析奠定了基础。
FPGA时钟和时钟域时钟树所谓时钟树为FPGA内部资源,分:全局时钟树,区域时钟树,IO时钟树原则上优先使用全局时钟树,在GT接口上使用IO时钟树,一般工具也会对GT时钟加以限制;时钟树使用方式正确的物理连接FPGA会由物理管脚专门用于全局时钟设置,通过查询数据手册可以在PCB设计阶段进行确认,当外部时钟接入此管脚时,工具会自动占有全局时钟树资源,当接入普通信号时不会分配时钟树资源;恰当的代码描述原语的使用,即BUFG的使用,可以将PLL的输出等内部时钟进行全局时钟资源的分配;IO时钟资源需要参考相应接口手册,以ultrascale的GTH为例,其JESD204的时钟方案针对不同的子类会由不同
外部SPIFLASH:MicronN25Q128A13ESE40G(128Mbit(16MByte))FPGA:XC7A100T CPU:Microblaze第一种情况:Microblaze在简单的应用,比如运行LED,IIC,SPI,UART之类的低俗接口驱动,或做一些简单的辅助型工作时,一般生成的applicationelf文件都不大,在10几KB或者几十,百几KB,此时使用FPGA内部的BRAM资源已经足够。XC7A100T本身就有600几KB的BRAM资源。这种情况下直接将硬件流文件和elf文件合并为download.bit文件,在直接烧录到外部SPIFLAH即可。1.Xilinx--
这是为了能够使用嵌入的ruby代码开发postgres函数,但我一直无法构建它。根据建议http://www.robbyonrails.com/articles/2005/08/22/installing-untrusted-pl-ruby-for-postgresql我正在尝试从ftp://moulon.inra.fr/pub/ruby/提供的最新版本(plruby-0.5.3.tar.gz)构建所需的plruby.so我已经弄清楚我的本地postgres设置在哪里,并将调用调整为:rubyextconf.rb--with-pgsql-include=/usr/postgresql-
文/高扬(微信公众号:量子论)据上次3月18号发布的V1.8版,已经过去十天,这期间AI领域发生了很多重大变化。因此,我们对《ChatGPT实用指南》进行了重大改版,增加了大量实用的操作和详细的讲解,保证小白可以轻松上手,快速驾驭ChatGPT。V2.0版本亮点:1、结构更合理。分为基础篇、进阶篇、高级篇,从易到难,由浅入深,符合学习规律。2、内容更充实。扩充了27页的内容,尽量看图说话,将操作步骤一步步地展示出来。3、排版更美观。按图书出版的规范制作,便于知识点查阅。后记:2022年11月底,我们在HackerNews上看到了关于ChatGPT的新闻报道后,开始意识到,人工智能的春天来了,这
1FPGA启动流程图1 7SerialsFPGA配置流程1.1DevicePower-Up1.2ClearConfigurationMemory在上电后的任何时间内,可以对Slave-FPGA配置存储器(BlockRAM)进行复位处理。复位方式是将PROGRAM_B信号拉低(下降沿有效)。1.3SampleModePins当复位完成后,INIT_B恢复高电平,Slave-FPGA对M[2:0]模式引脚进行采样,然后开始在CCLK上升沿接收配置数据。1.4Synchronization在接收配置数据前,Slave-FPGA首先进行总线位宽检测。主机发送的配置文件中,“BusWidthAutoDe
我有一个Google图表,其中y轴以分钟为单位。如何设置y轴的格式以便标签以类似2hrs40的格式显示时间,或2:40,或类似的东西?我不想以原始分钟显示时间,也不想将它显示为像“1.5”这样的小数90分钟。documentation告诉我使用ICUPatternSet,但我无法从该页面中找出答案。这可能吗?如果我不能像这样直接格式化时间,有没有办法在事后通过更改来“破解”图表?使用Javascript的元素? 最佳答案 格式化选项不允许您这样做。但是,您可以使用vAxis.ticks选项手动指定要用于刻度线的值以及要用来表示这些值
在我的D3折线图中,我尝试创建一个鼠标悬停效果,如本例所示:http://bl.ocks.org/mbostock/3902569在这个例子中,作者使用了平分线函数,据我所知,它只支持线性比例。问题是,在我的图表中,我有一个带有不同离散rangePoint元组的序号x轴。因此,如果像下面的情况(m=鼠标位置),我想获得最接近的x值的像素位置,在本例中为x2。m|x1----------x2----------x3有什么办法吗? 最佳答案 使用您的链接示例,这里是用于序号比例的mousemove函数的快速实现:vartickPos=x
我正在尝试在轴上添加自定义刻度,如下所示想法是一个刻度总是比前一个刻度大2倍。我的理解是这是自定义比例。我做了一些研究,但找不到类似的东西。所以我想我的问题实际上是两个问题:这个尺度是数学世界的“标准”吗?是否可以使用d3.js来实现?也欢迎任何指向相关教程或现场示例(即jsFiddle)的链接。编辑:我现在问了arelatedquestiononmathematica.stackexchange.comtohelpmefindthesolutiontothisproblem&将在我尝试一些操作后更新这篇文章。 最佳答案 在这种情况
所以我试着摆弄我的图表,发现整数/float/日期在x轴上工作得很好,但是当你输入一个字符串时,它就爆炸了。我正在尝试绘制a:Word/Count图表,但不幸的是我似乎无法将字符串放在x轴上。这在GoogleCharts中是允许的,还是严格意义上的int/floats/dates? 最佳答案 如下使用vAxis和hAxis属性google.visualization.ColumnChart(document.getElementById('visualization')).draw(data,{title:"YearlyCoffee
文章目录1、行为级与RTL级的区别1.1RTL级(可综合成门级电路)1.2行为级2、关于LUT2.1LUT是什么2.2N维查找表2.3FPGA中的LUT3、`include和条件编译4、写异步D触发器(扬智电子笔试)4.1八位同步D触发器4.2具有异步清零,同步复位信号功能的D触发器5、静态、动态时序分析的优缺点(威盛VIA2003.11.06上海笔试试题)6、采用二选一多路器mux2和inv非门实现异或操作(飞利浦-大唐笔试)7、寄存器和锁存器的区别,为什么多用寄存器,行为级描述中锁存器如何产生8、D触发器实现2分频的Verilog描述(汉王笔试)9、D触发器实现带同步高置数和异步高复位端的