E3--FPGA实现LVDS收发实例和原理2022-12-03

晓晓暮雨潇潇 2023-04-22 原文

1.什么是LVDS

一个新东西来的时候，人们总是希望能够宏观的定性的认识它。一个问题是，手机上用的“软件”该如何定义呢？来自百度百科的定义是，软件是指一系列按照特定顺序组织的计算机数据和指令的集合，如果你是非专业人员，第一次听说“软件”并听到这样的定义应该不会有好的感知。另外一种回答是，类似手机里“微信”的就是一个软件，虽然仍然不知道软件如何标准定义，但这个回答显然能让更容易的感知“软件”这个名词。生活中往往需要从另外一个事物A认识事物B，这个A可能和B存在某种关系，由于A很简单从而对B有了宏观的感知。生活如此，学习一个新的技术也是如此，或者说，学技术如此，生活也是如此。那该如何宏观感知LVDS呢？

LVDS的标准定义是Low-Voltage Diffferential Signaling低电压差分信号，为了克服以TTL电平方式传输宽带高码率数据时功耗大，电磁干扰大等缺点出现了LVDS技术，它具有低功耗、低误码率、低串扰和低辐射等特点。LVDS接口使用1.2V 偏置电压作为基准（共模直流电压），其正负端的摆幅大约为350mV，即所谓的差模电压。在网络上检索LVDS会出现各种说法，LVDS接口、LVDS电平、LVDS协议、LVDS技术，到底该如何理解呢？从电气标准的角度，LVDS是一种电平标准，其他常见的电平标准还有TTL、LVTTL、SSTL、LVCMOS、RS232、RS485等，不同电平标准有不同的场景应用。在Xilinx的FPGA中，支持这个电平标准，并且有LVDS_25\LVDS\LVDS33等，后续会介绍xilinx LVDS使用注意事项。从接口的角度看，LVDS可以称作接口，侠义的接口例如USB接口，千兆网口，麦克接口都是指某个物理硬件，可以连接起来。而广义的接口包括API、Sockets、弱函数、虚函数等软件上的接口，二者有一个共同的特点就是要在接口两端实现信息的传递，从这个意义上讲，LVDS是一个侠义的硬件接口。关于LVDS技术，这个说法主要是指LVDS接收器和收发器的硬件上的组成部分，大多数低速数字逻辑电平（如TTL、CMOS）是以电压对参考地的幅值来判断是高电平还是低电平， LVDS却完全不一样，它是通过数据接收器同相端与反相端的电压相对大小判断高低电平的，而不是通过同相端或反相端对公共地（GND）。通过恒流源和全桥开关电路不同晶体管的通断形成电压摆幅。关于LVDS协议，这种说法应该是不对的，通常协议是指规定两个或多个通信实体之间进行交换的报文格式和次序，LVDS并没有做这些规定。因此当设备与控制芯片（如FPGA）通过LVDS接口相连时，如何正确传输数据，这是控制芯片去适配设备接口属性的，这也是本篇要解决的问题，即实现FPGA上的LVDS与外部设备通信，实例中用到的外部设备也是FPGA。同样这也是LVDS的本质意义，即如何通过硬件电路LVDS接口实现通信。文末附本例源码。

2.LVDS传输模型

如上图所示，LVDS是典型的源同步传输模型，除此以外还有即将被淘汰的系统同步模型和现在应用广泛的自同步模型。源同步模型由数据线和时钟线组成，LVDS传输支持速率一般在155Mbps（大约为77MHZ）以上，推荐最大速率为655Mbps，理论极限速率为1.923Gbps。这里的时钟通常称之为随路时钟，并没有规定这个随路时钟的时钟频率是多少，但通常是并行时钟或者串行时钟（SDR）或串行时钟除以2（DDR模式）。它存在的意义便是帮助接收端恢复数据。恢复的过程是同步于随路时钟，发送一个双方约定好的Pattern，当接收端恢复出pattern时，认为通道可以传输有效数据。当通信速率较小的源同步模型，例如cypressUSB3.0方案中，可以通过将随路时钟相移的方法满足cypress芯片的时序参数要求。但LVDS的线速度是比较高的，需要通过逻辑代码中微调来找到数据采样的中心点。

关于LVDS接口通信的其他概念结合上图阐释，截图出自xapp585-lvds-source-synch-serdes-clock-multiplication.pdf，可以看到随路时钟采用的是并行时钟，一共有五个LVDS传输线同步于此时钟，此外还有通道的概念，通常是一个通道有一个单独的随路时钟，通道内有几个LVDS传输线。图中随路时钟的占空比并不均匀，在一个传输线高电平期间传输3bit，在低电平期间传输4bit，一个并行时钟周期单个传输线上传输的bit个数称为串化因子，图中串化因子是7。SDR模式和DDR模式是相对于串行时钟说的，DDR就是在串行时钟的上升沿和下降沿都发出数据。因此，一个并行周期将传输 7bit*5lines=35bit数据。上述提及的各个LVDS通信中的概念应该是通信双方已知的，就像串口传输通信双方应该协调好波特率等参数。

LVDS传输模型常用于液晶屏的信号接收端口，ADC转接芯片的数据输出端口，CMOS图像数据输出接口等场景。

3.LVDS硬件设计注意事项

1.不同型号的FPGA对于LVDS的速度支持是不同的，选型时需要注意。以下截图出自xilinx A7 datasheet。

2.应该确认Bank类型，HR bank只有在供电电压是2.5V的时候才可以使用内部电阻，当bank电压为其他值时，此时只能作为输入管脚且不能使用内部电阻。对于HP bank标准电压是1.8v，当bank电压是1.8v时可以使用内部电阻，当bank电压为其他值时，此时只能作为输入管脚且不能使用内部电阻。可在UG475中查看当前Bank是HR还是HP。

3.LVDS_25和LVDS（指1.8V）是可以互相通信的，这是因为他俩的直流特性是一样的。即设备之间通信也是，LVDS与LVDS_25可以相互通信，但要确保Vdiff和Vcm是兼容的。以下截图来自于xilinx官方回复，HR bank使用内部的终端电阻的时候，必须配置为LVDS_25,即bank电压为2.5v；当作为输入管脚，且不使用内部电阻，可以配置成其他电压；LVDS与LVDS_25可以相互通信，但要确保Vdiff和Vcm是兼容的（可在Datasheet中查看该属性）。第二张图是为了更好的说明了LVDS使用的问题。

4.最后是7系列不在支持LVDS_33，原因如图所示。

4.发送端LVDS程序设计

根据前三节的描述，搭建LVDS发送端程序首先要明确以下三个事项，①明确属性，包括通道个数，LVDS传输线个数，串化因子的大小，训练数据pattern值，以及SDR或DDR模式，随路时钟的大小；②明确当前硬件环境，随路时钟应该接MRCC或者SRCC管脚，否则vivado编译会不通过；差分数据管脚应该连接在FPGA上的PN差分对，并要确认好管脚所在bank的供电电压；还应该查看FPGA芯片数据手册判断是否支持需求的传输速率。③根据应用场景，例如LVDS发送端发送数据到LVDS液晶显示屏，则要遵守液晶显示屏时序的相关要求。在上述事项明确的前提下，LVDS发送端要解决的问题便是，将来自其他模块的应用数据按照既定的传输模型并转串后，接入到FPGA内部的LVDS发送器完成数据的发送。为此，xilinx 7系列提供了OBUFDS原语实现单端信号转LVDS差分信号的转换（可理解为该原语指向FPGA内部的LVDS发送器），提供了OSERDES2原语实现逻辑中应用并行数据的串行化处理。

本次实例拟8位传化因子，1个通道，2个LVDS，DDR模式，随路时钟为200MHz，并行时钟为50MHz,pattern值为0xe9，LVDS相关引脚连接某A7芯片Bank16，bank电压为2.5V。所发送的应用数据为测试数据为1-255自增，发送端逻辑框图如下

5.接收端LVDS程序设计

5.1接收端概述

接收端的传输模型各个属性应该与LVDS发送端各属性一致，例如，如果用于接收CMOS图像传感器的图像数据，则接收端程序的串化因子、通道个数等将要与设备一致。在硬件设计上，LVDS时钟线和LVDS数据线应该等长设计，但由于布线制板工艺的影响，难免数据线和时钟线无法同时到达接收端，在传输速度快时，微乎其微的偏差都可能让数据出错，这就是LVDS接收端要解决的问题，即在数据稳定窗口的中心采样，保持数据的稳定，这个动作称之为位对齐。此外，当在数据线上重复发送ABCDEFGH（假设一个字母代表一个bit），有可能接收到的是BCDEFGHA产生字偏移，通过ISERDES2的bitslip可以完成数据的平移，这个动作称之为“字对齐”。接收端通过IBUFDS进行差分转单端信号便于逻辑处理，将lvds传输线上的串行数据经过IDELAY2进行位对齐操作，随后利用ISERDES2将该串行数据并行化即字对齐操作，将发送端的数据恢复。其难点就在于如何实现字对齐和位对齐操作。Xilinx提供了多个例程适用于不同系列的FPGA，如xapp860和xapp855适于V5，xapp585适用于7系列，还有适用于ultrascale的例程。本例程基于xapp855修改使之适配7系列并满足既定传输模型属性要求。

5.2逻辑框图

以下框图截取自xapp855，与示例程序并不一致。数据差分信号经IBUFDS转化为单端信号，进入IDELAY2（由于xapp855适用于V5，而当前程序适用于7系列，因此原语的名称有所不同）将数据位对齐后进入ISEDERS2转换成并行数据；时钟差分信号经过IBUFDS转化成单端信号，进入IDELAY2（此处为0，以时钟到达为基准）由BUFR倍频出并行时钟，经BUFIO产生串行时钟。此外，使用IDELAY必须要使用IDELAYCTRL，输入200MHz作为参考时钟。还有两个逻辑模块一个是Bit Align Machine实现位对齐字对齐，产生ISERDES2和IDELAY2所需的信号，完成当前LVDS传输线的对齐操作。Resource sharing control实现通道切换，和训练完成的指示。

5.3xapp855训练代码解读

通道选择模块较为简单，主要介绍Bit Align Machine模块是如何完成单通道的数据训练操作。将ISERDES2模块传入的并行数据A打一拍得到B，当A不等于B的时候，认为此时遇到了亚稳态，即建立时间或者保持时间不满足要求的情况。当连续几个周期B等于pattern数据时，认为此时的采样点可用，字对齐也完成。完成数据训练的主要思路是，先使用IDEALY延迟直到找见一个亚稳态的点，未找见就延迟加1，然后继续增加延迟并加入字节对齐的判断直到找到Pattern数据，认为此时找到了数据窗口的左值，继续增加延时值，直到找见下一个亚稳态的采样点。从第一个pattern数据出现，增加延时值到下一个亚稳态的出现之间就是数据有效窗口，然后通过减去延迟值找到采样中心点，此后再次判断字对齐的情况，当字对齐结束后认为此LVDS传输线数据训练完成。由Resource sharing control控制开始训练下一个LVDS传输线。

以上截图出自xapp855的解释说明，步骤①即是假定数据和时钟到达时二者的相对位置关系。步骤②是经过延时找到了第一个亚稳态窗口（Transition），图中斜线部分代表此时数据采样不稳定。步骤③是通过延时和bitslip寻找到数据有效窗口的左值（Eye）。步骤④是通过延时找到下一个亚稳态窗口，由此在③和④之间便是数据有效的窗口。步骤⑤是将采样点控制到数据有效窗口的中心位置。需要注意，IDELAY2总共只有32个阶，当参考时钟是200MHz时，每一阶延时78ps，即总共可延时32*78=2496ps=2.5ns。因此数据传输的线速率不能太低，线速率太低时需要采用别的方法或者调整该状态机，否则会错误的找到最佳采样点，出现不稳定的情况，因此使用该程序，其线数据传输速率建议大于400Mbps。

下面对该模块中状态机简单分析便于理解。

00000不动（指各计数模块，idelay、bitslip均不做操作，后同），保证不与通道切换指令冲突。
00001不动比较前一个后一个，不相等认为找见第一个亚稳态窗口。
01000 SAMPLE（指代码中信号含SAMPLE的128bit计数器，后同）计数器加1，连续抓15次判断是否为亚稳态窗口。
01011 IDELAY延时加1，两个计数器清0。
00100 SAMPLE控制7个周期后判断是否亚稳态，如此循环直到找到亚稳态窗口，即进入01111状态。（上述五个步骤必定能找见亚稳态窗口）
01111 SAMPLE清0 IDEALAY加1 准备寻找pattern。
01101 SAMPLE加1 JC添加8周期等待找等于check pattern 找见就准备记录重复上述步骤，直到找见稳态check pattern即渡过第一个窗口 bitslip=1。
01100 SAMPLE清0 （进入IDLE状态）。
10000 第二个idle 不动作。
00010再次确认是否退出了窗口如果没有退出，重复上述步骤直到退出。
01110 确认跳出第一个亚稳态窗口，该状态CNT开始计数，找左值。
01001 idelay值加1 CNT开始计数(记录的是数据有效窗口的大小，CNT指代码中不含SAMPLE的128计数器) 找下一个亚稳态区域。
00011 SAMPLE计数控制8周期后比较数据，复制当前的CNT中的计数值，找见第二个就退出，找不见就重复上面步骤。
10010 计数器全部清0 无动作跳转。
01010 idelay减一减到有效采样的中间处即可，清0CNT。思考，假如taps的值不够用怎么办（即前文提到线数据速率不能太慢，否则会出现这种情况）。
00101 CNT控制延时，再次确认是否word对齐，默认当前已经到了采样中心点 word对齐则进入成功完成数据训练状态，word没有对齐就再次进入word对齐状态
00110 bitslip一次
00111 指示当前通道训练完成，准备切换到下一个通道，重复上述步骤进行训练

6. 接收端发送端联调

将发送端和接收端写在一个工程里，验证LVDS的收发，其结果如下,可以看到发送端发送的数据与接收的数据一致，data_aglin信号拉高，代表数据训练完成。

7.总结

本例源码，参考资料

①本文只是提供了众多实现lvds收发方法中的一种，例如，可以使用ODDR原语产生差分信号；IDELAY有四种模式，本文使用VARIABLE模式，还可以尝试VAR_LOAD模式；xilinx提供了一个名为SelectIO Interface Wizard的ip核其中涵盖了LVDS收发使用的全部selectio资源，在领悟本例精神后可以用其练手。

②寻找数据中心的方式也是可以灵活多变的。

③xapp855的代码结构以及代码风格可以提供一种新的思考，包括通道与训练的管理，计数器的服用，以及状态指示训练完成的写法都值得学习和总结。

④Xapp585提供了基于7系列的原语设计，便于工程的移植和扩展，另外其位对齐和字对齐分开实现，是数据训练的另外一种思路。

⑤关于文中提到的原语的使用可返回目录查看对应文章。

⑥7系列的iserdes2原语要求bitslip后三个周期才能下一次bitslip，因此在LVDS收发程序中加入了这里的控制。

有关E3--FPGA实现LVDS收发实例和原理2022-12-03的更多相关文章

ruby-on-rails - 如何使用 instance_variable_set 正确设置实例变量？ - 2
我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用？最佳答案我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击
ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2
在我的应用程序中，我需要能够找到所有数字子字符串，然后扫描每个子字符串，找到第一个匹配范围(例如5到15之间)的子字符串，并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串，例如，re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项，并且只替换第N个匹配项，我该怎么做？例如，如果我想替换第三个匹配项“10”(匹配项[2])，我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg
ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2
我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征，我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现，但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden
ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2
我有一个正在构建的应用程序，我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是，在make_tires内部有一个错误，如果我为Tire尝试它，则没有用于创建或新建的activerecord方法。当我检查轮胎时，它没有这些方法。我该如何补救？错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发，它们都因相同的错误而失败。最佳答案
ruby-on-rails - RSpec:避免使用允许接收的任何实例 - 2
我正在处理旧代码的一部分。beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)endRubocop错误如下:Avoidstubbingusing'allow_any_instance_of'我读到了RuboCop::RSpec:AnyInstance我试着像下面那样改变它。由此beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)end对此:let(:sport_
ruby-on-rails - 使用 ruby 将多个实例变量转换为散列的更好方法？ - 2
我收到格式为的回复#我需要将其转换为哈希值(针对活跃商家)。目前我正在遍历变量并执行此操作:response.instance_variables.eachdo|r|my_hash.merge!(r.to_s.delete("@").intern=>response.instance_eval(r.to_s.delete("@")))end这有效，它将生成{:first="charlie",:last=>"kelly"},但它似乎有点hacky和不稳定。有更好的方法吗？编辑:我刚刚意识到我可以使用instance_variable_get作为该等式的第二部分，但这仍然是主要问题。
华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2
华为OD机试题本篇题目：明明的随机数题目输入描述输出描述：示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o
基于C#实现简易绘图工具【100010177】 - 2
C#实现简易绘图工具一.引言实验目的:通过制作窗体应用程序(C#画图软件),熟悉基本的窗体设计过程以及控件设计,事件处理等,熟悉使用C#的winform窗体进行绘图的基本步骤,对于面向对象编程有更加深刻的体会.Tutorial任务设计一个具有基本功能的画图软件**·包括简单的新建文件,保存,重新绘图等功能**·实现一些基本图形的绘制,包括铅笔和基本形状等,学习橡皮工具的创建**·设计一个合理舒适的UI界面**注明:你可能需要先了解一些关于winform窗体应用程序绘图的基本知识,以及关于GDI+类和结构的知识二.实验环境Windows系统下的visualstudio2017C#窗体应用程序三.
MIMO-OFDM无线通信技术及MATLAB实现（1）无线信道：传播和衰落 - 2
MIMO技术的优缺点优点通过下面三个增益来总体概括：阵列增益。阵列增益是指由于接收机通过对接收信号的相干合并而活得的平均SNR的提高。在发射机不知道信道信息的情况下，MIMO系统可以获得的阵列增益与接收天线数成正比复用增益。在采用空间复用方案的MIMO系统中，可以获得复用增益，即信道容量成倍增加。信道容量的增加与min(Nt,Nr)成正比分集增益。在采用空间分集方案的MIMO系统中，可以获得分集增益，即可靠性性能的改善。分集增益用独立衰落支路数来描述，即分集指数。在使用了空时编码的MIMO系统中，由于接收天线或发射天线之间的间距较远，可认为它们各自的大尺度衰落是相互独立的，因此分布式MIMO
【Java入门】使用Java实现文件夹的遍历 - 2
遍历文件夹我们通常是使用递归进行操作，这种方式比较简单，也比较容易理解。本文为大家介绍另一种不使用递归的方式，由于没有使用递归，只用到了循环和集合，所以效率更高一些！一、使用递归遍历文件夹整体思路1、使用File封装初始目录，2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组，取出每个File对象4-1、如果File是否是一个文件，打印4-2、否则就是一个目录，递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg