【摘要】% t) k" a- T/ l) n1 L2 ^
本案例描述了一个由于CPU和PHY之间RGMII时序不满要求导致通信异常问题,最后通过电感材料(磁珠)对信号相位的移位特性来改变信号延时,从而解决RGMII信号延时不够的案例,实验结果通过。
' _ E3 a3 }3 R3 j8 U
em4hs4c5oky6402684105.jpg
" X* W e; u/ |一、问题描述
, k: P5 A3 C& n8 v. f2 c+ p* O某单板上某物理层芯片和CPU之间的接口,采用的是RGMII方式。在该单板调试过程中,发现物理层芯片发送给CPU的方向,数据一直不通。测量芯片输出的RGMII信号发现,芯片已经有发出时钟和数据信号,但是CPU接收端无法识别,在CPU的RGMII接收寄存器中,接收到的数据个数一个为0 。1 x9 L% F: s& Y8 q) ?6 E4 q5 A1 n
经实测信号分析,由于时序不满足要求,没法达到接收端建立时间要求导致该问题。如下对该问题进行分析和解决。+ D6 ?1 I( G0 b% i% `
hpj5mpmwyo46402684205.jpg
' K) ]- Z4 D: a; |0 H6 U8 Q
二、问题分析
# `: @6 `' q5 B4 _4 G$ ~( F在CPU接收端,RGMII的接收时序如下:
2 ^* x$ L5 ~* }6 s
b2bzqf3i1cj6402684305.png
+ O1 B( P" e2 K* i, t# N, x
图1-1 RGMII接收端时序要求1 Q' n) s) A- a8 K5 A+ Z
从上面的时序要求看,在接收端,要求RGMII的时钟信号边沿比数据信号的边沿延迟最小1ns,典型的延迟时间是2ns。延迟2ns的时候,RGMII的时钟边沿正好在数据的中间。% v& @2 _4 j5 m f# u$ C7 b1 [) \ [
还硬件方案中CPU端RGMII工作电压为2.5V,在物理层RGMII工作电压是3.3V。CPU和物理层芯片之间,通过转换芯片74AVC164245进行电平转换。具体的连接图如下: p2 f( U! K: ]( B S" l
ylpycu5kctl6402684405.png
9 v, K8 C3 s6 \* l/ r4 }4 e) `图1-2 物理层端的RGMII原理图
' b4 s w. ?. J) X( N) @9 z& c. A$ L
dr3h44r31cz6402684506.png
% h0 I) d# {9 G: n
图1-3 RGMII接口中的电平转换原理图/ o7 |7 `# F) u$ L* R/ {) t: X
cdbhdcb050t6402684606.png
) O$ o m" t0 O. I! @# ^4 l: t
图1-4 CPU端的RGMIII原理图$ f& t; d9 g8 s7 Y3 J3 l
在CPU接收端,测量接收到的RGMII时钟和数据,边沿是对齐的,建立时间不够不符合时序要求1ns的延时。在CPU的RGMII控制寄存器中,对时钟延迟时间进行设置,但依然不能达到要求。经与CPU厂家沟通以及实测,这个RGMII控制寄存器能调整的接收时钟延迟,最大只能到600ps。在发送端芯片内,无法对RGMII的发送时钟进行延时设置。
4 o$ C; p& S# f, m三、问题解决/ x/ v5 d2 b+ [( J) Z
为了验证该问题,首先做如下验证分析:
* X) \- C2 M- W1 U(1)为解决这个问题,考虑到增加走线长度,按照信号在PCB上的传输特性,1ns的延时,PCB内层走线的话,要绕5600mil,明显不现实。 B+ K% z( E' e$ O
(2)电平转换芯片74AVC164245手册中输入输出信号的延时,在1ns到4ns之间。正好在单板上,74AVC164245芯片有空余的PIN还没有使用,通过飞线的方式,把RGMII的时钟,在转换芯片上,多绕了一次,测试发现,数据可以通了。通过示波器测量信号,发现此时时钟比数据,延迟了大概1.5ns,满足接收端的RGMII时序要求。用这个飞线的方式,做大流量跑流测试,丢包严重,性能不稳定。
. {- y. l+ D! z' ~' t通过以上验证分析,在不改板前提下两种方式都无法解决该问题。经分析和头脑风暴,考虑到电感对信号的延时的特性,尝试使用感性材料来实现时钟的延迟。从理论上看,串联在链路中的电感,可以使交流信号相位延迟90度,这里的RGMII信号,时钟是125MHz,延迟90度,正好就是2ns,符合RGMII的接收时序要求。! y7 U9 Y1 k" W7 E
把物理层芯片的RGMII输出端的匹配电阻R26,换为100MHz@220欧的磁珠,测试发现,数据可以正常通讯,在大流量,长时间的拷机过程中,未出现丢包的情况。测量磁珠前后的时钟波形,发现时钟结果磁珠后,延时大概1.6ns。更换100MHz@600欧姆的磁珠,时钟延时2ns,但是,磁珠交流阻值越大,对信号的衰减也越大。考虑到时钟衰减和和延迟的结合,使用100MHz@180欧的磁珠,测试发现,时钟信号幅度满足要求,延时1.5ns,能满足要求。经过大流量测试,无丢包情况,通过实验。
$ t7 i! z- z. M1 T& P) K
acvkiyst5gl6402684706.jpg
3 a' b2 U* ^9 Q四、问题总结' ~1 j% q* v; b& s
本案例利用一个“野路子”解决硬件调试中常见的问题,该解决思路拓宽了我们思维边界。同时也告诉我们当遇到问题时,坚持第一性原则,追本溯源到最底层最原始的物理原理去,定能柳暗花明又一村。 |