延迟时间
传输延迟τPHL、τPLH定义为:在输入到输出波形的50%电压处(阈值电压)。
上升/下降时间τr、τf定义为10~90%的电压时间。
计算
长沟道CMOS
τPHLτPLH=kn(VDD−VT0,n)Cload[VDD−VT0,n2VT0,n+ln(VDD4(VDD−VT0,n)−1)]=kp(VDD−∣VT0,p∣)Cload[VDD−∣VT0,p∣2∣VT0,p∣+ln(VDD4(VDD−∣VT0,p∣)−1)]
这里的“上升”与“下降”显然都是针对输出而言的。输出如果上升,那一定是PMOS导通、NMOS关断,因此电流从PMOS流过,公式内的系数为kp;输出下降亦然,PMOS关断、NMOS导通,电流从NMOS流过,公式内的系数为kn。
可以看出:
- 延时时间与负载电容成正比
- 延时时间与晶体管的尺寸(W/L)成反比
- 延时时间与电源电压成反比
- 阈值电压越大,延时越大
短沟道CMOS
τPHLτPLH=knCloadEc,nLn2(VDD−VT0,n)2V50%[(VDD−VT0,n)+Ec,nLn]=kpCloadEc,pLp2(VDD−∣VT0,p∣)2V50%[(VDD−∣VT0,p∣)+Ec,pLp]
可以看出:
- 延时时间与负载电容成正比
- 时时间与晶体管的尺寸(W/L)成反比
- 延时时间受电源电压影响很小
- 阈值电压越大,延时越大
为什么短沟道器件的延时时间受到电源电压影响很小?
分子是V50%[(VDD−VT0,n)+Ec,nLn],V50%可看做一半的电源电压,因此分式上下都是电源电压的二次方关系,相消。
若输入信号不是阶跃,则有经验公式:
τPLHτPHL=τpLH(⊓)+(2τf)2=τpHL(⊔)+(2τr)2
动态性能
数字系统的性能通常用每秒多少指令(MIPS)或者每秒多少操作(MOPS)来表示。这取决于处理器的体系结构、软件的体系结构等。
造成电路具有传输延时的根本原因是电路中具有寄生电容,存在RC时间常数。
反相器设计
从上文的短沟道CMOS延迟时间公式可得出尺寸的公式:
(LW)n(LW)p=τPHL∗μnCoxCloadEc,nLn2(VDD−VT0,n)2V50%[(VDD−VT0,n)+Ec,nLn]=τPLH∗μpCoxCloadEc,pLp2(VDD−∣VT0,p∣)2V50%[(VDD−∣VT0,p∣)+Ec,pLp]
对于实际题目,应当在求出的尺寸范围内选择其最大的值!因尺寸越大,延时时间越短。
负载电容
在CMOS反相器中,MOS晶体管要么截止要么饱和,导致沟道电容不存在,因此Cgd的值很小,都可以忽略。
本征延时与外部延时
当反相器没有外部负载或者反相器尺寸特别大的时候,反相器具有本征延时:
τPHLlimitτPLHlimit=Γn(αn+Rαp)=Γp(Rαn+αp)
其中R为P管和N管的尺寸比值。
本征延时与外部负载电容无关,与反相器的尺寸大小无关,是反相器在一定工艺和电压下能达到的最小延时。
本征延时仅仅取决于版图!
反相器尺寸特别小的时候,延时主要由α0项也就是外部负载电容贡献。
对于负载电容,Cload=Cintra+Cext,其中Cintra是本征电容,即反相器的自负载,与反相器本身的漏结电容、栅漏电容有关;Cext是外部电容,与扇出有关。
τp=0.69ReqCload=0.69ReqCintra(1+CintraCext)=0.69SRref(SCiref)(1+SCirefCext)=tp0(1+SCirefCext)
其中Ciref为标准反相器结电容。
S增大时性能提高,但过大的S会显著增加硅面积。此外,Cintra与S成正比,会减小自身的扇出。
2024.11.06 旧版PPT上的表述有误。反相器面积增大,确实会减小自身的扇出。因此,增大反相器尺寸可以减小反相器自身的延时。
CMOS环形振荡器
三个反相器完全相同,并且上升延时和下降延时对称。
此时,f=T1=2nτp1。我们使用τp=2nf1来衡量一个工艺的好坏。
互连线
互联线寄生电容
集成电路中的连线电容主要有三部分:
金属和衬底之间的电容是平板电容;
两层不同金属边缘间的电容是边缘电容;
两层不同金属上下交叠之间的电容以及同层金属内导线之间的电容是线间电容。
工艺的进步,使得IC的几何尺寸在水平方向上的减小和垂直方向上的减小不成比例(连线厚度H几乎没有变化,而连线的间距大大减小),导致了线间电容的增加。
互连线电阻
对于方块电阻而言,方块电阻x长/宽 即可计算出电阻。
由公式易知:当截面为正方形时,电阻值与边长无关。
互连线延迟
- 集总电容模型:只适用于很短的互连线,且信号频率低时
- 集总RC模型:只要不是特别高性能的集成电路,都使用此模型
- 分布RC模型:不存在收敛解但精确
- 其他模型:π/π2、T/T2/T3……
集总RC与Elmore定理
Elmore定理使用条件:
- 电路中没有电阻回路
- 所有电容都是结点到地的电容
- 有一个输入结点,输入到所有其他结点都只有唯一路径
也可以看成:每一个电阻要连上多少次电容
R1:每一条支路公共部分都要经过R1,因此延时为R1⋅i=1∑8Ci
R2:因为节点7不经过R2,因此延时为0
R3、R4、R5:同理
R6:C6-C8会经过R6,因此延时为R6⋅i=6∑8Ci
R7:C7、C8会经过R7,因此延时为R7(C7+C8)
R8:没有经过的电容(因为到第七节点截止)
分布RC模型
分布RC模型认为每一小段的导线电阻和电容都相等。
r:单位长度电阻;c:单位长度电容。
一阶近似Elmore公式:
τNN→∞limτN=i=1∑NRij=1∑NCj=ΔL2cr⋅(1+2+...+N)=ΔL2cr⋅2N(N+1)=2RC
阶跃响应
电压范围 |
集总RC |
分布RC |
0 → 50% (tp) |
0.69 RC |
0.38 RC |
0 → 63% (τ) |
RC |
0.5 RC |
10% → 90% (tr) |
2.2 RC |
0.9 RC |
减小延时
我们应当怎样减小连线延时?
对一端很长的连线分段,并在其中插入缓冲器。只要τbuf足够小,在分段后连线延迟就会被减小。
很好理解:
因为连线延时与长度是二次方关系,因此在一半的地方插入缓冲器后,时间应当变成2⋅(21)2⋅τ+τbuf=2τ+τbuf。
实际上缓冲器延时很小,因此可起到减小连线延迟的作用。
功耗
2024.12.01 修改:仅分为静态功耗与动态功耗!
CMOS反相器的功耗由静态功耗与动态功耗构成。
动态功耗 > 短路功耗 > 静态功耗
为了降低功耗,采用多阈值工艺,高速电路使用低阈值晶体管,低速电路使用高阈值晶体管,因延迟时间中提到:阈值电压越高,速度越慢!
充电时从电源获得的能量,在电容上存储一半,另一半在PMOS上被消耗,转换为热能;放电时电容上的能量在NMOS上被消耗。
减小动态功耗:减小负载电容、降低电源电压、降低频率。
功耗准则
功耗延时积(PDP):开关一次(输入变化一次)门电路所消耗的能量,为平均功耗乘以开关一次的时间。
能量延时积(EDP):为PDP乘以开关一次的时间。它可以同时衡量在降低运算能量时延时付出的代价,使用EDP可以求出最优的电源电压。
超级缓冲器
思路:使用尺寸逐级递增的反相器链来驱动大尺寸的缓冲器
由本征延时与外部延时可知:若Cg为第一级返现器输入电容,Cd为第一级反相器漏电容(本振电容),则:
τ1τ2...τtotalCload=0.69RrefCd(SCiref)(1+CdαCg)=0.69αRref(αCd)(1+αCdα2Cg)=(N+1)τp0(1+CdαCg)=αN+1Cg=τp0(1+CdαCg)=τp0(1+CdαCg)⇒N+1=lnαoptln(Cload/Cg)
求α偏导,并假设Cg=Cd,可解出最理想的α为3.6。
考虑到N必须为整数,还需要将N取整之后重新计算α。