如今,串行技术已成为计算机总线的主导技术,无论磁盘接口、
系统总线、芯片互联还是诸如USB、IEEE1394等外部总线,无一例外引入了串行技术以提高性能,传统的并行总线技术纷纷被淘汰。而这股潮流并不会很快停滞,内存及前端串行总线成为新的发展方向。 凭借速度快、发展潜力大的优势,串行总线在短短数年内几乎全盘取代了传统的并行技术,成为计算机
系统的绝对主导。这场技术革命波及所有与总线相关的领域,如外部总线中的USB与IEEE1394;而计算机内部总线受到的影响远甚于前者,比如串行ATA适时出现,AMD推出的HyperTransport总线。
7 _. w2 U# [# Z8 _9 m3 L5 C3 g' P
不过,最轰轰烈烈的革命应该是PCI Express——它的出现宣告PCI时代的终结,从此计算机的系统总线开始迈入一个全新的时代。而且,这场串行革命并没有就此终结,无论串行ATA、HyperTransport还是PCI Express,都在朝着更高的目标发展。
# l4 E- ]% I2 E1 I& a, k" G 同时,基于串行原理的新技术也不断提出,FB-DIMM串行内存和正在讨论中的串行前端总线便是当前的两大热点。
. t& n, z: m0 A0 Y& r
三大串行总线继续前行9 X1 l, f9 S5 d$ e0 f3 a& ^/ C( `$ U
作为串行总线的三驾马车,串行ATA、HyperTransport与PCI Express在PC中居于核心地位,三者分别主管磁盘系统、芯片级互联以及作为系统总线,在成功接替原有的并行技术之后,这三大串行总线并没有因此停步不前,而是朝向更高的方向迈进。串行ATA 2.0、HyperTransport 2.0以及PCI Express 2.0都开始普及或被提上日程,串行系统因此变得更为成熟,高速性也获得充分体现。
8 G, h7 K; F: ? 串行ATA 2.0登台亮相0 ]$ d! @) C' F8 ]/ p& [# Q
第一代串行ATA可以提供150MB/s的传输带宽,对目前的IDE硬盘而言这个数字应该是够用的,毕竟现在的IDE硬盘内部传输率仍未突破100MB/s,平均传输速度多在30MB/s~50MB/s,150MB/s的接口带宽是相当宽裕的,进一步向上提升并不是非常必要。
) o( W+ Q' I4 W7 v* v5 k; h 不过,朝向串行ATA 2.0的过渡并没有因此受影响。相比1.0版本,串行ATA 2.0将速度提升到300MB/s,照现在硬盘技术的发展速度来看,串行ATA 2.0满足未来5年的应用需求没有任何问题!不过,业界转向串行ATA 2.0并非因为它的高带宽,而是受到该标准所附带的其他技术的吸引,其中最主要的应该是时下火热的“本机命令队列”(Native Command Queuing,NCQ)功能。
5 r" K+ a" ~6 K% @6 `- B, H7 \9 m 我们知道,常规IDE硬盘的读写操作顺序都是依照指令顺序进行的,先到达的指令先处理,后到的指令后处理,但各个指令操作的磁盘区域往往是不连续的,在读写过程中磁头必须频繁调整,效率不高。其实,SCSI系统很早就引入了一项名为NCQ的优化机制,该机制可对磁盘的读写命令作重新安排,最终达到磁头移动距离最短、读写效率最优的目的。这项技术在实际中发挥了积极的作用,而串行ATA 2.0也因此将其引入,这样,串行ATA 2.0磁盘系统便具有了对读写命令队列作优化的能力,进而将有效提升实际效能。
( n, Q0 G% o" W 首先引入NCQ功能的应该是Intel的i915/925X系列芯片组,但它们都只是在串行ATA 1.0基础上加入该功能。首款可支持串行ATA 2.0的是NVIDIA的nForce4芯片组,Intel的i945/955X以及VIA的新一代产品也都将支持串行ATA 2.0。而硬盘厂商对串行ATA 2.0也态度积极,但由于硬盘控制器厂商未做好准备,各硬盘厂商只能在产品中实现“串行ATA 1.0+NCQ”的过渡组合,完全符合串行ATA 2.0规范的产品将在年底前推出,这样,串行ATA 2.0应用可望在2006年正式展开。
- |) r' s' \3 [5 C0 n
HyperTransport 2.0成为主流/ a ]6 ]: H- s r8 y3 n* \3 `
HyperTransport是AMD为K8平台专门设计的高速串行总线。它的发展历史可回溯到1999年,原名为“LDT总线”(Lightning Data Transport,闪电数据传输)。2001年7月,这项技术正式推出,AMD同时将它更名为HyperTransport。随后,Broadcom、Cisco、Sun、NVIDIA、ALi、ATI、Apple、Transmeta等许多企业均决定采用这项新型总线技术,而AMD也借此组建HyperTransport开放联盟,从而将HyperTransport推向产业界。
' A0 o( G& x2 Y5 c9 @+ a; o 在基础原理上,HyperTransport与PCI Express非常相似,都是采用点对点的单双工传输线路,引入抗干扰能力强的LVDS信号技术,命令信号、地址信号和数据信号共享一个数据路径,支持DDR双沿触发技术等等,但两者在用途上截然不同——PCI Express作为计算机的系统总线,而HyperTransport则被设计为两枚芯片间的连接,连接对象可以是处理器与处理器、处理器与芯片组、芯片组的南北桥、路由器控制芯片等等,属于计算机系统的内部总线范畴。
, g- k' y6 e g' E, r: n9 K$ Y 第一代HyperTransport的工作频率在200MHz~800MHz范围,并允许以100MHz为幅度作步进调节。因采用DDR技术,HyperTransport的实际数据激发频率为400MHz~1.6GHz,最基本的2bit模式可提供100MB/s~400MB/s的传输带宽。不过,HyperTransport可支持2、4、8、16和32bit等五种通道模式,若数据频率为1.6GHz,并采用32bit模式,HyperTransport的双向带宽可高达12.8GB/s,远远高于当时任何一种总线技术。
* l. O4 g3 m9 c- }9 M5 [ 在2004年2月,AMD宣布推出HyperTransport 2.0,2.0版在速度上比1.0版提升了75%,最高传输带宽达到20GB/s。此外,HyperTransport 2.0还可对PCI Express作更好的支持,令两大总线的衔接过渡更为顺畅!目前,AMD已在新一代Athlon 64、Opteron和双核处理器中采用HyperTransport 2.0总线,而该总线也将成为AMD未来双核处理器的基础。
; ^; ?3 `: T6 K. H/ L$ ] PCI Express不断完善
/ }- t# a) c, Y, H 与前两者不同,PCI Express是一项用于取代PCI的系统总线技术,它的发起者是Intel公司,而真正的主导者应该是PCI-SIG组织。PCI Express 1.0版规范在2004年4月发布,Intel公司在同年6月推出首款支持PCI Express的i915/925X芯片组,拉响了PCI Express普及的序幕!除Intel外,对PCI Express最热切的应该是NVIDIA和ATI两家显卡厂商,PCI Express ×16接口所提供的带宽高达8GB/s,大幅度超越并行体系的AGP 8X,可很好满足新一代高性能显卡的实际需求。
1 v0 r k) b2 m4 `4 O* e5 n2 q- W
1 a5 N6 L3 U: L, p8 J8 e, B
串行ATA,PCI Express技术不断进展
然而,PCI Express 1.0版标准其实并不完善,PCI-SIG组织在标准发布后仍致力于对该标准作完善工作。今年4月,PCI-SIG推出最新的PCI Express ExpressModule规范。ExpressModule原名为“服务器I/O模块”,简称SIOM。它是一项主要针对服务器/工作站的标准,定义可热插拔的I/O扩展模块,服务器若采用符合该标准的PCI Express扩展设备,便可在系统运行的同时对其作更换,以避免系统停机。
, s4 j' _. A6 y) |# n, F 此外,PCI-SIG最近还推出了最新的PCI Express 1.1版规范,该规范可向下兼容现有的1.0a标准,但对Base Card Electromechanical和Mini Card Electromechanical等子规范作了大量的更新,以提供更为先进的功能特性。据悉,1.1版标准的兼容测试工作将于2005年底起步,在明年底前完成,而更令人兴奋的应该是着眼于未来的2.0版规范。目前,PCI-SIG内部正在对此进行讨论,PCI Express 2.0将具有5Gbps的超高速率,性能比现有的PCI Express 1.0和1.1规范都高出1倍,而相关标准有希望在2007年出台。
3 E4 z: n5 M: ? e FB-DIMM串行内存方兴未艾* M' |+ Y5 v: q" l+ x
在总线领域,串行技术高频率、高带宽的优点在实践中获得很大成功。这场串行技术革命在继续深入的同时,也拓展到周边领域,其中最为引人注目的应该是Intel拿出的FB-DIMM串行内存。据悉,FB-DIMM可在现有DDR2技术基础上,将内存的带宽提高到50GB/s的惊人水平,并允许系统搭载192GB的海量内存,遥遥领先于现有的各项常规内存技术,而起到核心作用的便是它所采用的串行传输总线技术。
" d6 b2 D6 u: {8 p8 x FB-DIMM的接口带宽
9 A1 w% G. r2 D5 E 采用类似PCI Express的串行总线,让FB-DIMM在传输环节上拥有很强的抗干扰能力,从而可轻易工作在很高的时钟频率上。根据Intel发布的FB-DIMM 1.0版规范,FB-DIMM的总线可有3.2GHz、4.0GHz和4.8GHz三种数据传输频率,而每个模组的总线位宽为24bit,这样它们所能达到的接口带宽便可达到9.6GB/s、12GB/s和14.4GB/s,这些数字明显比普通的DDR2模组高出许多。
2 R& @1 K( |' j3 i5 g
& f2 d4 X; T, o" U
FB-DIMM解决方案详细说明
& `+ x, M7 U, q( a& F9 q
然而,光有出色的接口带宽并不能说明任何问题,内存系统的效能高低仍取决于FB-DIMM模组本身,如果FB-DIMM所采用的是64位、DDR2-533标准的颗粒,那么该模组的实际效能与一条标准DDR2内存相当,并不会因为接口速度快而胜出一筹。
其实,FB-DIMM的效能优势应该是得益于多通道设计。我们知道,DDR、DDR2最多都只能实现128位、双通道结构,无法实现四通道设计,原因在于这两者都是采用并行结构的数据总线,而并行总线抗干扰能力很弱,且对主板PCB布线要求很高——128位双通道意味着该系统的128条数据线路必须保持严格一致,否则将会出现信号无法同步、传输失败的灾难性情形!如果要做到四通道,那就要求PCB上必须布上256条长度严格一致的数据线路,这在当前技术条件下根本无法实现,而主板上也没有这么大的面积来容纳如此众多的线路。而FB-DIMM就完全不受这个限制:每条模组只有24bit,数据线路总数为48条(LVDS信号要求一对线传输1bit信号),加上供电线路、地线和共享的线路也只有69条。更重要的是,串行结构总线不存在线路长度一致性的问题,PCB布线工作相当容易,这样,FB-DIMM便可支持双通道、四通道和六通道模式。若采用DDR2-533颗粒,六通道的FB-DIMM系统可提供25.6GB/s的高性能!Intel表示,FB-DIMM可采用DDR2-800乃至未来的DDR3颗粒,该系统最高可拥有超过50GB/s的终极效能,这显然是常规的并行内存系统无法企及的高峰!
( p7 Z$ t8 j% z: N FB-DIMM的前景# _" v/ Q' k6 f1 l% Z; A
FB-DIMM标准发布后,获得内存厂商以及服务器厂商的热烈响应,而为了更好地推广FB-DIMM技术,Intel在去年的IDF开发者论坛上成立MIF(Memory Implementers Forum)组织专门负责FB-DIMM的产品化和市场推广工作,该组织成员包括Intel、戴尔、惠普以及现代、英飞凌、三星、美光、Elpida、南亚(Nanya)、金士顿在内的一大批内存厂商。到现在为止,FB-DIMM内存已经量产上市,采用该技术的Xeon、Itanium服务器/工作站也即将出现!不过,Intel暂时没有表态说FB-DIMM将在何时引入到PC领域,但我们对这一前景深信不疑——FB-DIMM以低廉的成本实现跨越性的性能提升,只要未来PC市场对此存在需求,FB-DIMM进入到Intel的PC平台是非常自然的事情。
& s3 k+ ~7 z% \$ H+ n. z; h: X Intel串行前端总线喷薄欲出
C# m) P7 M$ e7 }! S 处理器前端总线向来是并行技术的领地,在其他领域纷纷转向串行体系的情形下,它依然保持传统的64位并行结构,无论是Intel的Pentium 4/双核心Pentium D、AMD Athlon XP还是IBM的PowerPC 970,无一例外均采用并行结构的前端总线。比较特殊的是,AMD的Athlon 64/Opteron处理器,由于整合了内存控制器,处理器不再有“前端总线”的概念,而HyperTransport总线所承担的其实只是相当于“图形总线+南北桥总线”的I/O职能,并非真正意义上的前端总线。也就是说,坚守64位并行体系几乎是处理器前端总线的标准做法。
; Y% n" A& a& q. C2 A 对这种传统观念发起挑战的还是Intel公司。事实上,Intel目前已饱受前端总线带宽不足的困扰:i945/955X芯片组支持的双通道DDR2-667内存可提供10.7GB/s带宽,而无论是Pentium 4 600还是双核心的Pentium D处理器,都只采用800MHz的64位前端总线,带宽也仅有6.4GB/s,产生明显的性能瓶颈。不幸的是,并行总线抗干扰性差,要想进一步提高前端总线带宽十分困难。一般认为1.2GHz就是发展的局限,此时它也只能提供9.6GB/s带宽,仍然无法满足实际需求!Intel自身也意识到这一点,若继续选择并行结构的前端总线,处理器性能将受到严重制约,难以继续提升空间。
7 j) A% E4 ~& o' w! @
这时,串行前端总线进入了Intel的视野,在其他各类总线中,串行技术的优越性一览无遗,若在前端总线中采用串行技术,其性能将轻易突破10GB/s,达到20GB/s以上也毫不困难,这显然是未来多核处理器可以考虑的最佳方案之一!Intel公司暗中指出,2007年推出的新一代处理器将会采用这种串行前端总线,以解决目前紧迫的总线瓶颈问题。但这样一来,内存系统必然也受到影响。如果沿用目前的128位双通道并行内存,内存数据必须在芯片组中进行转换,这会导致平台设计的复杂化。其实,Intel早已预备好解决方案,它便是我们在前面详细讨论过的FB-DIMM串行模组——内存总线与前端总线都采用同样的串行技术,有利于数据的高效传输。而在更遥远的将来,真正意义上的串行内存可能出现,届时整套平台将实现真正意义上的串行化。
) v! U9 [" d# M3 P4 h 前瞻:没有终点的总线革命
5 O" h% }) i. e y1 b2 I 毋庸置疑,串行技术已成为计算机总线的主导技术,然而,我们并不能因此武断地认为并行技术没有任何前途,尽管现阶段它存在抗干扰性差、PCB布线难度大的致命缺陷,但这些缺陷都可以借助技术改良加以解决。
; k& `' |( o; g. i1 J! E5 A, W7 L( K 在这方面,Rambus公司的Redwood总线便是最好的例子,这项技术成功克服了并行技术的上述缺陷,将总线带宽的极限提高到100GB/s的惊人水平!目前,该项技术已应用于索尼的PS3游戏机中(IBM最新的Cell处理器其前端总线也采用了Redwood技术),或许在某一天,经过类似改良、克服先天弊病的全新并行总线会再度卷土重来,也许那一天串行总线与并行总线将重新调换位置。当然,就目前的大局而言,串行技术必将取代并行技术成为计算机总线的主流形态。