3)多核芯片与RISC SMP的相似性 我们注意到,在多核芯片与上世纪90年代中繁荣了RISC服务器市场的RISC SMP系统之间,存在着非常有趣的相似现象。在过去的10年中,RISC服务器市场的硬件收入可是达到了2400亿美元。 首先,传统的RISC SMP提供了易于使用、缓存一致(cache-coherent)、共享内存(shared-memory)的应用特性,未来的多核处理器也同样会提供这些价值,不同的是,SMP是在一个单一的芯片上来实现。 其次,二者拥有相似的主内存延迟比率。1995年,SGI POWER Challenge是当时中端市场上最畅销的HPC服务器――笔者之一(McCalpin)就曾买过一台8 CPU的系统,花了40万美元。在1996-1997年间,其CPU主频是90 MHz (11 ns),主内存延迟接近 1000 ns(即90 个时钟周期)。而到了2007年,一颗AMD四核处理器的主频将超过 2 GHz (0.5 ns),主内存延迟约为 55 ns(即110 个时钟周期)。比较一下,我们不难发现,主内存延迟的比率是多么惊人的相似,均在100个时钟周期左右。 再次,二者在字节/FLOP上也相似。对于RISC SMP系统来说,能否提供足够的内存带宽是一大挑战。一套配备8颗CPU的SGI POWER Challenge的峰值浮点运算性能是2.88 GFLOPS,最高内存带宽为1.2 GB/s,即平均每FLOP约 0.42 字节。而一颗AMD四核处理器的峰值浮点性能将达到32 GFLOPS,最高内存带宽约12.8 GB/s,平均每FLOP也大约是0.4 字节。 4)X86多核处理器对RISC的冲击 1996年,UNIX 服务器市场的硬件收入超过 220 亿美元,到 2000 年,增加到了近330 亿美元。之后,这块市场一直在下滑,到2006 年,已下滑到了180 亿美元左右。我们认为,主要有以下三大因素导致了UNIX市场的萎缩: 越来越难以维持最初使UNIX服务器获得成功的系统平衡; 跟中低端的小型RISC SMP不同,大型多路RISC SMP无法降低每处理器的系统价格; 更低廉的IA32架构服务器的普及,以及2003年AMD 64架构产品的出现,大大冲击了RISC市场。 那么,具体来说,这三大因素是如何发生作用的呢? ①系统平衡被打破 如前文所述,起初,RISC SMP的主内存延迟大约在100个时钟周期,内存带宽为0.4字节/FLOP。内存延迟在很大程度上跟CPU数量是不相关的,但每颗处理器的带宽会因为配置不同数目的处理器而有所变化。 另外,在应用领域和处理器带宽之间也存在明显的系统相关性:缓存友好型的应用大多采用满配的SMP系统,而高带宽型的应用则配置较少的处理器,甚至是运行在单路系统上。 到了2000年,RISC SMP的主内存延迟大约减少了3倍,而CPU主频却增加了3-6倍。同样,随着系统总线转向多种多样的NUMA架构,每处理器带宽的变化也难以保持一致,情况变得更加复杂。这样一来,过去的系统平衡就逐渐被打破了。 ②小型SMP和大型SMP的性价比差距越来越大 为了维持合理的系统平衡,服务器厂商在上世纪90年代中后期,也进行了大量的努力。虽然取得了不错的效果,但代价却是提高了系统的成本。导致成本增加的两大主要因素是为保持缓存一致性所需的片外SRAM缓存(off-chip SRAM cache)和监听系统总线(snooping system bus)。 对于RISC SMP系统来说,为了平衡相对较高的内存延迟,以及降低共享地址(shared address)和数据总线所需的带宽要求,大容量的片外SRAM缓存是至关重要的。但是,当英特尔不再使用标准的片外SRAM缓存之后,这一市场停滞不前了,跟其他电子元器件的发展趋势不同,SRAM的性价比变得越来越糟糕。到2000年,一个大容量的片外SRAM缓存所花费的成本甚至是处理器的好几倍。 不过,对于小型SMP系统来说,由于降低了对内存和地址总线的共享,因此,能够获得相对较低的延迟和较高的每处理器带宽。反过来,小型SMP使用小容量的片外SRAM缓存就可以了。这样一来,小型RISC SMP和大型RISC SMP在每处理器售价(price/processor)方面的差距越拉越大,越来越多的用户开始转向小型SMP集群,以取代大型SMP系统。 ③多核X86处理器的性价比 到2000年初,基于X86架构的服务器在性能上开始接近基于专有RISC架构的服务器,而且前者在性价比方面更胜一筹。上述大型SMP向小型SMP集群迁移的趋势,也使得进一步向X86集群转移变得更加容易。随着2003年AMD64架构处理器的推出,向X86迁移也就更加盛行,因为AMD64提供了更好的性能、真64位寻址及整数算法能力。随后,英特尔也推出了EM64T架构,从而使得仅仅在几年的时间里,大多数X86服务器完成了从32位向64位的转变。 当然,这些趋势并不能说明用户对SMP系统不再有兴趣,而是说明,用户对大型SMP系统的性价比变得越来越敏感了。想想看,大型SMP和小型SMP之间的价格差距实在太大了,市场必然会欢迎更便宜的硬件产品。 过去,RISC SMP的发展促使大量ISV对其软件代码进行了并行化(在企业计算和科学计算两个领域都是如此),现在,多核处理器趋势则会进一步刺激更多的软件转向并行化,这些软件通常运行在价格更低廉的小型服务器上。 与上世纪九十年代RISC SMP市场不同的是,今天的多核处理器不再依赖于片外SRAM缓存,而且通过配置,可以避免芯片到芯片(chip-to-chip)之间昂贵的一致性流量(coherence traffic)――既可以通过监听过滤器(snoop filter),也可以简单地使用单路服务器,如SUN的T1/Niagara。 责任编辑:杨宇佳
<<上一页
1
2
|