MCPLive > 杂志文章 > Sandy Bridge集成GPU性能初探

Sandy Bridge集成GPU性能初探

2011-01-25《微型计算机》评测室《微型计算机》2011年1月上

Intel下一代平台Sandy Bridge还未上市,各种流言就纷纷袭来,令人吃惊的就是声称其集成GPU性能拥有超越AMD 890GX,接近低端独立显卡的性能。那么事实是否果真如此?Sandy Bridge是否会真的给AMD、NVIDIA带来“低端危机”呢?

在2010年11月下刊,我们曾经抢先对Intel下一代平台:Sandy Bridge进行了全国首发测试,相信它那强大的处理器性能已经给大家留下了深刻印象。不过更让人着迷的是Sandy Bridge那传说般的整合GPU核心:“史上强大的整合图形核心”、“可在较低分辨率下流畅运行所有3D游戏”、“部分超越低端独立显卡”。Sandy Bridge还未上市时,多条有关其整合GPU核心的流言就在坊间广泛流传。

显然,如果事实果真如此,目前在市场上热卖的AMD 8系列整合芯片组、GeForce GT 220/Radeon HD 5450低端显卡都将受到严重冲击。低端显示芯片市场将被重新洗牌,Intel在图形芯片市场的占有率也将获得大幅提升。那么Sandy Bridge是否具备如此强大的能力?当多款Intel H67主板到达《微型计算机》评测室后,我们再次率先对其整合GPU核心进行了全面的性能测试。接下来,就让我们通过实际的测试数据来回答这个疑问。

全面解析 看清Sandy Bridge整合GPU

四大升级助进化

与之前Intel只在Clarkdale处理器中整合图形核心的做法相比,采用Sandy Bridge架构设计的处理器,不论是高端的Core i7,还是中端的Core i5、主流的Core i3,都将整合图形核心。而且有所不同的是,Intel还通过在以下四方面的努力进一步提升了整合图形核心的性能:

1.Sandy Bridge集成的GPU图形核心主要由新的EU可编程着色硬件组成。与Intel HD Graphics显示核心(主要集成在Core i3/i5内)使用的EU相比,Sandy Bridge里的EU拥有更大的寄存器文件,并采用第二代并行分支,提升了执行并行任务与复杂着色指令的能力。同时,超越数学运算交由EU内的硬件负责,其直接好处是大大提升了正弦(sine)、余弦(cosine)等函数的运算速度。此外,EU内部采用类似CISC的架构设计,DirectX 10 API指令与其内部指令一一对应,可有效提高工作效率,在每个时钟周期,EU可完成更多的指令。经过以上改进,新型EU的指令吞吐量比在Clarkdale里使用的EU提升了两倍。

新一代整合GPU仍只对DirectX 10.1提供了支持,并且不会采用板载显存,高可共享1728MB系统内存作显存。

2.由于Sandy Bridge处理器的缓存采用环形总线设计,因此Sandy Bridge的图形核心还将获得另外一个好处。可以通过“接入点”共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以设置GPU使用多少缓存。将图形数据放在缓存里,图形核心就不用绕道去拜访遥远而缓慢的内存了,这对提升性能、降低功耗都大有裨益。

3.改善了封装与工艺制程。在Clarkdale处理器中采用的是CPU+GPU的双内核封装,而且只有CPU核心采用了32nm工艺制造,图形核心仍采用相对落后的45nm。而在Sandy Bridge核心处理器中,则将CPU、GPU封装在同一内核中,并全部采用32nm工艺制造。这样,在Clarkdale处理器中存在的成本高、通信延迟高等弊端均得以解决,同时还可明显降低图形核心部分的功耗。


同时,新一代整合GPU只支持各向异性过滤,不支持全屏抗锯齿处理。

4.从Sandy Bridge开始,Intel处理器的睿频技术将不只包括处理器,图形核心也将加入进来。图形核心将在占用率较高的游戏或图形程序中自动提高频率,增强性能。每款Sandy Bridge处理器都将具备这个特性,其图形核心默认频率后都跟有一个动态频率参数。以Core i5 2500K为例,在图形核心在开启睿频技术后,频率可由默认的850MHz上升到1100MHz,频率提升幅度达29.4%。

两大版本分市场

我们知道,以前Clarkdale处理器中的整合图形核心只是通过频率的不同来划分档次,如性能好的Core i5 661处理器的图形核心频率为900MHz,性能定位主流的Core i5 660/Core i3 530的图形核心频率为733MHz,而定位低的Pentium G6950则只有533MHz的运行频率。而在Sandy Bridge处理器中,除了频率的区别外,各款处理器内部的EU单元数量也将有所不同。Sandy Bridge处理器的整合GPU核心将分为HD Graphics 3000、HD Graphics 2000两种版本。其中HD Graphics 3000拥有完整的12个EU单元,将主要集成在Core i7 2920XM/2820QM/2720QM,以及Core i5 2540M/2520M等移动版处理器中。而HD Graphics 2000则只有6个EU单元,将主要集成在普通的台式机处理器中。因此这不仅意味着在Sandy Bridge平台中,两种版本的整合GPU将在性能上存在巨大差别,也意味着Sandy Bridge台式机处理器的EU单元数量反而不及上代产品Clarkdale(12个),只能通过前面提到过的四大升级来获得更高的性能。

H系列芯片组是首选

在Sandy Bridge平台上,Intel同样将可变显示传输接口、显示输出控制器集成在了H系列芯片组上,因此仍只有H系列芯片组可以使用内置GPU核心,它也是打造新一代Intel整合平台的首选。


从H67芯片组架构图可以看到,它提供了提供8根PCI-E 2.0通道、14个USB 2.0接口。

工作时,集成GPU核心将通过可变显示传输接口将图像信号传送给H系列芯片组,再通过显示输出控制器将图像输出到显示器上,不会占用DMI数据传输总线。

表1:P67/H67技术规格对比

 型号  P67  H67
 处理器支持  LGA1155处理器  LGA1155处理器
 显卡带宽
 PCI-E x16 2.0×1或
 x8 2.0+x8 2.0
 PCI-E x16 2.0×1
 Intel远程电脑辅助技术  不支持  支持
 Intel快速存储技术
 (可组建 RAID 0/1/5/10阵列)
 支持  支持
 USB 2.0接口  14个  14个
 SATA接口  6个(2个SATA 6Gb/s)  6个(2个SATA 6Gb/s)
 PCI-E 2.0通道  8条  8条
 PCI总线  无  无

如表1所示,与P系列芯片组相比,H系列芯片组大的不同在于无法将处理器的PCI-E x16总线拆分为x8+x8,因此无法组建CrossFireX、SLI等显卡并联系统。目前,H系列芯片组主要由H67、H61两款构成。其中H67芯片组拥有14个USB 2.0接口、6个SATA接口,其中2个可以支持SATA 6Gb/s,其他4个则仍为SATA 3Gb/s规格,并可组建RAID 0/1/5/10四种磁盘阵列。而低端的H61芯片组则主要用于接替G41,因此在功能上有大幅削减,不支持RAID、SATA 6Gb/s,只有4个SATA 2.0接口,USB 2.0接口数量也被降低到10个。

表2:H67磁盘性能测试

   Intel H67  Intel H55  AMD 890GX
《PCMark Vantage》磁盘性能  5575  5343  5207
《CrystalDiskMark》连续读取速度  140.9MB/s  143.9MB/s  144.3MB/s
《CrystalDiskMark》连续写入速度  136.7MB/s  137.6MB/s  138.4MB/s
《CrystalDiskMark》 512KB读取速度  42.26MB/s  44.27MB/s  43.09MB/s
《CrystalDiskMark》 512KB写入速度  68.39MB/s  68.46MB/s  70.64MB/s
《CrystalDiskMark》 4KB读取速度   0.494MB/s  0.502MB/s  0.496MB/s
《CrystalDiskMark》 4KB写入速度  1.266MB/s  1.193MB/s  1.313MB/s
《HD Tach》突发传输速度   293.1MB/s  201.1MB/s  311.4MB/s

不过从我们的测试结果来看,如表2所示。SATA 6Gb/s接口的引入对于普通机械硬盘来说并无太大用处,唯一明显的提升就是作用不大的突发传输速度。因此H61更值得那些注重实用性与成本的理性用户选择。

第一波H67主板抢先看(按到达评测室先后排序)

索泰迷酷H67 U3WiFi Mini-ITX主板

与在本刊2010年10月上介绍的索泰H55-ITX U3WiFi主板类似,这款索泰主板也采用了超小的Mini-ITX板型设计,是一种专为高性能小型HTPC打造的专用主板。通过大量使用贴片电感、钽电容、SO-8封装MOSFET等小型元器件,该主板也实现了3+1+1相的供电设计,因此可以对高功耗处理器提供支持。经测试,即便使用4核心/8线程的Core i7处理器,主板也可长时间稳定运行。

同时这款主板具备丰富的功能与较强的扩展能力。它不仅提供了PCI-E x16 2.0、USB 3.0、DisplayPort、eSATA等多种接口,也通过Mini PCI-E插槽,板载了一块AzureWave AWNE766无线网卡,为用户提供了更多的文件共享方式,同时也让HTPC具备了“变身”无线AP的能力。

索泰迷酷H67U3 WIFI Mini-ITX主板产品资料

 处理器  Intel LGA 1155处理器
 芯片组  Intel H67
 供电系统  3+1+1相供电设计
 内存插槽  DDR3×2(高支持8GB DDR3 1333)
 显卡插槽  PCI-E x16 2.0×1
 音频芯片  Realtek ALC 892
 网络芯片  Realtek RTL8111E千兆网卡
 I/O接口
 USB 2.0+PS/2+模拟音频输出+
 RJ45+DVI+HDMI+DP+eSATA+
 USB 3.0+光纤
 特色功能  板载无线网卡
 参考价格  待定

富士康H67MP-S主板

由于H系列主板主要面向HTPC用户,以及低端整合平台,因此大多采用体积更小、成本更低的Micro-ATX板型设计,在富士康H67MP-S主板上也不例外。为增强工作稳定性,这款主板采用了不错的做工与用料,主板全部选用来自日本尼吉康的FP系列固态电容,从而避免了发生电容爆浆的潜在危险。同时它采用的3(处理器内核)+1(处理器外核)+1(GPU)相供电系统,可以支持TDP高为95W的处理器。

此外该主板还具备较好的扩展能力与丰富的功能。它拥有两根PCI-E x16插槽,当然,由于不具备带宽拆分功能,因此第二根PCI-E插槽的带宽是由H67芯片组提供,且只有PCI-E x4 2.0。同时,这款主板还通过集成NEC USB 3.0控制器,提供了两个USB 3.0接口。不过值得注意的是,该主板没有PCI与IDE接口,因此老式存储、扩展设备将无法在它上面使用。

富士康H67MP-S主板产品资料

 处理器  Intel LGA 1155处理器
 芯片组  Intel H67
 供电系统  3+1+1相供电设计
 内存插槽  DDR3×4(高支持16GB DDR3 2200)
 显卡插槽  PCI-E x16 2.0×1
 扩展插槽  PCI-E x1 2.0×2/PCI-E x4 2.0×1
 音频芯片  Realtek ALC 887
 网络芯片  Realtek RTL8111E千兆网卡
 I/O接口
 USB 2.0+PS/2+模拟音频输出+
 RJ45+DVI+D-SUB+HDMI+USB 3.0
 特色功能  FOX LiveUpdate、FOX ONE等特色软件
 参考价格  768元

映泰TH67XE主板

这是一款做工用料更为豪华的H67产品,其处理器供电部分虽然也采用3+1+1相供电设计,但每相却配备了4颗MOSFET,同时其中两相还采用了并联两颗电感的设计方式,以降低发热量。此外,这款主板全部采用来自日本化工的固态电容,并具备非常完善的视频输出接口:HDMI、DVI、D-SUB、DisplayPort,一个都不少,可以让HTPC玩家方便地连接各类显示设备。而映泰主板上特有的CIR1接口,也在这款主板上得到了保留。通过该接口,用户可以连接映泰特有的BIO Remote遥控器,从而更轻松地享受高清影片。

该主板拥有两根PCI-E x16插槽,不过第二根插槽的实际带宽只有PCI-E x1 2.0,因此只适合用来连接网卡或扩展存储卡。值得一提的是,该主板通过集成ITE PCI-E to PCI桥接芯片,令它具备了使用PCI设备的能力,而NEC USB 3.0芯片、VIA VT6315N芯片的集成,则令USB 3.0、IEEE 1394a接口成为它的基本配置。

映泰TH67XE主板产品资料

 处理器  Intel LGA 1155处理器
 芯片组  Intel H67
 供电系统  3+1+1相供电设计
 内存插槽  DDR3×4(高支持16GB DDR3 1333)
 显卡插槽  PCI-E x16 2.0×1
 扩展插槽  PCI-E x1 2.0×2/PCI×1
 音频芯片  Realtek ALC 892
 网络芯片  Realtek RTL8111E千兆网卡
 I/O接口
 USB 2.0+PS/2+模拟音频输出+
 RJ45+DVI+D-SUB+HDMI+DP+
 eSATA+USB 3.0+光纤+IEEE 1394a
 特色功能
 可连接BIO Remote遥控器,
 拥有G.P.U节能技术。
 参考价格  999元

一决胜负 Sandy Bridge整合GPU性能详测

搭建我们的测试平台

此次参与我们测试的是一款Sandy Bridge 3GHz工程版处理器,采用4核心、8线程设计,拥有6MB三级缓存,其技术规格与Core i7 2600S比较接近。根据Intel控制面板侦测,其集成的是HD Graphics 2000 GPU,拥有6个EU执行单元,默认工作频率为850MHz,当运行3D程序时,会自动启动睿频技术,将频率提升到1100MHz。

同时,为了更好地反映出集成GPU核心的性能,我们特采用多款产品与其进行对比测试。其中AMD 890GX是目前市面上强的整合主板,集成Radeon HD 4290图形核心,默认频率达700MHz,并配备128MB DDR2本地显存。Core i5 661内置的GPU由于频率高达900MHz,则是Intel上一代产品中,3D性能强的产品。而GeForce 8400 GS则是在2008年较为经典的一款低端高清独立显卡,拥有16个CUDA核心,配备256MB 64bit DDR2显存。

表3:Intel Sandy Bridge整合GPU测试平台

 处理器
 Sandy Bridge 3GHz工程版处理器(3GHz,4C/8T,6MB L3)
 Intel Core i5 661(3.33GHz,2C/4T,4MB L3)
 AMD Phenom Ⅱ X6 1090T(3.2GHz,6C/6T,6MB L3)
 主板
 富士康H67MP-S主板
 映泰H55A+主板
 AMD 890GX主板
 独立显卡
 GeForce 8400 GS 256MB DDR2
 Radeon HD 4350 256MB DDR2
 GeForce GT 220 512MB DDR2
 内存  金邦白金版DDR3 1333 4GB内存×2
 硬盘  希捷酷鱼XT 2TB
 电源  航嘉(Huntkey)X7 900
 操作系统  Windows 7 Ultimate 64bit

Radeon HD 4350是AMD在2009年力推的一款高清显卡,拥有80个流处理器,同样配备256MB 64bit DDR2显存。当今的低端主力:Radeon HD 5450与其在技术规格上十分类似,只不过核心频率由Radeon HD 4350的600MHz提升到650MHz,并将生产工艺由55nm升级为40nm。

GeForce GT 220则是在今年非常流行的一款低端显卡。它拥有48个CUDA核心,显存则根据价格、定位有64bit/128bit、256MB/512MB等多种配置。我们测试中的产品采用128bit、512MB的显存配置,是399元GeForce GT 220的典型。

需要注意的是,测试中,所有独立显卡的测试均在Sandy Bridge平台上进行,集成GPU的性能测试则在各自的整合平台上进行。

处理器性能测试

可能让大家意外,明明是一个以3D性能为主的主题测试,为什么首先开始的是处理器性能测试呢?原因很简单,像AMD 890GX、Core i5 661这样的整合平台,由于各自的处理器不同,因此也决定了各平台处理器性能的不同。

尽管显卡性能对游戏运行速度的快慢起决定作用,但不可否认的是,处理器性能对游戏性能的影响也是不小的。尤其是在整合平台中常用的低分辨率、低画质设置环境里。因此为了更好地了解各GPU核心的性能,我们必须首先了解它们的处理器性能,了解它们各自的运行起点是怎样的。

而从测试来看,Intel HD Graphics 2000显然拥有好的起点,Sandy Bridge处理器在三个整合平台中拥有强的处理器性能,Phenom Ⅱ X6 1090T则紧随其后。而双核、四线程设计的Core i5 661由于先天不足,因此其性能与前两者存在较大差距。

3D基准性能测试

下面,我们首先通过《3DMark Vantage》、《鹰击长空》、《孤岛危机》、《孤岛惊魂2》、《冲突世界》这五款自带3D性能测试的软件,对各款GPU进行了测试。从测试来看,在《3DMark Vantage》中,HD Graphics 2000拥有不错的表现,其性能不仅超过AMD 890GX、Intel HD Graphics等整合核心,也超过了Radeon HD 4350,仅次于GeForce GT 220。

不过在各游戏自带的基准测试程序中,HD Graphics 2000的表现就有些力不从心了。与上一代产品HD Graphics相比,它仅仅是互有胜负,唯一较大的领先是在《冲突世界》中,其平均帧速领先了近17.9%。但由于这款即时战略游戏非常依赖处理器的性能,因此我们认为处理器才是拉大这一差距的“幕后黑手”。

而与AMD 890GX相比,HD Graphics 2000则在四款游戏测试中全面落败,其实际游戏性能只有AMD 890GX的82%~90%。与Radeon HD 4350、GeForce GT 220独立显卡的差距则更是巨大,它唯一能够超越的独立显卡只有古老的GeForce 8400 GS,但这是目前每款整合图形核心都能做到的。

总体来看,与之前的产品类似,Intel的整合GPU在《3DMark Vantage》这些专业测试软件中,仍能取得不错的表现,但在实际游戏中的表现则比较普通。

游戏性能实际测试

接下来,我们通过对5款热门游戏的实际运行、体验,并借助Fraps软件对各GPU的真实游戏性能进行了测试。测试结果与前面的程序测试没有太大变化。HD Graphics 2000与HD Graphics的测试成绩仍是互有胜负,HD Graphics 2000并没有表现出明显的优势,总体来说二者水平相当,而且这还是HD Graphics 2000在强大的处理器性能配合下,才得以实现的。

值得注意的是,在《战地:叛逆连队2》、《荣誉勋章2010》两款游戏中,HD Graphics 2000以小幅优势领先于AMD 890GX。然而在这两款游戏中,二者即便在1024×768、低画质的设置下,也无法获得可保证基本流畅运行的24fps平均帧速。

显然,集成GPU与独立显卡仍存在不小的差距。而在《星际争霸2》与《使命召唤7:黑色行动》中,HD Graphics 2000与AMD 890GX相比则有不小的落后,其性能只有AMD 890GX的56%~74%。这显示出HD Graphics 2000很可能在驱动优化上还有所不足,以致于在不同游戏运行中的表现参差不齐。


整合GPU功耗测试

不过,在性能测试中表现一般的HD Graphics 2000,在功耗测试中却有较好表现,特别是在Furmark GPU满载功耗测试中。尽管它在运行侧重于3D性能的软件时,会将频率提升到1100MHz,高于HD Graphics的900MHz,但在功耗测试中,其系统功耗却明显低于Core i5 661平台。

我们认为这一方面要归功于图形核心在生产工艺上的进步,另一方面则要归功于EU执行单元数量的减少。而AMD 890GX则由于处理器功耗较大、制程落后,在系统总功耗上表现较差。

此外从这个测试里,我们也可以发现独立显卡在功耗上并不一定必然高出整合GPU。在使用相同处理器、主板的情况下,Sandy Bridge整合平台的整机功耗明显了超过使用GeForce 8400 GS的整机功耗,只是略低于使用Radeon HD 4350的状态,显然,当今独立显卡的能耗比已经大幅提升。

Intel Sandy Bridge处理器GPU性能优化秘笈

后,我们为即将购买Sandy Bridge平台的读者再提供一些Sandy Bridge GPU性能优化指南。事实上,由于Sandy Bridge将频率发生器集成在处理器内部,体质较差,因此,无法再对GPU的工作频率进行手动超频。对Sandy Bridge GPU性能优化途径主要在于增加它的显存容量,从而尽可能提升GPU的性能。当然前提是您必须拥有足够的内存,不至于影响系统正常运行。

STEP 1:提升GPU的固定显存容量,这是系统内存为GPU划分的基本显存,用于GPU进行日常操作。划分后,系统内存将无法再“收回”或“访问”这部分内存,它将成为GPU的专用显存。

这部分显存的调节项目名称为“IGD Memory”,多可调用128MB内存作为GPU的基本显存。

STEP2:增加GPU的动态显存容量,系统内存将根据运行的程序需求,自动调用部分内存作显存。程序运行结束后,该内存将“交还”给系统内存。

这部分显存的调节项目名称为“DVMT/FIXED Memory”,选择256MB后,系统多将只会再额外调用256MB内存作显存。而如选择Maximum(大化),系统将根据内存容量大小,尽可能多地分配系统内存作显存。它多可分配约1.7GB内存作显存,条件是系统必须至少配备4GB内存,并采用Windows 64bit系统。

突破极限 还看HD Graphics 3000

综合以上测试,可以看出,传说中的“史上强大的整合图形核心”、“部分超越低端独立显卡”这些流言在此次测试中暂时没有得到体现,HD Graphics 2000只能说与Core i5 661的图形核心性能相当。其整体性能与AMD 890GX仍存在较大差距,更无法与Radeon HD 4350这样的早期独立显卡相提并论。究其原因,我们认为这主要还是在于台式机处理器上采用的HD Graphics 2000 EU数量只有6个,3D处理能力不足所致。即便每个EU单元在设计架构上进行了一定的改良,提高了效率,但由于数量的不足,它们也不能带来性能上的巨大提升。显然,现在依靠6个EU单元就能做到接近Core i5 661的顶级HD Graphics,已是很不错的表现了。

那么为什么会传出那些惊人的流言呢?我们认为这很可能是有人采用的台式机工程版处理器中集成的是HD Graphics 3000核心。按现在HD Graphics 2000的表现,拥有12个EU单元的HD Graphics 3000在理论上来说性能将达到它的近两倍,显然按这样的性能,它的确有可能超越AMD 890GX,并接近Radeon HD 5450。不过可惜的是,HD Graphics 3000在实际产品中,将主要出现在笔记本处理器上。

表4:HD Graphics 2000 1080p高清播放占用率测试

   VC-1  MPEG-2  H.264
 处理器播放平均占用率  0.74%  1.8%  0.7%

那么Intel为什么不在台式机处理器上大量采用呢?原来,Intel认为,笔记本电脑的屏幕尺寸通常在17英寸以下,主流笔记本电脑的分辨率为1366×768,远低于台式机领域流行的全高清规格(1920×1080)。在相对较小的屏幕和分辨率下,HD Graphics 3000将能够提供足够好的高清和游戏体验,从而使得笔记本电脑制造商能够制造出更轻薄、续航时间更长的产品。而在台式机领域,玩家往往使用更高的分辨率、更大的屏幕。在这些环境下运行3D游戏,用户仍然需要更强的独立显卡去支持。因此在台式机处理器集成HD Graphics 2000 GPU的目的,是用于那些对性能要求不高、侧重影音播放、体积小巧的HTPC或者是一体式电脑,并非传统的3D游戏电脑。而从表4的HD Graphics 2000高清播放处理器占用率测试来看,其超低的处理器占用率显然能满足这一要求。

因此要想感受Intel整合GPU的大实力,您还是应该选择采用Sandy Bridge平台的笔记本电脑。那么HD Graphics 3000核心到底具有怎样的表现?正式版Sandy Bridge台式机处理器的图形性能是否还会有所改观?不要走开,请期待《微型计算机》即将为您带来的,覆盖Sandy Bridge笔记本电脑到台式机平台的详细报道。

分享到:

用户评论

共有评论(8)

用户名:

密码: