首页| 论坛| 搜索| 消息
主题:图文并茂]常用电脑资料速查===>计算机软硬件知识满汉全席大奉送
回帖:显卡GPU参数和比较『转译』





以下内容翻译 (节选)自





www.anandtech.com





原文发表时间:2004年9月6日


原文作者:Jarred Walton


原文标题:GPU Cheatsheet - A History of Modern Consumer Graphics Processors











Nvidia











在做对比之前,首先要说明:理论上的性能参数(列在这里)很少与现实世界中的表现符合。之所以有偏差,原因很多。例如不同游戏和应用程序可能更强调产品架构的不同部分。低分辨率画大量多边形的游戏更强调几何引擎;高分辨率而画较少多边形的游戏更强调显存带宽。像素着色器(Pixel Shader)与顶点着色器(Vertex Shader)更难判断。ATI和Nvidia都对它们产品管线的内部布局守口如瓶。


那为什么我们还要谈论性能表现而不用基准测试呢?某种程度上,通过对比理论参数和现实世界中的表现(其它的文章中有这些内容),我们可以知道什么地方出了问题,而那些地方表现很好。更重要的是,大多数人查看GPU向导,期望获得产品的比较和排名。 当然这些数据不是决定性的。所以在看这些数字的时候,得有所保留。这些数字并不是为了展现某个显卡比另外某个显卡看起来更好。当实际表现与期望值有重大偏差的时候,得注意。


除了应用程序本身,很多因素会影响实际表现。驱动程序是个重要因素。我们也不是没有听说过,因为驱动程序的改良,某个显卡的性能提升了50%还要多。Radeon和GeForce显卡在Quake3中的表现随着时间的推移都有了大幅度的提升。通过合理优化,实际的数字通常会接近理论参数,不过这仅存在于大多数受欢迎的应用程序中。此外,某些特性也有一定影响。两个拥有相同理论参数的卡,如果一个基于DX9,另外一个基于DX8,DX9的卡会更快。


谈到驱动程序,就不能不提对OpenGL的支持问题。OpenGL是个不同的平台,需要不同的驱动程序。Nvidia和ATI都有完整的OpenGL驱动程序。但是所有的证据表明在这点上Nvidia的驱动更优异些。最近的Doom3就是个实例。同时,OpenGL也在专业领域使用,因而Nvidia往往性能方面领先,即使使用的是较低级一些的硬件。但是自从Doom3发布之后,ATI发誓要改善它们产品的OpenGL表现。


那么到底什么决定整体的表现呢?换句话说,这个表内的顺序是怎么排列的?(我们选取的)三个主要因素是填充率,显存带宽,处理能力。大家很容易理解填充率和带宽,因为人们已经使用了很长时间。然而处理能力就不好定义,特别是涉及到DX8,随后的PS以及VS。我们将使用每秒顶点渲染速率来估算处理能力。当然这不是衡量性能的最好方法。但是这是一个开始,而且这些都只是理论上的比较。如果您需要获得针对某个显卡的建议,论坛和以往的文章,那才是更合适的寻找答案的地方。另外一种方法是,决定你最关注什么游戏或者应用程序,然后去找包含这个内容的测试文章。


DirectX 9表现











DirectX 9备注:


显存带宽使用的是1MB=1024KB。


需要指出的最重要一点是:这个图表使用了一个加权指数。这是因为目前各种DX9硬件的性能和特点有差异。最需要关注的是GeForce FX显卡的理论性能。大多数人都知道这一点。FX显卡在运行DirectX9代码的时候根本不能达到期望值。在DirectX8.1或者更早的DirectX中,FX显卡的理论性能相对而言比较准确地反映了实际表现。但整体而言,这远不能算做完美。正因为我们感觉到这样的排名不能反映现实表现,所以使用了加权指数。如果您愿意,可以去看没有经过加权的图表。此外,在同等频率下,更新的特性也有助于提升性能。 例如,针对GF6存储控制器的优化导致:在几乎所有的情况下,普通的6800与FX5950U和9800Pro相比较,速度更快,而仅被X800打败。


使用的加权比较简单。在计算了填充率,带宽和顶点渲染速率这些分数以后,我们把结果乘以加权因子。


NV3x系列:0.85


R3xx系列:1.00


R4xx系列:1.10


NV4x系列:1.20


另外值得注意的是,有些芯片缺乏更加专业的硬件优化。因此,尽管5200U的理论性能看起来优于5600和5700LE,但实际使用中,大多数情况下,它速度更慢些。类似地,因为RV370和RV380可能包含一些优化和性能提升措施,因而X600Pro和X300在实际表现上打败了9600Pro和9600芯片。它们也是PCI Express产品,但这一点不值得关注。至少到目前为止,PCI Express对实际性能表现影响很小,有时速度稍快,有时稍慢。如果你为了其它的配件购买基于PCI Express的系统,不错。但我们不推荐您仅为了一个PCI Express把钱浪费在这个昂贵的系统之上。


回到早先的那个图表,您会注意到,X600和X300并不包含SM2.0b特性。这并不是个错误。只有即将出现的X700显卡会将这些特性引入到ATI的中端显卡中。这一点与6600显卡不同:6600与6800功能相同,6600就是少些渲染管线。在很多情况下,X700会在实际表现中更有优势,因为X700有全部6条顶点渲染管线,而6600只有3条。然而,如果6800LE很普遍的话,6800LE应该会成为200$美元以下的王者,因为256的显存位宽会比频率更重要。如果没有极快的显示核心,高于25GB/S的显存带宽并总不会帮助提升性能,但是可以肯定的是,低于16GB/s的显存带宽定降低速度。


DirectX 8 性能表现











DirectX 8备注:


DirectX8图表中没有使用加权因子。总体上,游戏中的实际表现与上表中数值相符。回到DirectX8时代,Nvidia的表现遥遥领先于ATI。虽然Radeon8500能够比GeForce3提供更出色的性能,但是那是在GeForce4Ti系列发布前,且也仅维持了两个月。当然今天仍然有许多人还在使用GeForce4 Ti显卡,而且少有对它性能的抱怨。只有高质量渲染模式和DX9游戏才逼迫人们升级自己的显卡。偶尔玩游戏的人,更倾向于找到一块低于50$的二手GF4Ti显卡而不是购买一块低端的DX9显卡。直到FX5700Ultra和FX5600Ultra,它们的性能才远远胜过GF4Ti。但是这些卡售价都高于100$。


不过ATI在DirectX8时代的确比Nvidia有一个优势。他们与Microsoft一起创立了更新版本的DirectX,即8.1版本。增加了对一些"高级PS"效果的支持,使PS版本升到1.4。这不是一个DX8.1可以胜任而DX8.0不能完成的事情。但是DX8.1可以在一个回合内完成几项操作而不需要两个回合。然而支持DirectX8的游戏很晚才出现。支持ATI拓展的游戏,如果有的话,出现的更晚。现在有少数游戏支持DX8.1拓展,但是这时早期的DX8.1 ATI显卡已经不能良好地运行这些游戏。


值得注意的是,Nvidia的顶点速率是用频率的90%乘以顶点的管线数目获得的。FX和GF6显卡上,Nvidia使用频率乘以顶点管线数目除以4获得他们所宣称的顶点速率。可能是架构的改进导致了更快的顶点速率。在ATI方面缺乏相关的具体资料。 尽管ATI 在有些场合宣称8500的680万的顶点渲染率,与Nvidia的DX9显卡的计算值相当,但是您只需要看看3D Mark01这样的测试就可以发现它从来没有达到理论最大值。


DirectX 7性
下一页 (1/2)
下一楼›:显示卡常见故障全面解决





一、接触不良



查看全部回帖(29)