HD7970脱胎换骨,5年架构大革命 - 〖手机数码〗

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 15 发表于: 2012-01-14

　　　　
　　　　GCN架构的精髓：流处理器完全重新设计
　　　　第二章/第十三节 GCN架构的精髓：流处理器完全重新设计
　　　　看了上页图形引擎部分的介绍，很多人可能会失望——基本没动嘛，还说什么次世代图形核心？别着急，好戏在后头。我们知道AMD历代GPU的瓶颈除了曲面细分以外，其实最重要的是5D/4D VLIW架构的效率问题。现在Tahiti的GCN架构就是要解决这个问题，它的流处理器结构已经面目全非了。
　　　　Tahiti彻底抛弃VLIW架构
　　　　

　　　　通过Tahiti的整体架构图我们看到，传统的SIMD流处理器阵列消失了，取而代之的是GCN阵列，Tahiti总计拥有2048个流处理器，这样每个GCN阵列里面拥有64个流处理器。现在来看看GCN阵列的微观结构。
　　　　GCN与GF100的SM何其相似
　　　　

　　　　Tahiti的GCN阵列微观结构
　　　　GCN阵列里有4组SIMD单元，每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器VLIW超长指令架构的限制，不存在5D/4D指令打包-派发-解包的问题，所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说，以往是指令集并行，而现在是线程级并行。
　　　　

　　　　GF100的SM（流处理器簇）微观结构
　　　　可以这么理解，一个GCN阵列与GF100当中的一组SM相当，GF100的一组SM当中有4组共计32个流处理器，而Tahiti的一组GCN当中有4组共计64个流处理器。
　　　　缓存部分
　　　　每个SIMD-16单元都拥有64KB向量寄存器
　　　　每组GCN阵列拥有64KB的本地数据共享缓存，还有16KB的一级缓存
　　　　每组GCN阵列有一个标量运算单元，用于执行整数指令、媒体指令和浮点原子操作，这个标量运算单元拥有自己的4KB寄存器
　　　　而GF100的缓存设计得更加灵活，每组SM里面拥有总计64KB的共享缓存+一级缓存，这64KB缓存可以根据实际运算量来动态调整，如果把16KB分配给一级缓存的话，那剩下的48KB就是共享缓存，反之亦然。
　　　　一般来说，进行图形渲染时需要共享缓存比较多，而并行计算时则会用到更多的一级缓存。GF100这种灵活的缓存分配机制更适合做并行计算，而GCN架构更大的共享缓存会有更好的图形渲染性能，并行计算则会稍逊一筹。
　　　　更多的线程调度
　　　　从缓存部分的设计来看，虽然GCN拥有更大的缓存容量，但在并行计算领域经营多年的NVIDIA显然要棋高一手。
　　　　从线程级别来看，GCN与SM是不可分割的最小单元，GCN一次可以执行64个线程，而SM是48个（其实就是流处理器的数量）。
　　　　从多线程执行上来看，GCN可以同时执行4个硬件线程，而SM是双线程调度器的设计（参见架构图）。
　　　　如此来看，GCN架构的多线程性能会更好一些。
　　　　小结：AMD GCN借鉴NVIDIA SM架构
　　　　在流处理器部分，终于不用费劲的把AMD和NVIDIA GPU架构分开介绍了，因为GCN与SM已经没有本质区别。剩下的只是缓存容量、流处理器簇的数量、线程调度机制的问题，双方根据实际应用自然会有不同的判断，自家的前后两代产品也会对这些数量和排列组合进行微调。
　　　　AMD向NVIDIA的架构靠拢，GCN架构改动之大，前所未有！
　　　　
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 16 发表于: 2012-01-14

　　
　　GCN架构的缓存：和GF100异曲同工
　　第二章/第十四节 GCN架构的缓存：和GF100异曲同工
　　在流处理器部分，我们看到Tahiti与GF100如此相似，那么接下来看到缓存设计时，您可能会要惊呼了……看图说话：
　　

　　Tahiti的缓存结构
　　

　　Tahiti与GF100缓存的相同之处
　　先说最直观的，Tahiti有一个容量为768KB二级缓存，这个容量与GF100的L2完全相同，都可以进行读写操作。
　　上页说过，Tahiti的每组GCN阵列拥有16KB的一级缓存，GF100的SM里面也有16KB的一级缓存；每组GCN拥有64KB的本地数据共享缓存，GF100的每组SM拥有48KB。
　　Tahiti总共拥有32个GCN阵列，所以一级缓存共有512KB，而GF100拥有16个SM阵列，一级缓存共有256KB。但别忘了GF100的L1可以是48KB，这样总共就是768KB了。
　　Tahiti与GF100缓存的不同之处
　　虽然Tahiti的缓存层级设定与GF100非常相似，但区别也是有的：
　　Tahiti的每组GCN需要将16KB一级缓存当作纹理缓存使用，而GF100的每组SM当中设有专用的12KB纹理缓存；
　　一般来说非图形渲染不需要用到纹理缓存，而图形渲染时又不会用到一级缓存，所以Tahiti将一级缓存与纹理缓存合并的设计更优；但NVIDIA专门设计纹理缓存也不是没有道理，当GPU既渲染图形又要做计算时，分离式设计的效率会更高，比如PhysX游戏……A卡不支持所以AMD不会考虑这种情况。
　　Tahiti整个GPU拥有一个32KB的全局数据共享缓存，这个是沿用了Cayman的设计，但容量减半了，而GF100没有这种缓存。全局数据共享缓存主要用于不同GCN阵列间线程的数据交换，这块缓存只对编译器可见，所以使用率较低，容量减半相信也是处于这个原因。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 17 发表于: 2012-01-14

　　
　　Tihiti其他方面的改进：AMD真是个激进派
　　第二章/第十五节 Tihiti其他方面的改进：AMD真是个激进派
　　最核心的流处理器和缓存部分介绍完毕，剩下的功能模块就简单了：
　　AMD头一次使用384bit显存控制器
　　我们先来回顾一下显存控制器的发展史：
　　NVIDIA：G80(384bit)-G92(256bit)-GT200(512bit)-GF100(384bit)
　　AMD：R600(512bit)-RV670(256bit)-RV770(256bit)-Cypress(256bit)-Cayman(256bit)
　　

　　NVIDIA使用过两次384bit显存控制器，而AMD自R600 512bit兵败之后一直坚守256bit的设计，这次Tahiti是头一次使用384bit这种折衷的位宽。
　　AMD作为GDDR5显存标准的制定者之一，对于显存特性吃得比较透，因此同样的显存颗粒，A卡的显存频率一直都远高于N卡。此次AMD在位宽上追平NVIDIA，再加上更高的频率，显存带宽达到了264GB/s，基本上不会有什么瓶颈了。
　　光栅单元数量不变
　　Tahiti配备了32个ROPs，数量与Cayman，每个周期能完成32个色彩处理和128个Z/Stencil 处理，不过得益于有更高的显存带宽，在实际游戏中的性能要比理论值一样的Cayman快50%，比如抗锯齿方面。
　　

　　● 率先支持DX11.1 API
　　AMD一直都是激进派，凭借与微软的深度合作，自DX10以后AMD总是能够第一时间发布支持最新API的显卡，DX10.1/DX11还有现在的DX11都是如此。关于DX11.1的改进细节，下文有专门章节陈述。
　　● PCI-E 3.0总线解析
　　PCI-E 3.0规范将数据传输率提升到8GHz|8GT/s(最初也预想过10GHz)，并保持了对PCI-E 2.x/1.x的向下兼容，继续支持2.5GHz、5GHz信号机制。基于此，PCI-E 3.0架构单信道(x1)单向带宽即可接近1GB/s，十六信道(x16)双向带宽更是可达32GB/s。
　　PCI-E 3.0同时还特别增加了128b/130b解码机制，可以确保几乎100％的传输效率，相比此前版本的8b/10b机制提升了25％，从而促成了传输带宽的翻番，延续了PCI-E规范的一贯传统。
　　新规范在信号和软件层的其他增强之处还有数据复用指示、原子操作、动态电源调整机制、延迟容许报告、宽松传输排序、基地址寄存器(BAR)大小调整、I/O页面错误等等，从而全方位提升平台效率、软件模型弹性、架构伸缩性。
　　至于PCI-E 3.0总线的意义，现在看来有些超前。目前只有Intel的X79+i7-3960X平台才会提供PCI-E3.0支持。根据经验和测试，PCI-E 3.0翻倍的带宽并不会给显卡带来性能提升，其主要意义还是进一步对于多卡的支持。试想，如果PCI-E 3.0 X4都可以满足HD7970的需求的话，那么现有的Z68（搭配IvyBridge处理器）就不会限制多路交火的性能表现，而X79插8块（如果主板有这么多插槽的话）HD7970做并行计算也不会因为接口带宽而产生性能瓶颈。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 18 发表于: 2012-01-14

　　
　　GCN架构的真正意义：GPU计算效能大增
　　第二章/第十六节 GCN架构的真正意义：GPU计算效能大增
　　最后，再来强调一下AMD抛弃5D/4D VLIW改用全新GCN架构的意义
　　

　　理想状态下毫不相干的四组线程执行情况
　　在VLIW的理想情况下，4个线程分别各自独立且毫不相关，可以看到新架构和VLIW的执行情况和类似，理论上效率都是100%。
　　

　　非理想状态下，条件相关线程延迟执行
　　但对于VLIW架构来说，不理想的情况就是遇到相关的指令流，比如两个绿色线程，前三个线程可在一个周期内执行，最下方的蓝色只能独立执行。而对于新架构来说，则不存在这样的问题。也就是说，采用硬件调度之后，GCN和SIMD可以允许选择不同的线程乱序执行，这些线程可以来自同一任务，也可以是不同任务。当然，这种“乱序”也不是绝对的，基本的流程还是要遵守的，比如各个线程之间的指令必须按顺序执行，不能打乱也不能分割。
　　

　　以上就是AMD官方提供的数据，HD7970的理论运算能力相比HD6970提升不过30%，但在GPU计算应用当中的性能提升相当显著，可达两倍以上！尤其在AES加密解密算法中，速度达到了4倍以上，架构的威力可见一斑！
　　

　　HD7900会在WinZIP当中有更好的加密压缩解压性能
　　

　　高清视频实时防抖处理
　　

　　AMD在努力：支持GPU计算的软件越来越多
　　以往的VLIW架构在并行任务处理方面处于劣势，并且很依赖编译器和API的支持，扩展到OpenCL也受到很大限制。经过硬件架构的调整，新的GCN架构在并行计算方面有了很大提高。编译压力减轻，硬件调度的加入使编译器摆脱了调度任务；其次是程序优化和支持语言扩充更见容易；最后是不用在生成VLIW指令和相关调度信息，新架构最底层的ISA也更加简单。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 19 发表于: 2012-01-14

　　
　　浴火重生，新的开始新的期待
　　第二章/第十七节浴火重生，新的开始新的期待
　　从DX10时代开始，也就是ATI被AMD收购之后，AMD的GPU架构一直都没有大的改动。从HD2000到HD6000，大家应该会发现GPU流处理器部分的结构没有任何改动，区别只是规模而已。这次AMD能够彻底抛弃沿用了5年之久的VLIW超长指令集架构，真的是让人眼前一亮，真可谓是浪子回头金不换。
　　

　　对于AMD来说，这次真的是一次革命
　　Tihiti的GPU架构改得很彻底，换句话说就是AMD学得很快，NVIDIA花了5年时间循序渐进的把G80进化到了GF100的级别；而AMD只用了一年时间，就让Tahiti达到甚至部分超越了GF100的水平，真是可喜可贺！
　　但是AMD还有很长的路要走，硬件虽然很强大、全新的GCN架构也扫清了效率低下障碍，但软件和程序方面还需加把劲。让AMD欣喜的是OpenCL API的发展速度比想象中的还要快，以至于NVIDIA打算部分开放CUDA接口。可以预见的是，未来更多的商业软件将会直接使用OpenCL语言编写，对于GPU实现无差别的硬件加速支持，最终比拼的还是架构与效率，而不是谁支持的软件更多一些。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 20 发表于: 2012-01-14

　　
　　呼之欲出：南方群岛全系列发售前瞻
　　第二章/第十八节呼之欲出：南方群岛全系列发售前瞻
　　根据国外网站消息，所有Radeon HD 7700/7800/7900详细规格和售价已经全面曝光，其中双芯的Radeon HD 7990售价高达849美元。
　　

　　整体上由于采用了全新的设计架构，新的南方群岛显得性价比稍微偏低，不过在中低端市场AMD也拿出了只有139美元的Radeon HD 7750，另外AMD还将推出HD 6000系列的28nm版本，型号将被更改为HD 7000系列。
　　

　　HD 7000系列显卡包括New Zealand、Tahiti、Pitcairn、Cape Verde的11款产品，型号分别为Radeon HD 7990(6GB)、Radeon HD 7970（3GB）、Radeon HD 7950（3GB）、Radeon HD 7950（1.5GB）、Radeon HD 7890（1.5GB）、Radeon HD 7870（2GB）、Radeon HD 7850（2GB）、Radeon HD 7850（1GB）、Radeon HD 7790（1GB）、Radeon HD 7770（1GB）、Radeon HD 7750（1GB）。
　　

　　其中Radeon HD 7990(6GB)、Radeon HD 7970（3GB）、Radeon HD 7950（3GB）、（1.5GB）、Radeon HD 7890（1.5GB）采用了Tahiti GPU，拥有384Bit显存位宽。
　　接下来的Radeon HD 7870（2GB）、Radeon HD 7850（2GB）、Radeon HD 7850（1GB）基于Pitcairn GPU，都配备了256Bit显存位宽。而Radeon HD 7770（1GB）、Radeon HD 7750（1GB）则采用了Cape Verde GPU，只有128Bit的显存位宽。
　　除了刚刚发布的HD7970和1月26号发布的HD 7950（3GB），AMD将于2012年2月发布性能级别的Radeon HD 7870（2GB）、Radeon HD 7850（2GB）、Radeon HD 7770（1GB）、Radeon HD 7750（1GB）。
　　而重量级的Radeon HD 7990将在3月12日正式发布，同时发布的还有Radeon HD 7950（1.5GB）、Radeon HD 7850（1GB）版本。最后两款特殊的产品Radeon HD 7890（1.5GB）和Radeon HD 7790（1GB）分别基于Tahiti LE和Pitcairn LE，流处理器数量得到进一步缩减，上市日期将在2012年第二季度。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 21 发表于: 2012-01-14

　　
　　第三章南方群岛应用篇
　　第一节 DDM Audio 技术解析
　　HD5000系列的标准接口配置是双Dual-Link DVI、DisplayPort、HDMI，其中两个DL-DVI占据了4个显示通道，DP和HDMI各一个，这样就把Eyefinity的6个通道都用完了。
　　而HD7970的标准接口配置则是一个Dual-Link DVI、一个HDMI、两个Mini-DP。外观上是把一个Dual-Link DVI和DP替换成了两个Mini-DP，实际上是将原来的DL-DVI做成了一路mDP输出。样做的好处就是，一片显卡可以直接接驳任何类型的数字显示设备而不需要转接，另外让三路独立Audio输出成为可能。这就是传说中的DDM audio技术。
　　

　　上一代显卡只能同时输出一路音频
　　独立数字多点音频(Discrete Digital Multi-Point Audio)，简称DDM Audio。以前的GPU只支持单独一条音频流，因此在同时使用三台集成音箱显示器的时候，只会有一个发声。
　　

　　新一代显卡Radeon HD 7900则是第一款支持多频音频流同步独立输出的GPU，可以同时输出三路独立的数字音频。
　　

　　每个音箱上都会有声音，而且可以完全不同，远程视频会议一卡搞定！
　　

　　当然了，DDM Audio技术支持音频和视频的绑定和同步切换，所有音频和视频都是完全无缝同步的。一部正在播放的视频从一个显示端切换到另一个显示端，音频信号智能迁移而无需手动更改。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 22 发表于: 2012-01-14

　　
　　南方群岛应用篇：EYEFINITY“2.0”解析
　　第三章/第二节南方群岛应用篇：EYEFINITY“2.0”解析
　　

　　Eyefinity历史回顾：
　　－ 2009年9月，Eyefinity惊艳登场，震惊业内。
　　－ 2010年2月：催化剂10.2加入了交火系统对Eyefinity的支持。
　　－ 2010年3月：催化剂10.3支持边框补偿、显示器单独色彩调整、多屏分组、改进多屏配置切换。
　　－ 2010年4月：六屏版Radeon HD 5870 Eyefinity 6发布。
　　－ 2010年7月：催化剂10.7，交火系统支持垂直模式的Eyefinity，同时增强HydraVision。
　　－ 2011年4月：催化剂11.4，配置界面改版。
　　－ 2011年5月：催化剂11.5，HydraVision继续增强。
　　很显然，Eyefinity的进步是与催化剂驱动息息相关的，未来也是。
　　

　　Eyefinity 2.0新特性：催化剂11.10就已经支持的有新的多屏布局配置、弹性的边框补偿、16K×16K超高清分辨率。
　　

　　催化剂11.12和明年催化剂12.1/12.2将会陆续支持的则有：Eyefinity+HD3D多屏立体技术、自定义分辨率(等待太久了!)、预设管理改进、桌面和任务栏重新定位。
　　最后一项，之前三屏系统上桌面图标会停留在第一屏，任务栏则横跨三个屏幕，看起来很费劲，今后则会全部集中在中央屏幕上，就像单屏那样。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 23 发表于: 2012-01-14

　　AMD新君HD7970对比NVIDIA卡皇GTX580完全是压倒性的性能优势，在几乎所有的游戏中都保持较大的领先幅度，而在2560大分辨率的考验下，拥有3GB显存的HD7970优势更加明显，就算加权N卡优势项目，平均值依然领先GTX580 1.5GB 27.39%之多！只在Tessellation Benchmark和PhysX的部分测试中告负。
　　可能有些人会说，HD7970无论核心频率还是显存频率，都要比GTX580高不少，这样对比会否有失公允？如果您有这个疑虑的话，那么不妨看看表格最下方的功耗测试，无论是待机功耗还是满载功耗，HD7970比GTX580都要低一些。
　　这就意味着，A卡无论单位功耗下的性能、还是显卡整体性能，都已经完胜N卡了。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 24 发表于: 2012-01-14

　　上一代的AMD单芯卡皇HD6970无论规格还是架构，都无法和HD7970相提并论，因此性能表现也难以同日而语，HD7970整体性能领先HD6970 47.03%。
　　而且仔细看来，HD6970能跑出这个成绩也属侥幸了，主要是在一些对CPU要求很高的物理游戏或者对显卡要求相对低的游戏中，FPS达到极限，CPU成为瓶颈。否则会输的更惨！
　　总体来看，长江后浪推前浪，HD7970完全秒杀上一代的HD6970！虽然因为规格的大幅提升，满载功耗上升而来16.98%，但能耗比依然是大幅提升。当然这里并不是说HD6970废柴一条！HD7970价格定位本身也高出HD6970不少，HD6870依然有自己的用户定位和市场空间。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 25 发表于: 2012-01-14

　　遁世修行的HD6990双芯高人出马果然名不虚传，终于略挫HD7970的锐气。整体来看，HD6990相比HD7970优势还是比较明显的，除去BatMan2以外，平均领先15.84%。
　　但是为何要除去BatMan2？因为在BatMan2测试时，驱动和游戏版本并没有最完善版本，双芯并没有发挥作用，反而拖累了性能表现。如果加入BatMan2的成绩，HD6990领先幅度将大打折扣。
　　既然明知有Bug，为何还要放上成绩？小编这里其实想借机告诉想多GPU集联的朋友，近年来双芯显卡抑或双卡CF虽然效率出众，性能爆表，但并非完美。并不是所有游戏的不同版本都能兼容。存在即为合理，我们测试就不得不考虑到这种情况而加以说明。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 26 发表于: 2012-01-14

　　可以看出，在几款要求十分苛刻的游戏当中，双HD7970交火系统相比单卡的性能提升高达90%以上，这说明AMD交火驱动已经做得非常完善了，而对于提升超过100%的天堂2.5来说也属正常。因为理论上交火性能是有可能突破100%的。
　　不过，在部分要求不高的老游戏、或者是CPU瓶颈效应比较严重的游戏中，双卡性能提升幅度并不明显。正是这些游戏拖累了交火的整体性能提升幅度。除去双卡性能失效的Batman2，平均提升幅度85.02%，相当强大！
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 27 发表于: 2012-01-14

　　 HD7970作为AMD定位旗舰的显卡，默认频率高达925/5500MHz。但28nm的工艺极限并不在此。和此前显卡测试不同，前面所有的效能测试中我们均特意加入了1125/6300MHz的成绩，原因有三：
　　1、Radeon HD7970 超频之后，性能表现非常稳定，在所有测试项目中均无花屏死机或者驱动停止响应的情况发生。
　　2、Radeon HD7970 超频1125/6300MHz，并不需要更改核心和显存电压，而功耗增加也非常少，基本可以忽略。
　　3、Radeon HD7970 超频至1125/6300MHz，相对于默认频率功耗增加非常小，基本可以忽略。
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

xgz68

级别: FLY版主

发帖: 65046

飞翔币: 24349

威望: 30008

飞扬币: 127770

信誉值: 35

只看该作者 28 发表于: 2012-01-14

　　
　　全文总结：架构、效能与应用的全面胜利
　　很显然GTX580已经不是HD7970的对手，因此我们不应该停留在单纯对比性能与价格这种初级阶段了，在本文的最后，我们来回顾和总结一下HD7970的几大特点。
　　● 最先进的28nm工艺
　　
　　

　　GPU的制造是一项极为复杂的过程，GPU制造工艺的先进与否决定了GPU的性能优劣。事实上GPU的发展史也可以看作是制作工艺的发展史。更先进的制造工艺意味着更高的集成度，更高的性能。说制作工艺的改进是GPU发展带来最强大的源动力亦不为过。
　　● 最高的能源效率
　　

　　工艺和架构的革新让Radeon HD7970拥有更低的能源利用效率，而这也是首次旗舰显卡拥有个位数的待机功耗。
　　● 最快的PCI-E速度
　　

　　PCI-E 3.0规范将数据传输率提升到8GHz|8GT/s(最初也预想过10GHz)，并保持了对PCI-E 2.x/1.x的向下兼容，继续支持2.5GHz、5GHz信号机制。基于此，PCI-E 3.0架构单信道(x1)单向带宽即可接近1GB/s，十六信道(x16)双向带宽更是可达32GB/s。
　　● 最新的DirectX API支持
　　

　　Radeon HD7970是第一款支持Microsoft DirectX 11.1的显卡，新版API支持的诸多新特性是未来Win8中各项应用保持领先的前提。
　　● 更好的应用体验
　　

　　在应用体验方面，南方群岛在上一代北方群岛的基础上更上层楼。更加先进的Eyefinity2.0和HD3D技术无疑让A卡用户有了更高端的视觉享受机会。
　　● 南方群岛向NVIDIA发出强有力的挑战
　　

　　AMD曾经背负效率低下骂名的SIMD架构，在HD6000终于笑到了最后。凭借超大规模的流处理器、以及改进的双超线程分配处理器，HD6000的效率比起HD5000有了明显的提升。如果继续优化扩充的老路，28nm工艺、43亿个晶体管的HD7000性能飙升也是可以预期的。
　　反观NVIDIA架构想要扩充流处理器的话，需要耗费更多的晶体管，由此导致NVIDIA的GPU核心面积要比AMD同级别产品大不少，而大核心除了成本较高之外，还得面对良品率较低、功耗较大的负面影响。既然如此，为何AMD还要进行大规模的架构革新？
　　随着技术的发展，图形和计算的概念已经不再像以往分的那么清楚了，进入DX11时代时候，全新API新特性赋予GPU更多的任务和使命。“通用计算”这一专业术语越来越多的现于新闻、见诸报端。AMD作为全球领先的GPU制造厂商，为高性能计算做出了巨大的贡献，而这次AMD下定决定进行大规模的架构革新很大程度上也是为了这方面做出的考虑。
　　AMD能够在架构革新的同时，进一步降低功耗与发热，还能提升性能、增强功能实在难能可贵，而各方面都非常优秀的HD7970无疑让下一代NVIDIA旗舰的压力增加不少！而2012显卡市场注定不会寂寞！■
　　

不患人之不已知，患不知人也！
人生在世，如身处荆棘之中，心不动，则人不妄动；记住该记住的，忘记该忘记的；改变能改变的，接受不能改变的！

回复引用

帖子

[显卡]HD7970脱胎换骨,5年架构大革命


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选