英伟达解释 RTX 4060 Ti 采用 128bit 显存：L2 缓存增大 16 倍，极大提高命中率 - 〖手机数码〗

z3960

级别: 茶馆馆主

发帖: 770593

飞翔币: 207694

威望: 215657

飞扬币: 2511651

信誉值: 8

只看楼主更多操作 0 发表于: 2023-05-21

5 月 20 日消息，英伟达现已发布 RTX 4060 Ti 8G 显卡，其显存位宽只有 128bit。相比之下，英伟达老款 RTX 3060 Ti 为 256bit 位宽，RTX 3060 也有 192bit 位宽。

对此，英伟达在一篇博客文章中进行了解答，称与具有 128 位显存位宽的上一代 GPU 相比，全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍，极大提高了缓存命中率。

如上图所示，Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。

此外，英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。

在各种游戏和综合基准测试中，与 2 MB 二级缓存的性能相比，32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽，效率提升可达近 2 倍。因此，在这种情况下，隔离显存性能，具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中，大大提高的缓存命中率将游戏帧率提高了高达 34%。

英伟达称，从历史上看，显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而，显存位宽本身并不能充分表明存储子系统的性能。相反，更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。

由于 Ada 架构的优势，包括新的 RT 和 Tensor 核心、更高的时钟速度、新的 OFA 引擎和 Ada 的 DLSS 3 功能，GeForce RTX 4060 Ti 比上一代采用 256 位的 GeForce RTX 3060 Ti 和 RTX 2060 SUPER 显卡更快，同时功耗更低。

IT之家整理 RTX 4060 Ti 和 RTX 4060 显卡参数信息如下：

RTX 4060 Ti 拥有 4352 CUDA 核心，配备 8GB / 16GB 128bit GDDR6 显存，TGP 功耗 160W / 165W，采用 PCIe 4.0*8 连接，售价 3199 元起，5 月 24 日开卖。

RTX 4060 显卡拥有 3072 CUDA 核心，配备 8GB GDDR6 128bit 显存，功耗 115W，采用 PCIe 4.0*8 连接，售价 2399 元起，7 月上市。