社区应用 最新帖子 精华区 社区服务 会员列表 统计排行
  • 75阅读
  • 4回复

[显卡]英伟达解释 RTX 4060 Ti 采用 128bit 显存:L2 缓存增大 16 倍,极大提高命中率

楼层直达
z3960 
级别: 茶馆馆主
发帖
770593
飞翔币
207694
威望
215657
飞扬币
2511651
信誉值
8



5 月 20 日消息,英伟达现已发布 RTX 4060 Ti 8G 显卡,其显存位宽只有 128bit。相比之下,英伟达老款 RTX 3060 Ti 为 256bit 位宽,RTX 3060 也有 192bit 位宽。



对此,英伟达在一篇博客文章中进行了解答,称与具有 128 位显存位宽的上一代 GPU 相比,全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。





如上图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。





此外,英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。



在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。



英伟达称,从历史上看,显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而,显存位宽本身并不能充分表明存储子系统的性能。相反,更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。



由于 Ada 架构的优势,包括新的 RT 和 Tensor 核心、更高的时钟速度、新的 OFA 引擎和 Ada 的 DLSS 3 功能,GeForce RTX 4060 Ti 比上一代采用 256 位的 GeForce RTX 3060 Ti 和 RTX 2060 SUPER 显卡更快,同时功耗更低。



IT之家整理 RTX 4060 Ti 和 RTX 4060 显卡参数信息如下:



RTX 4060 Ti 拥有 4352 CUDA 核心,配备 8GB / 16GB 128bit GDDR6 显存,TGP 功耗 160W / 165W,采用 PCIe 4.0*8 连接,售价 3199 元起,5 月 24 日开卖。



RTX 4060 显卡拥有 3072 CUDA 核心,配备 8GB GDDR6 128bit 显存,功耗 115W,采用 PCIe 4.0*8 连接,售价 2399 元起,7 月上市。
 
我不喜欢说话却每天说最多的话,我不喜欢笑却总笑个不停,身边的每个人都说我的生活好快乐,于是我也就认为自己真的快乐。可是为什么我会在一大群朋友中突然地就沉默,为什么在人群中看到个相似的背影就难过,看见秋天树木疯狂地掉叶子我就忘记了说话,看见天色渐晚路上暖黄色的灯火就忘记了自己原来的方向。
级别: 超级版主
发帖
836565
飞翔币
228756
威望
224673
飞扬币
2462126
信誉值
0

只看该作者 1 发表于: 2023-05-21
来看一下
级别: 超级版主
发帖
836565
飞翔币
228756
威望
224673
飞扬币
2462126
信誉值
0

只看该作者 2 发表于: 2023-05-21
不错,了解了
srwam 
级别: 超级版主
发帖
637645
飞翔币
1523
威望
25287
飞扬币
2876906
信誉值
0

只看该作者 3 发表于: 2023-05-21
来看看
srwam 
级别: 超级版主
发帖
637645
飞翔币
1523
威望
25287
飞扬币
2876906
信誉值
0

只看该作者 4 发表于: 2023-05-21
了解一下