最近有关下一代英伟达 GeForce RTX 4090 的传闻表明,基于 AD102 GPU 的旗舰游戏显卡,或率先突破 100 TFLOPs 的算力大关。作为参考,Ampere 卡皇 GeForce RTX 3090 Ti 的 FP32(单精度)算力在 40-45 TFLOPs 之间。
上月底,@Kopite7kimi 在推测上分享了他的最新猜测 —— 预计来自AMD和 NVIDIA 的新一代旗舰游戏显卡,都有望突破 100 TFLOPs 的算力大关。
作为消费级游戏显卡市场的一个重大里程碑,这一代旗舰游戏显卡的性能与功耗也有望迎来飙升 —— 从 275W 大涨到 350-400W 甚至更高(RTX 3090 Ti 已超 500W)。
功耗大涨的主要原因,据说是 AD102 芯片可受益于台积电 4N 工艺的一些重大突破。此前传闻的 GPU 频率在 2.2 ~ 2.4 GHz,但最新预估已在 2.8 ~ 3.0 GHz 左右。
再考虑到 Ada Lovelace 可提供 18432 个 CUDA 核心、96MB L2 缓存 @ 384-bit 总线位宽,堆叠的 12 组 GPC 里包含了×6 的 TPC、每 TPC 有 2 组 SM(总计 144 SM)。
若理论时钟速率可达 2.8 GHz,Ada Lovelace 旗舰游戏显卡可轻松达到 103 TFLOPs 的计算性能,且传闻暗示了更高的加速频率。
不过目前看来,它更像是高于平均“游戏”时钟的峰值频率(类似 AMD 的标称)。
与 Ampere 卡皇 RTX 3090 Ti 相比,100+ TFLOPs 意味着计算性能暴涨一倍以上,但它并不一定等同于整体游戏性能。
即便如此,这还是游戏 PC 领域的一次巨大升级(较 微软 Xbox Series X 游戏主机领先 8.5 倍)。
此外 @Greymon55 推测红蓝两家的新一代旗舰游戏显卡,算力或达 90+ vs 100+ TFLOPs 。
若真如此,广大 PC 游戏玩家有望更轻松地带动下一代 8K(甚至光追)游戏。