RTX 4090相对于3090在3D渲染上的节省时间因应用场景不同而异。根据IGN中国的评测,RTX 4090的渲染速度最多可以提高四倍,但如果你是一位职业3D建模师,一块专业的工作站显卡仍然是最佳选择。在3D Mark的DX 11环境的FSU中,RTX 4090对比RTX 3090领先了96%,比RTX 3090 Ti强上74%。DX12环境的TSE中,RTX 4090也领先RTX 3090 85%,比RTX 3090 Ti高67%。
RTX 4090在每个方面都优于3090,包括CUDA(计算统一定义架构)核心数量。虽然3090有10496个,但4090有超过6000个,达到16384个。这是一个64%的增加。在深度学习模型中,RTX 4090的训练吞吐量和训练吞吐量高于RTX 3090,包括视觉、语言、语音和推荐系统中的用例。
RTX 4090和3090的区别在于架构不同。RTX 3090显卡是基于NVIDIA Ampere架构构建,而RTX 4090显卡是基于最新的NVIDIA Ada Lovelace架构构建,性能上较RTX 3090是有所提升的。Ada架构的主要更新有:第四代Tensor Core:Ada的全新第四代Tensor Core可将吞吐量提升4倍,达到1.4 Tensor-petaFLOPS。第三代RT Core:Ada架构采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍,还将RT-TFLOP峰值性能提高了一倍之多。 RTX 4090是全球最快的游戏GPU,性能方面,在完整的光线追踪游戏中,与上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可达4倍。在现代游戏中,RTX 4090的性能提升高达2倍,同时保持了相同的450W功耗。