

不少2020年入手RTX3090的朋友最近在纠结:“我的3090还能用吗?有必要换4090吗?”毕竟3090当年也是旗舰,24GB显存和4090一样,但架构差了一代,性能到底差多少?
小编翻出了压箱底的3090(顺便在天罡智算租了4090),针对老用户常跑的任务做了对比,结论可能和你想的不一样。
新旧旗舰参数对比
对比项 |
RTX5090 |
RTX4090 |
NVIDIA架构 |
Blackwell |
AdaLovelace |
显存 |
32GBGDDR7 |
24GBGDDR6X |
显存位宽 |
512位 |
384位 |
显存带宽 |
1.8TB/s |
1.01TB/s |
CUDA核心数 |
21760 |
16384 |
Tensor核心数 |
680 |
512 |
CUDA核心FP16 |
104.8TFlops |
82.58TFlops |
Tensor核心FP16 |
419TFlops |
330.3TFlops |
Tensor核心FP4 |
3352TOPS |
不支持 |
实测:同是24GB显存,体验差在哪?
大模型加载:
加载LLaMA2-70B的4-bit量化版(需20GB显存),两者都能单卡运行,但4090的推理速度比3090快55%——因为新架构的Tensor核心效率更高。
训练任务:
用CIFAR-10训练ResNet-18,4090的epoch时间是3090的60%,而且4090支持FP8精度,训练时显存占用还能再降20%,3090则不支持。
老卡的优势:
3090的二手价不到4090的一半,而且功耗低100W,适合长期跑小模型(如5B以下)的用户,性价比反而更高。
升级建议
值得升级:经常跑10B以上模型、需要FP8加速,或对推理速度敏感(比如实时AI服务),4090能显著提升效率。
没必要升级:只跑小模型、预算有限,或更在意功耗,3090还能再战2-3年。
想亲手试试两者的差距?天罡智算上3090和4090都能租,3090时费0.65元/卡时,比4090便宜40%,适合短期测试对比。你的任务更依赖显存还是算力?评论区聊聊~

登录 或 注册 后才可以进行评论哦!
还没有评论,抢个沙发!