不少2020年入手RTX3090的朋友最近在纠结:“我的3090还能用吗?有必要换4090吗?”毕竟3090当年也是旗舰,24GB显存和4090一样,但架构差了一代,性能到底差多少?

小编翻出了压箱底的3090(顺便在天罡智算租了4090),针对老用户常跑的任务做了对比,结论可能和你想的不一样。


新旧旗舰参数对比

对比项

RTX5090

RTX4090

NVIDIA架构

Blackwell

AdaLovelace

显存

32GBGDDR7

24GBGDDR6X

显存位宽

512位

384位

显存带宽

1.8TB/s

1.01TB/s

CUDA核心数

21760

16384

Tensor核心数

680

512

CUDA核心FP16

104.8TFlops

82.58TFlops

Tensor核心FP16

419TFlops

330.3TFlops

Tensor核心FP4

3352TOPS

不支持


实测:同是24GB显存,体验差在哪?

大模型加载:

加载LLaMA2-70B的4-bit量化版(需20GB显存),两者都能单卡运行,但4090的推理速度比3090快55%——因为新架构的Tensor核心效率更高。


训练任务:

用CIFAR-10训练ResNet-18,4090的epoch时间是3090的60%,而且4090支持FP8精度,训练时显存占用还能再降20%,3090则不支持。


老卡的优势:

3090的二手价不到4090的一半,而且功耗低100W,适合长期跑小模型(如5B以下)的用户,性价比反而更高。


升级建议

值得升级:经常跑10B以上模型、需要FP8加速,或对推理速度敏感(比如实时AI服务),4090能显著提升效率。

没必要升级:只跑小模型、预算有限,或更在意功耗,3090还能再战2-3年。



想亲手试试两者的差距?天罡智算上3090和4090都能租,3090时费0.65元/卡时,比4090便宜40%,适合短期测试对比。你的任务更依赖显存还是算力?评论区聊聊~




嘉立创PCB

还没有评论,抢个沙发!