当前位置: 首页 > news >正文

模型训练场景5090和4090的算力比较

晨涧云 AI算力平台最近上线了RTX 5090显卡,我们测试下英伟达这款最新的消费级旗舰和上一代RTX 4090在模型训练场景下性能差异多大?

之前使用 ResNet-50 模型比较过3090和4090的算力差异:
基于ResNet-50模型训练场景下实测3090和4090的性能

这里是用同样的方法进行测试。

RTX 5090和RTX 4090参数对比

两张显卡的参数规格:

RTX 5090 RTX 4090
架构 Blackwell Ada Lovelace
CUDA核心数 21,760 16,384
显存容量 32 GB GDDR7 24 GB GDDR6X
显存带宽 1792 GB/s 1,008 GB/s
TDP功耗 575W 450W
FP32 算力 104.8 TFLOPS 82.6 TFLOPS
Tensor FP16 算力 419 TFLOPS 330 TFLOPS

5090使用最新的Blackwell架构,性能有了大幅提升:

  • 显存方面:32G的容量比4090增加8G,但也略显局促;显存带宽有大幅的提升

  • 算力方面:5090的算力比4090提升近30%

  • 相应的功耗也比4090高不少,要综合考虑高负荷工作时的耗电量

深度学习模型训练测试

在 晨涧云-算力市场 租用5090的显卡,注意因为5090必须基于 PyTorch 2.7 以上 + CUDA 12.8 以上的版本,所以选择镜像时需要选择对用的版本镜像。

还是选择基于Pytorch框架来训练ResNet-50模型,使用CIFAR-10数据集进行测试对比。

5090测试

ResNet50AI性能测试-5090-1

4090测试

ResNet50AI性能测试-4090-1

测试结果解释

使用了FP32和FP16混合训练精度,主要看训练批次比较大(显存和GPU利用率都较高的时候)的数据表现,看训练吞吐量的差异:

  • 精度FP32 表示使用单精度训练,FP16 表示使用混合精度训练

  • BatchSize:训练批次大小

  • Samples/s:每秒样本吞吐量

  • VRAM (MB):平均显存使用量

  • GPU Util (%):平均GPU利用率

从上图中主要看在GPU使用率比较高的场景下(如BatchSize=256),模型训练样本的吞吐速度比较;无论是单精度还是混合精度,RTX 5090的样本吞吐速度是RTX 4090的1.5倍左右

从测试结果,结合5090现在市面的价格而言,是很不错的一个选择,唯一不足的地方就是新的Blackwell架构必须使用 PyTorch 2.7 以上 + CUDA 12.8 以上的版本,对老项目不太友好。

http://icebutterfly214.com/news/48492/

相关文章:

  • 2025年自动化绕线机订制厂家权威推荐:电机自动绕线机/小型自动绕线机/全自动电机绕线机源头厂家精选
  • 段式液晶驱动芯片水电表段码屏驱动高抗干扰LCD显示驱动IC VK2C22B
  • idea中maven转gradle
  • 从0死磕全栈之Next.js 本地开发环境优化最佳实践 - 指南
  • 【FAQ】HarmonyOS SDK 闭源开放能力 — Account Kit
  • 【哲学思考】我常用的方法论
  • 2025年塑料回收企业区域影响力榜单,评价好的塑料回收直销厂家排行榜单聚焦优质品牌综合实力排行
  • 2025年系统门窗10大品牌定做厂家推荐榜单:系统门窗厂家/系统门窗制造商/系统门窗价格源头厂家精选
  • 2025年国内锯条品牌权威排名榜单:行业专家深度解析与选购指南
  • 2025 最新软著申请公司推荐!计算机 / 企业 / 个人软著申请代办权威榜单,一站式高效办理代理服务机构口碑排行榜
  • linux address
  • 美国本科如何规划求职?2025全攻略+靠谱中介机构推荐
  • 2025年比较好的茶叶烘干网带行业内口碑厂家排行榜
  • 2025年知名的别墅装修最新推荐榜
  • 2025年正规的企业短视频账号代运营TOP品牌榜
  • 2025年靠谱的1688运营用户推荐榜
  • 2025年推荐几家网站建设行业权威榜
  • 2025杭州最大留学中介机构是哪家
  • 2025成都留学中介机构哪家比较好一点的
  • 2025年比较好的社区售水机高评价厂家推荐榜
  • 2025年国标隔热条品牌综合实力排行榜TOP10推荐
  • 2025年口碑好的悉尼澳洲海外仓中转配送品牌推荐榜
  • 2025年评价高的昆山绿化用户好评厂家排行
  • 查看当前 Java 运行的版本?
  • 浅显易懂的解释一下RRF加权算法的意思
  • 实用指南:用 FPGA 实现 PCIe 传输,开源核 LitePCIe 深度解读
  • 2025年11月人形机器人落地商排行推荐:中立评价与场景适配
  • 2025年11月成都监理公司推荐榜:专业服务对比与选择指南
  • 建筑人必备!Navisworks 2025 协同神器 大型项目协作天花板 安装
  • 2025年11月不锈钢精密铸造厂家评价:详析各企业优势与适用场景