RTX3070明日上市,AI训练性能前瞻、官方基准测试公布
NVIDIA RTX 3070公版GPU的评测已于昨晚解禁,根据外媒的前瞻测试结果,RTX 3070与上一代的RTX 2080 Ti相比略有优势。29日,RTX 3070就将正式发售,对比3080/3090,显然其价格更适配主流人群所需。
1080P、4K帧率基准测试
外媒tom'sHARDWARE分别在1080p、2K和4K分辨率下测试了RTX 3070的平均帧率。在三种不同分辨率下,RTX 3070均与RTX 2080 Ti 帧率持平,OC模式下则小超2080 Ti。
其实评测成绩不能单看游戏性能,NVIDIA早就给出过RTX 3070的官方性能成绩,测试环境包括渲染软件、基准软件等,综合看下来,大概领先RTX 2080 Ti 8%左右。
虽然名为GeForce RTX 3070,但完全拥有挑战80级显卡的芯。媲美上一代卡皇GeForce RTX 2080 Ti,但售价仅需3899元,这一点性能提升就已经很超值了。
AI训练性能前瞻
RTX 3070的GA104核心174亿个晶体管,拥有5888个Cuda核心,并且包含第二代RT Core和第三代Tensor Core。RTX 3070不仅拥有更多的晶体管,还优化了负责实时光线追踪加速的RT Core和深度学习超采样DLSS的Tensor Core,导致专项性能有2至8倍的提升。
通常来说,深度学习对GPU显存的要求如下:
研究 SOTA 模型:≥11GB
一般的研究:8GB
Kaggle 及其它竞赛:4 - 8GB
公司业务:8GB 部署及原型测试,≥11GB 用于训练
对应到RTX 30系列显卡来说,可将3070(8GB显存)/3080(10GB显存)/3090(24GB显存)对号入座。
Tensor Core可以极大地加快矩阵乘法,深度学习优先使用 Tensor Core进行训练。由于RTX 架构的Tensor Core可以半精度(16bit)进行训练,显存需求减半,所以相比GTX显卡在同样的显存下可以训练大一倍的模型,因此除非预算极度有限,应该优先考虑RTX 20/30系列显卡。一张显卡有多少Tensor Core决定了这张显卡的算力,而Tensor FLOPS则量化了显卡的算力。
芯片型号 | Tensor Core | Tensor FLOPS (万亿) | 显存(GB) | TDP (W) | MSRP (USD) |
---|---|---|---|---|---|
2060 | 240 | 51.6 | 6 | 160 | 349 |
2060 super | 272 | 57.4 | 8 | 175 | 399 |
2070 super | 320 | 72.5 | 8 | 215 | 499 |
2080 super | 384 | 89.2 | 8 | 250 | 699 |
2080 Ti | 544 | 107.6 | 11 | 250 | 999 |
Titan RTX | 576 | 130.5 | 24 | 280 | 2499 |
3070 | 184 | 163 | 8 | 220 | 499 |
3080 | 272 | 238 | 10 | 320 | 699 |
3090 | 328 | 285 | 24 | 350 | 1499 |
▲左右滑动表格,查看更多
虽然30系列的Tensor Core数量比20系列少,但官方称30系列的Tensor Core的性能是20系列的4倍,所以(如果官方宣传为真的话)3070的实际算力要强于2080 Ti。
四路液冷RTX30系列上新
稳固高效,不受降频困扰
宽泛科技旗下品牌Cloudhin®云轩专业售前工程师可为您量身定制深度学习AI服务器/工作站,并可预装ubuntu、centos、redhat、TensorFlow、cuda、cudnn等软件环境,让您收到即用,快速开展实验项目。目前,我们已通过自主设计,有效解决RTX 30系列GPU多路并行计算散热以及背部GDDR6X显存高温问题,4路RTX 3080/3090 GPU工作站欢迎垂询。
专业勤修,锐意进取。Cloudhin云轩技术工程师毕业于NVIDIA深度学习研究所,丰富经验,值得信赖。更多定制方案请联系客服,我们将实时响应您的定制需求。
如果您有合作需求或宝贵建议,欢迎来信。
邮箱:hezuo@kuanfans.com
合作热线:021-5415 5559