Nov 09, 2020

RTX3070明日上市,AI训练性能前瞻、官方基准测试公布

NVIDIA RTX 3070公版GPU的评测已于昨晚解禁,根据外媒的前瞻测试结果,RTX 3070与上一代的RTX 2080 Ti相比略有优势。29日,RTX 3070就将正式发售,对比3080/3090,显然其价格更适配主流人群所需。





1080P、4K帧率基准测试





外媒tom'sHARDWARE分别在1080p、2K和4K分辨率下测试了RTX 3070的平均帧率。在三种不同分辨率下,RTX 3070均与RTX 2080 Ti 帧率持平,OC模式下则小超2080 Ti。



其实评测成绩不能单看游戏性能,NVIDIA早就给出过RTX 3070的官方性能成绩,测试环境包括渲染软件、基准软件等,综合看下来,大概领先RTX 2080 Ti 8%左右



虽然名为GeForce RTX 3070,但完全拥有挑战80级显卡的芯。媲美上一代卡皇GeForce RTX 2080 Ti,但售价仅需3899元,这一点性能提升就已经很超值了。




AI训练性能前瞻





RTX 3070的GA104核心174亿个晶体管,拥有5888个Cuda核心,并且包含第二代RT Core和第三代Tensor Core。RTX 3070不仅拥有更多的晶体管,还优化了负责实时光线追踪加速的RT Core和深度学习超采样DLSS的Tensor Core,导致专项性能有2至8倍的提升。



通常来说,深度学习对GPU显存的要求如下:

  • 研究 SOTA 模型:≥11GB

  • 一般的研究:8GB

  • Kaggle 及其它竞赛:4 - 8GB

  • 公司业务:8GB 部署及原型测试,≥11GB 用于训练

对应到RTX 30系列显卡来说,可将3070(8GB显存)/3080(10GB显存)/3090(24GB显存)对号入座。

Tensor Core可以极大地加快矩阵乘法,深度学习优先使用 Tensor Core进行训练。由于RTX 架构的Tensor Core可以半精度(16bit)进行训练,显存需求减半,所以相比GTX显卡在同样的显存下可以训练大一倍的模型,因此除非预算极度有限,应该优先考虑RTX 20/30系列显卡。一张显卡有多少Tensor Core决定了这张显卡的算力,而Tensor FLOPS则量化了显卡的算力。


芯片型号Tensor CoreTensor FLOPS (万亿)显存(GB)TDP (W)MSRP (USD)
206024051.66160349
2060 super27257.48175399
2070 super32072.58215499
2080 super38489.28250699
2080 Ti544107.611250999
Titan RTX576130.5242802499
30701841638220499
308027223810320699
3090328285243501499

左右滑动表格,查看更多


虽然30系列的Tensor Core数量比20系列少,但官方称30系列的Tensor Core的性能是20系列的4倍,所以(如果官方宣传为真的话)3070的实际算力要强于2080 Ti




四路液冷RTX30系列上新

稳固高效,不受降频困扰






宽泛科技旗下品牌Cloudhin®云轩专业售前工程师可为您量身定制深度学习AI服务器/工作站,并可预装ubuntu、centos、redhat、TensorFlow、cuda、cudnn等软件环境,让您收到即用,快速开展实验项目。目前,我们已通过自主设计,有效解决RTX 30系列GPU多路并行计算散热以及背部GDDR6X显存高温问题,4路RTX 3080/3090 GPU工作站欢迎垂询。



专业勤修,锐意进取。Cloudhin云轩技术工程师毕业于NVIDIA深度学习研究所,丰富经验,值得信赖。更多定制方案请联系客服,我们将实时响应您的定制需求。





联系我们


如果您有合作需求或宝贵建议,欢迎来信。

邮箱:hezuo@kuanfans.com

合作热线:021-5415 5559