Nov 09, 2020

RTX3070明日上市，AI训练性能前瞻、官方基准测试公布

NVIDIA RTX 3070公版GPU的评测已于昨晚解禁，根据外媒的前瞻测试结果，RTX 3070与上一代的RTX 2080 Ti相比略有优势。29日，RTX 3070就将正式发售，对比3080/3090，显然其价格更适配主流人群所需。

1080P、4K帧率基准测试

外媒tom'sHARDWARE分别在1080p、2K和4K分辨率下测试了RTX 3070的平均帧率。在三种不同分辨率下，RTX 3070均与RTX 2080 Ti 帧率持平，OC模式下则小超2080 Ti。

英伟达 RTX 3070 公版评测出炉：性能与 RTX 2080 Ti 持平

其实评测成绩不能单看游戏性能，NVIDIA早就给出过RTX 3070的官方性能成绩，测试环境包括渲染软件、基准软件等，综合看下来，大概领先RTX 2080 Ti 8%左右。

虽然名为GeForce RTX 3070，但完全拥有挑战80级显卡的芯。媲美上一代卡皇GeForce RTX 2080 Ti，但售价仅需3899元，这一点性能提升就已经很超值了。

AI训练性能前瞻

RTX 3070的GA104核心174亿个晶体管，拥有5888个Cuda核心，并且包含第二代RT Core和第三代Tensor Core。RTX 3070不仅拥有更多的晶体管，还优化了负责实时光线追踪加速的RT Core和深度学习超采样DLSS的Tensor Core，导致专项性能有2至8倍的提升。

英伟达 RTX 3070 公版评测出炉：性能与 RTX 2080 Ti 持平

通常来说，深度学习对GPU显存的要求如下：

研究 SOTA 模型：≥11GB
一般的研究：8GB
Kaggle 及其它竞赛：4 - 8GB
公司业务：8GB 部署及原型测试，≥11GB 用于训练

对应到RTX 30系列显卡来说，可将3070（8GB显存）/3080（10GB显存）/3090（24GB显存）对号入座。

英伟达 RTX 3070 公版评测出炉：性能与 RTX 2080 Ti 持平

Tensor Core可以极大地加快矩阵乘法，深度学习优先使用 Tensor Core进行训练。由于RTX 架构的Tensor Core可以半精度（16bit）进行训练，显存需求减半，所以相比GTX显卡在同样的显存下可以训练大一倍的模型，因此除非预算极度有限，应该优先考虑RTX 20/30系列显卡。一张显卡有多少Tensor Core决定了这张显卡的算力，而Tensor FLOPS则量化了显卡的算力。

芯片型号	Tensor Core	Tensor FLOPS (万亿)	显存(GB)	TDP (W)	MSRP (USD)
2060	240	51.6	6	160	349
2060 super	272	57.4	8	175	399
2070 super	320	72.5	8	215	499
2080 super	384	89.2	8	250	699
2080 Ti	544	107.6	11	250	999
Titan RTX	576	130.5	24	280	2499
3070	184	163	8	220	499
3080	272	238	10	320	699
3090	328	285	24	350	1499

▲左右滑动表格，查看更多

虽然30系列的Tensor Core数量比20系列少，但官方称30系列的Tensor Core的性能是20系列的4倍，所以（如果官方宣传为真的话）3070的实际算力要强于2080 Ti。

四路液冷RTX30系列上新

稳固高效，不受降频困扰

宽泛科技旗下品牌Cloudhin®云轩专业售前工程师可为您量身定制深度学习AI服务器/工作站，并可预装ubuntu、centos、redhat、TensorFlow、cuda、cudnn等软件环境，让您收到即用，快速开展实验项目。目前，我们已通过自主设计，有效解决RTX 30系列GPU多路并行计算散热以及背部GDDR6X显存高温问题，4路RTX 3080/3090 GPU工作站欢迎垂询。