GPU在传统图形可视化领域的应用不断的扩大,无论是在3D设计,大分辨率多屏拼接显示,还是特效渲染领域,越来越多的人转向使用更加稳定的专业图形卡。深度学习和大数据作为新锐行业也大量地使用专业的GPU,以加速训练研发的速度。
最新基于Turing架构的NVIDIA Quadro GPU系列从去年就开始上市。本篇开箱评测分享将告诉你最新的Quadro RTX 5000有那些改变,又有哪些提升呢?
开箱
本次显卡包装改变了以往的颜色、风格,使用绿白灰搭配,正面的灰色格子采用渐变的颜色很有现代感和立体感。包装的正面和顶部、侧面都有显卡型号的标识。
RTX几个字有金属反光效果,凸显了这代显卡最重要的功能之一——实时光线追踪。
整体拿在手里沉甸甸的,挺有分量,包装的材质很结实。
显卡包装及配件
内部包装也和以往包装不一样,外壳和防震泡沫是一体的,显卡安置在其中,给人的感觉是坚固、牢靠。
显卡外面还有一层透明防静电袋,配线盒里面有用户手册、支持手册、 8pin转双6pin电源线、DP转DVI转接头和DP转HDMI转接头。这是众多使用DVI显示器或HDMI显示器的福音,再也不用另外单独购买转接头了。
显卡正面
显卡外观主要采用绿、银色和黑色搭配,与包装风格一致。显卡也是沉甸甸的,质感很不错。在显卡正面和脊背上都能看到显卡型号的标识。
Quadro RTX 5000依然是双插槽显卡,1个涡轮风扇,显卡采用8pin加6pin的供电方式,对于最大功耗为265W的RTX 5000来讲是足够用了。
显卡顶部接口
显卡顶部总共有3个接口,NVLink、SYNC、Stereo。
NVLink威廉希尔官方网站 取代了SLI威廉希尔官方网站 ,可以配合Quadro NVLink 2-Slot或者3-Slot使用。NVLink威廉希尔官方网站 不但具备多卡同步输出的功能,在应用支持的情况下,还能实现显存叠加的功能,使两块卡叠加成一个更大的显存。
SYNC接口要配合Quadro SYNCII卡来使用,实现多卡的显示信号同步输出。对于大屏拼接的用户来讲可以延续之前的使用方法。
Stereo接口要配合3D立体档板来输出3D立体信号。
总线接口是PCIE 3.0接口,向下兼容PCIE 2.0。目前市场上主板大都是使用这种接口的。
显卡显示接口
显示接口有了新的变化,不是4DP+DVI的配置,改成了4DP+VirtualLink的配置。
DP接口都支持DP 1.4的协议,最高分辨率可以达到7680x4320。而VirtualLink接口则是下一代VR设备使用的标准接口,一个接口可完成供电、显示传输、控制信号多个功能。
性能测试
显卡参数
测试平台
测试软件
测试内容展示
1.
SPECviewperf 13
SPECviewperf 13是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于OpenGL和DirectX的专业绘图软件进行基准评测,SPECviewperf 13带来了全新的9个专业图形测试场景,SPECviewperf13测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过6,000万个定点数据,能够充分反映出显卡的专业图形性能,此次测试我们使用软件默认配置进行评测。
测试结果
从测试结果来看,RTX 5000在所有项目上普遍超越了Quadro P5000,snx的性能甚至增加了40%以上。看来Turing架构增加的不仅仅是光线追踪和深度学习的效率,在专业应用的性能上增加的幅度也是很大的。
2.
SuperPosition Benchmark
这款软件更像是在一个复杂的游戏环境,在不同的光场效果中对显卡DX和OpenGL渲染性能及稳定性的评测。
测试结果
在DirectX的性能方面,RTX 5000比P5000提高了近45%,在OpenGL方面,RTX 5000比P 5000提高了性能提高了50%左右。两个主要的图形API的性能都增加了很多,相信RTX 5000在专业3D可视化领域有了更高的可用性。
3.
V-Ray Benchmark
Chaos Group的V-Ray在渲染领域早已被广大用户认可了,由于GPU渲染性能的提升,Chaos Group在V-Ray Next上推出了V-Ray GPU NEXT版本,支持调用NVIDIA CUDA核心进行渲染,随着威廉希尔官方网站 的不断更新,GPU渲染的质量上几乎和CPU没有区别。GPU算力强劲渲染时间成本会更低,并且支持多卡加速渲染,所以很多渲染器都在增加自己的GPU渲染功能。本次评估仅测试单卡的渲染性能,时间越短性能越好。
测试截图
测试结果
从测试结果看,使用最新的RTX 5000比P5000节省了35%的时间。在V-Ray渲染中RTX 5000的效率会更高一些。
4.
CUDA-Z
就像我们熟知的CPU-Z 、GPU-Z一样,CUDA-Z是对NVIDIA GPU处理器的一些基本信息的采集,GeForce、Quadro、Tesla卡都可以配合使用。
测试截图
CUDA计算能力
在CUDA-Z的测试项目中,我们实际用到最多的是单精度浮点运算,如果有使用到双精度科学计算的,推荐使用GV100或者GP100双精计算能力高的GPU。
RTX 5000单精计算的能力达到了11.7T,相对于前一台P5000提高了36%,提升幅度很大。这么强的单晶浮点数是CPU不能匹敌的,这也是越来越多的应用把计算从CPU转向了GPU的原因。
5.
3DMark Port Royal
测试场景
测试结果
目前NVIDIA的RTX渲染的Benchmark功能,3DMark的Port Royal可以支持性能测试。Quadro P5000由于没有RT Core所以无法使用这个评测软件。
测试场景里带了大量金属的材质,反射效果惊艳。RTX 5000渲染FPS达到了28左右帧,还算流畅。目前游戏行业已经有BF5使用这种威廉希尔官方网站 ,相信未来在工业制造领域和影视后期领域都会被广泛的使用。
6.
OctaneBench 2019 Preview
OC渲染器是做3D设计及动画的一款支持GPU渲染的渲染器,可以配合很多3ds Max、CINEMA 4D、NUKE、MODO等3D建模及特效的软件。OC渲染器是可以支持Out of Core的渲染软件,最新的OctaneBench 2019 Preview是可以支持RT Core加速光线追踪渲染的软件。我们可以看一下使用和关闭RTX在渲染速度上的区别。
测试截图
软件分别在开启RTX和关闭RTX状态下对相同场景进行渲染,从测试成绩上可以看出,开启了RTX On渲染之后,渲染的速度比关闭RTX渲染速度快了近3倍。可见在RT Core的加成下,渲染速度有了很大的提升。
7.
NVIDIA Tensorflow example
我们选择NVIDIA Tensorflow的一个示例来测试显卡的性能。在相同参数设置的情况下,显卡在一秒内训练的图片数越多,说明显卡在实例深度学习方面的性能越好。
上图可以看到,RTX 5000在满载时候每秒处理的数量最多为441张。
P5000在上图此示例中每秒处理的图片数最多为194张。
从每秒处理数据的性能上看,RTX 5000处理速度是P5000的2.2倍。速度快了很多,这是由于调用了Tensor Core进行计算的原因。可见Tensor Core在深度学习的加速上还是有很大作用的。Quadro RTX高端显卡都具有Tensor Core,基于这种显卡可以实现图像加AI的一些应用。例如在渲染的同时可以实现去AI噪点,图像AI识别,或者其他AI推理的一些工作。
总结
RTX 5000显卡最大的特点是:
具有RT Core支持RTX实时光线追踪渲染,能渲染出具有流光溢彩真实感的画面。渲染速度非常快,在诸多行业可视化的工业设计流程上会有很好的推动作用。
具有Tensor Core,可以加速深度学习和AI推理。在人工智能大力发展的今天,有了Tensor Core的加持,很多应用会变得如虎添翼。
传统的图形应用性能优化和稳定性都继承了下来,并且性能表现的更好。使用Fermi 、Kepler、Maxwell架构的用户可以考虑RTX系列显卡进行更新换代了。
-
NVIDIA
+关注
关注
14文章
5013浏览量
103246 -
gpu
+关注
关注
28文章
4752浏览量
129057 -
深度学习
+关注
关注
73文章
5507浏览量
121272
原文标题:NVIDIA Quadro RTX 5000评测 | 体验RTX加持下的创意工作改变
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论