如何根据 V-RAY BENCHMARK 挑选合适的渲染硬件

文 / Christopher Nichols
译 / Hammer Chen

阅读本文以了解V-Ray Benchmark的开发缘由,这个工具在当今CG行业中的角色,以及如何运行并分析CPU和GPU渲染基准检验。

2017年,我们决定发布一个名为V-Ray Benchmark的工具。起初想法很简单,同时这也是响应对许多用户经常问的重要问题:投资怎样的硬件才能发挥V-Ray最大效益?

我们推出这个免费的独立的应用程序,让大家可以测试CPU和GPU渲染。然后,客户可决定是否将结果发布到Chaos Group的Benchmark效能评测网页上,并查看他们的硬件与其他人的硬件的效能比较。如果不想发布的结果——或还没有任何硬件进行测试——仍然可以在网上查看评测排名,并据此做出明智选择。

从那时起,我们对Benchmark应用程序进行更新。另外,不仅仅是V-Ray的使用者会用这个工具。许多硬件制造商和评论家也开始使用V-Ray Benchmark,来测试应用程序或测试最新最强大的硬件。这使V-Ray Benchmark成为计算机图形和硬件行业用来测试性能的实务工具。而且,与Cinebench等其他基准检验工具不一样,V-Ray Benchmark测试使用的是人们在3D CG产业实际使用的程序。

但首先,让我们回顾一下这个工具的历史,看看V-Ray Benchmark在今日的计算机绘图产业具有怎样的地位。

V-Ray Benchmark的历史

开发这个工具背后的初心

如同前面所述:这个工具来自于V-Ray用户的需求,客户需要真正地将V-Ray性能与其他硬件进行效能比较测试。虽然过去有一些基准场景,但必须要将场景加载到DCC应用程序中并在其中进行渲染操作。这种测试不见得可靠,由于不同的用户可能会有不同的设置 — 某些用户可能会更改参数使结果产生偏差。另外,有些用户可能尚未拥有V-Ray许可证,他们或许想在购买V-Ray之前先行测试硬件性能。

因此,我们决定制作一个独立的、不需要V-Ray许可证的应用程序,使用与本公司的商业产品同样的渲染核心——任何人都可以下载并在他们的计算机上运行。通过使其独立,我们不需要担心DCC应用程序可能使用不同的设置。然后我们删除了所有其他可能被操纵的参数,这样就可以得到一个真正一对一比较的环境。

为什么有两种测试:CPU和GPU?

在一对一比较中,唯一的例外是使用V-Ray与V-Ray GPU进行渲染。V-Ray只运行在CPU上而V-Ray GPU可运行在GPU和/或CPU上。如你所知:V-Ray跟V-Ray GPU运作方式不同——即使两者都可CPU上运行。因此,无法对这两种硬件进行真正的比较。此外,尽管V-Ray GPU也可以利用CPU硬件,但CPU渲染器与GPU渲染器彼此之间的运行效率并没有纳入效能计算。

因此,我们决定用两个不同的场景来做两个不同的基准检验,以确实把CPU渲染的结果和GPU渲染分开。

V-Ray Benchmark 1.0是怎样过时的

当我们在2017年第一次开发V-Ray Benchmark时,我们决定当基准达到一定的噪声阈值后,根据完成渲染的时间来测量基准的结果。当初的想法是在标准硬件上使用一到两分钟的场景。然而随着V-Ray Benchmark的流行,我们发现许多用户——以及硬件制造商——都用很强大的计算机进行效能测试,其中包括CPU和GPU。一旦大家开始在具有128颗核心(或16颗GPU的系统上进行测试,基准检验时间很快就从1或2分钟降到了20秒甚至更短。当渲染时间降到如此低时,测试的结果就变得不可靠,因为与实际的渲染时间相比,I/O(输出与输入的传输速度)开始对总体时间产生更大的影响。

此外,V-Ray Benchmark测试的原始版本是根据V-Ray 3计算的。自V-Ray Next以来,我们更新了V-Ray的核心引擎,使其更快,并利用了新的硬件特性。因此,V-Ray Benchmark 1.0 不再是测试硬件的好基准,再也不能代表当前V-Ray的真正性能了。

什么是V-Ray Next Benchmark? 如何解读评测结果

显然,我们需要更新V-Ray Benchmark,并且采用不同的方法来测量速度:让它不随着计算机的世代升级而变得过时。因此,除了更新V-Ray引擎和其渲染的场景外,我们决定让所有的渲染运行一段固定的时间。我们的新结果测量了CPU在固定时间内发射的采样数量(ksamples)和GPU发射的光线跟踪路径数量(mpath)。这样,就可以始终如一地查看每台计算机的性能,而不必担心测试时间不够长。

再次强调,因为V-Ray测试和V-Ray GPU测试是运行两种截然不同的渲染硬件架构,每一个测试都提交两种不同的结果——V-Ray引擎的ksamples和V-Ray GPU引擎的mpath -以确保用户不会不小心比较V-Ray结果与V-Ray GPU的结果。毕竟,这是对计算机使用每个渲染器性能的测试,而不是两种渲染引擎之间的比较测试。

如何执行V-Ray Benchmark测试

运行测试非常简单。首先要做的是下载V-Ray Benchmark应用程序。你需要先在网站上免费注册才能下载。

下载我们的最新版本,并运行在您的计算机上。应用程序是独立的,甚至不需要安装。

请注意,如果你安装了一个新的GPU,或一个新的GPU驱动程序,在第一次测试时会出现轻微的延迟。这是因为V-Ray GPU需要为新的硬件和/或驱动程序设定配置。

V-Ray Benchmark测试应用程序启动并运行后,您将在左侧看到两个选项。你可以运行V-Ray测试,只针对CPU测试,或者可运行V-Ray GPU,利用GPU与CPU计算。

对于V-Ray GPU测试,您将看到可供选择测试的硬件列表。将列出系统中支持的所有GPU和CPU。可以选择一个、几个或全部。如果您想仅使用GPU测试系统,请确保取消选择列出的CPU—这是一个有用的度量方法,用于量测您的CPU加诸于GPU之上所带来的额外好处。

然后点击开始按钮,让软件进行测试。无论计算机的速度如何,每轮测试都将精确地运行壹分钟。一旦完成,就会提交结果。呈列结果。你可以添加更多关于你计算机配备的信息,并提交得分。

若对分数不满意,或觉得其他程序干扰得分,你还是可以再次运行测试。

如何分析V-Ray Benchmark测试结果

当您上V-Ray Benchmark网站时,会注意到几件事。首先,我们有两个独立的排名。一个是“V-Ray”的排名,只在CPU上运行,另一个是“V-Ray GPU”的排名,在GPU上运行。正如我们先前提到的:CPU也可以用来做V-Ray GPU测试。稍后详细介绍……

接下来是搜索栏,您可以在其中搜索列出的任何特定硬件。例如,如你只想列出AMD超威处理器的CPU,可进行搜寻,或者如果你想查看任何使用RTX 2080 Ti显示适配器测试的结果,也可针对搜寻。

这样就可以看到特定硬件的结果。例如,如果你测试你自己的计算机,根据搜寻结果,你可以看到在相同性能范围内的其他硬件列表。

至于列表本身,结果共以四列显示。第一列是实际排名,第二列显示测试的硬件。第三列是基准分数。最后一列是运行的次数。

关于V-Ray GPU结果有一点很重要。您可能会注意到,许多结果还包括CPU对渲染时间的贡献。根据您的硬件设置,CPU将提高测试的性能。因此,两个相同的GPU设置可以有很大的性能差异,这取决于CPU的额外贡献。因此,如果您只想比较您的GPU与其他GPU,那就必须确保所比较的基准检验不包含CPU—或者至少确保两者具有类似的CPU。

这样应该就能提供您足够的信息,可根据需要筛选结果,将您的硬件与其他硬件进行比较。

一些有趣的内部测试结果

现在我们已经了解如何解读评测结果,让我们来看看Chaos Group实验室中测试的硬件,并检视V-Ray Benchmark测试得到的有趣结果。

1. 联想P920工作站

联想计算机的朋友给了我们一台联想P920工作站计算机进行测试。对于Chaos Group Labs来说,这是一台理想的计算机,因其功能强大,最重要的是,由于其流畅外型和免工具快拆的设计,使切换不同的GPU变得快速和轻松。就像赛车一样,换显卡的速度几乎和换F1赛车轮胎一样快。同时也感谢我们在NVIDIA的合作伙伴,我们可以测试NVIDIA最新GPU,如下图所示显卡插在联想P920工作站。

以上设置的配置如下:

CPU:两颗 Xeon®Gold 6136 @ 3.00 GHZ, 24核(48个线程)。
GPU:两张Quadro RTX 8000, 48Gb GPU内存,NVLINK + Quadro P4000, 8Gb GPU内存(主要用于显示)。

首先,让我们看看CPU测试:

结果得到超过32,000 ksamples,与其他同类CPU达到相同水平。然而,当你看到列表的时候,你会发现32核的AMD Threadripper 2990WX并没有那么落后。

由于我们有很多不同的GPU配置,我们决定以多种不同的方式运行测试,如下:

两张Quadro RTX 8000s —

首先,请谨记,当进入V-Ray Benchmark测试页面时,请限制仅列出GPU的GPU列表中寻找结果。如果您看到列出的CPU,这意味着结果包含CPU运算的混合模式。

但是,回到我们的结果:如果你正在寻找一个快速的GPU设置与尽可能多的GPU内存,这会是最佳选择。测试结果为738 mpaths,与其他RTX 8000s和6000s达到相同水平。这样的结果说得通,因为这两张卡之间唯一的区别是GPU内存,而非速度。值得注意的是,两张GeForce RTX2080s卡可以使用几种不同配置,得分却基本相同。

基于性价比,RTX2080是不错的选择。然而,这些测试也包含混合模式的CPU。有个测试非常接近我们的评分,也就是三张GeForce RTX 2080s。但请记住,尽管Quadro RTX 8000比GeForce卡昂贵得多,但它的GPU内存是后者的四倍。因此,虽然渲染时间可能是相同的,Quadro RTX 8000可以渲染更大的场景。

两张Quadro RTX 8000s + Quadro P4000 –

因为我们有一张P4000显示适配器在同一个盒子里,不算慢,让我们继续插进去,看看它对基准有多大的帮助。

这张卡最终提高了性能142 mpaths,这是一个不错的小提升。但请记住,P4000只有8 Gb的GPU内存,是非共享的内存。因此,如果你的整个场景内存需求超过那张卡,将渲染失败。从设计,V-Ray Benchmark测试对GPU内存的要求不高,因此P4000的内存还是足以拿来测试。

两张 Quadro RTX 8000s + Quadro P4000 + 两颗 Xeon ® Gold 6136 @ 3.00 GHZ —

到目前为止,让我们充分利用计算机的力量,看看我们的CPU可以帮助提高多少我们的V-Ray GPU渲染性能。

结果证明,通过添加CPU,我们获得了额外的166个mpath的性能,这是对性能的另一个很好的提升。然而,CPU并没有与P4000相同的RAM限制,因为CPU会取用系统RAM,而当前系统内存是192Gb。

现在让我们看看另一个系统。

2. Razer Blade Studio Edition雷蛇灵刃工作室版笔电

由于我们与英伟达的紧密合作,NVIDIA好心好地让我们试用了新一代的笔记本电脑,这款“Studio”系列。Razer系列原本以其灵活和快速的游戏笔记本电脑而闻名,现在决定进入专业的主力笔记本电脑市场。这款新的笔记本电脑非常特别,除了功能非常强大外,还相当扎实——相对较轻,只有2.21公斤。即使这么小的尺寸,仍然威力强大。最重要的是,我们决定拿到Razer eGPU外接式显示适配器,并添加另一个全尺寸的GPU混合运算,只是为了好玩。

配置如下:
CPU: Intel®Core(™)i7-9750H @2.60 GHZ, 6核(12个线程)
GPU: Quadro RTX 5000 Max-Q设计,16Gb GPU内存
eGPU:配备24Gb GPU内存的Quadro RTX 6000

首先,让我们单独看看CPU在标准的V-Ray测试。结果是大约6,900 ksamples,这对于笔记本电脑的CPU来说分数非常高。

接下来,让我们尝试不同的GPU配置:

Quadro RTX 5000 采用Max-Q 设计 —

这次我们得到了大约159 mpath的结果。对于拥有这么小的GPU,塞到一个不到2.27公斤的笔记本电脑来说,这个结果相当惊人。

Quadro RTX 5000 采用 Max-Q设计 + Quadro RTX 6000塞在 eGPU当中 —

显然,由于这是一个全尺寸的,顶级的GPU威力强大,我们预期其速度大幅提升。加上它给我们带来了366个mpaths,几乎是这款笔电GPU的三倍。当需要的时候可以外接这个强大的运算硬件真的很棒。

Quadro RTX 5000采用 Max-Q设计 + Quadro RTX 6000塞在 eGPU当中+ Intel ® Core (™) i7-9750H @2.60 GHZ —

在这种梦幻配置下,我们可以真正看到硬件的极限,但是当CPU只给我们36个mpaths时,请记住这是笔电上的CPU,所以能做的就只有这么多了。当然,这是当笔电外接电源、电池没有耗尽的情况下才能达到;使用笔电的电池供电通常会让CPU减速。

尽管如此,这新一代的移动工作室笔记本电脑不仅在大小合适,还可以超越许多几年前中等水平的桌机计算机。

3.GPU巨兽(或旧的、重新配置的VCA视觉运算装置)

当我们在内部测试许多不同的硬件时,我们有时会有一些旧的硬件。这包括一个旧的VCA,我们当初拿它来制作《CONSTRUCT》短片。NVIDIA很好心地寄给我们八张Quadro RTX 8000s显示适配器,我们把这些显卡装进这个怪物般的视觉运算装置盒子里。

配置如下:

CPU: 2x Intel Xeon E3-12xx, 3.7 GHZ 8核(16个线程)
GPU: 8 x Quadro RTX 8000与48 GB内存

首先,让我们进行CPU测试。请记住,虽然这些CPU在当时非常强大和昂贵,但这2012年代的,因此相当过时。尽管如此,他们还是成功地得出10613 ksamples的成绩,这还算不错,但我们新的移动笔记本电脑的CPU相比,仍然只快了60%左右。

但我们真正想要看到的测试是这8张顶级GPU的表现如何。

这里,得到的结果高达2779 mpaths。这是很高的GPU分数!有趣的是,如果除以8,就得到347。然后,如果你使用两颗相同的GPU从P920中得到结果并除以二,你得到369——考虑到这两台计算机的巨大差异,数值已经非常接近了。这意味着V-Ray和这些GPU的比例是线性的,我们很高兴看到这点。

另外,当我们决定添加2012年的旧CPU时,发生了一件有趣的事情:

得分实际上下降了140分,而不是增加一点点。通常,V-Ray是线性扩展的,也就是说,你添加的计算机能运算力越大,V-Ray运行的速度就越快。8核比1核快8倍,4颗 GPU比1 颗GPU快4倍。

然而,在这种情况下,虽然我们在技术上增加了CPU的计算能力,但这颗CPU是更旧的CPU,与新CPU相比速度要慢得多。V-Ray GPU的处理器平衡被调到更高的CPU / GPU速度比,所以当我们使用全新的GPU配上8年前的CPU时,已经超出了其调优的范围。

V-Ray Benchmark真的有帮助

V-Ray Benchmark的测试结果可以有很多不同的解读方式。实际上,在运行测试之前,通过查看基准检验页面上的结果可做很多事。使用过滤搜寻来显示您想要查看的硬件,查看不同的速度范围,比较不同类型的GPU…等等。

尽管最新版本的V-Ray Benchmark测试确实帮助了许多用户、评论网站和硬件制造商,我们仍将持续改进,随着V-Ray增加新的功能,我们也将利用这些新功能。请持续关注!

准备好进行测试了吗? 免费下载V-Ray Benchmark

点此阅读V-Ray Benchmark帮助文档

关于作者

Christopher Nichols
Chris 是 CG 行业资深人士和 Chaos Group 实验室总监。作为 CG Garage 播客的主持人,你可以定期收听他的节目,每周吸引 20000 名听众。有视觉特效与设计的专业背景,Chris 曾为 Gensler,Digital Domain,Imageworks 和 Method Studios 工作。 并曾参与制作包括 Maleficent,Oblivion 和 Tron:Legacy 等电影。