UnityShader入门精要——Unity中的渲染优化技术(三)

减少需要处理的顶点数目

1 优化几何体

尽可能减少模型中三角面片的数目,一些对于模型没有影响、或是肉眼非常难察觉到区别的顶点都要尽可能去掉。

移除不必要的硬边以及纹理衔接,避免边界平滑和纹理分离。

2 模型的LOD技术

原理:当一个物体离摄像机很远时,模型上的很多细节是无法被察觉到的。因此,LOD允许当对象逐渐远离摄像机时,减少模型上的面片数量,从而提高性能。

在Unity中,我们可以使用LOD Group组件来为一个物体构建一个 LOD。我们需要为同一个对象准备多个包含不同细节程序的模型,然后把它们赋给LOD Group组件中的不同等级,Unity就会自动判断当前位置上需要使用哪个等级的模型。

3 遮挡剔除技术

我们需要把遮挡剔除和摄像机的视锥体剔除(Frustum Culling) 区分开来。视锥体剔除只会剔除掉那些不在摄像机的视野范围内的对象,但不会判断视野中是否有物体被其他物体挡住。而遮挡剔除会使用一个虚拟的摄像机来遍历场景,从而构建一个潜在可见的对象集合的层级结构。在运行时刻,每个摄像机将会使用这个数据来识别哪些物体是可见的,而哪些被其他物体挡住不可见。使用遮挡剔除技术,不仅可以减少处理的顶点数目,还可以减少overdraw,提高游戏性能。

遮挡剔除icon-default.png?t=M5H6https://docs.unity3d.com/Manual/OcclusionCulling.html

减少需要处理的片元数目

这部分优化的重点在于减少overdraw。简单来说,overdraw 指的就是同一个像素被绘制了多次。

1 控制绘制顺序

扫描二维码关注公众号,回复: 14299753 查看本文章

在Unity中,那些渲染队列数目小于2 500 ( 如“Background”“Geometry"和“AlphaTest")的对象都被认为是不透明(opaque)的物体,这些物体总体上是从前往后绘制的,而使用其他的队列(如“Transparent”“Overlay”等)的物体,则是从后往前绘制的。这意味着,我们可以尽可能地把物体的队列设置为不透明物体的渲染队列,而尽量避免使用半透明队列。

而且,我们还可以充分利用Unity的渲染队列来控制绘制顺序。例如,在第一人称射击游戏中,对于游戏中的主要人物角色来说,他们使用的shader往往比较复杂,但是,由于他们通常会挡住屏幕的很大一部分区域,因此我们可以先绘制它们(使用更小的渲染队列)。而对于一些敌方角色,它们通常会出现在各种掩体后面,因此,我们可以在所有常规的不透明物体后面渲染它们(使用更大的渲染队列)。而对于天空盒子来说,它几乎覆盖了所有的像素,而且我们知道它永远会出现在所有物体的后面,因此,它的队列可以设置为“Geometry+1"。这样,就可以保证不会因为它而造成overdraw。

2 透明物体

我们可以尽量减少窗口中GUI所占的面积。如果实在无能为力,我们可以把GUI的绘制和三维场景的绘制交给不同的摄像机,而其中负责三维场景的摄像机的视角范围尽量不要和GUI的相互重叠。当然,这样会对游戏的美观度产生一定影响,因此,我们可以在代码中对机器的性能进行判断,例如,首先关闭一些耗费性能的功能,如果发现这个机器表现非常良好,再尝试开启一些特效功能。

在移动平台上,透明度测试也会影响游戏性能。虽然透明度测试没有关闭深度测试,但由于它的实现使用了discard或clip操作,而这些操作会导致一些硬件的优化策略失效。

例如,我们之前讲过PowerVR使用的基于瓦片的延迟渲染技术,为了减少overdraw它会在调用片元着色器前就判断哪些瓦片被真正渲染的。但是,由于透明度测试在片元着色器中使用了discard 函数改变了片元是否会被渲染的结果,因此,GPU就无法使用上述的优化策略了。也就是说,只要在执行了所有的片元着色器后,GPU才知道哪些片元会被真正渲染到屏幕上,这样,原先那些可以减少overdraw的优化就都无效了。

这种时候,使用透明度混合的性能往往比使用透明度测试更好。

3 减少实时光照和阴影

对于多个光源的多Pass,由于无法进行批处理会显著提升drawcall。

  1. 使用烘培技术,把光照提前烘焙到一张光照纹理(lightmap) 中,然后在运行时刻只需要根据纹理采样得到光照结果即可。
  2. 另一个模拟光源的方法是使用God Ray。 场景中很多小型光源的效果都是靠这种方法模拟的。它们一般并不是真的光源,很多情况是通过透明纹理模拟得到的。

在移动平台上,一个物体使用的逐像素光源数目应该小于1 (不包括平行光)。如果一 定要使用更多的实时光,可以选择用逐顶点光照来代替。

在游戏《ShadowGun》中,游戏角色看起来使用了非常复杂高级的光照计算,但这实际上是优化后的结果。开发者们把复杂的光照计算存储到一张查找纹理( lookup texture, 也被称为查找表,lookup table, LUT)中。然后在运行时刻,我们只需要使用光源方向、视角方向、法线方向等参数,对LUT采样得到光照结果即可。使用这样的查找纹理,不仅可以让我们使用更出色的光照模型,例如,更加复杂的BRDF模型,还可以利用查找纹理的大小来进一步优化性能,例如,主要角色可以使用更大分辨率的LUT,而一些NPC就使用较小的LUT。

实时阴影同样是一个非常消耗性能的效果。不仅是CPU需要提交更多的draw call, GPU也需要进行更多的处理。因此,我们应该尽量减少实时阴影,例如,使用烘焙把静态物体的阴影信息存储到光照纹理中,而只对场景中的动态物体使用适当的实时阴影。

猜你喜欢

转载自blog.csdn.net/weixin_51327051/article/details/125375488