UnityShader入门精要——Unity中的渲染优化技术（三）

减少需要处理的顶点数目

1 优化几何体

尽可能减少模型中三角面片的数目，一些对于模型没有影响、或是肉眼非常难察觉到区别的顶点都要尽可能去掉。

移除不必要的硬边以及纹理衔接，避免边界平滑和纹理分离。

2 模型的LOD技术

原理：当一个物体离摄像机很远时，模型上的很多细节是无法被察觉到的。因此，LOD允许当对象逐渐远离摄像机时，减少模型上的面片数量，从而提高性能。

在Unity中，我们可以使用LOD Group组件来为一个物体构建一个 LOD。我们需要为同一个对象准备多个包含不同细节程序的模型，然后把它们赋给LOD Group组件中的不同等级，Unity就会自动判断当前位置上需要使用哪个等级的模型。

3 遮挡剔除技术

我们需要把遮挡剔除和摄像机的视锥体剔除(Frustum Culling) 区分开来。视锥体剔除只会剔除掉那些不在摄像机的视野范围内的对象，但不会判断视野中是否有物体被其他物体挡住。而遮挡剔除会使用一个虚拟的摄像机来遍历场景，从而构建一个潜在可见的对象集合的层级结构。在运行时刻，每个摄像机将会使用这个数据来识别哪些物体是可见的，而哪些被其他物体挡住不可见。使用遮挡剔除技术，不仅可以减少处理的顶点数目，还可以减少overdraw,提高游戏性能。

遮挡剔除https://docs.unity3d.com/Manual/OcclusionCulling.html

减少需要处理的片元数目

这部分优化的重点在于减少overdraw。简单来说，overdraw 指的就是同一个像素被绘制了多次。

1 控制绘制顺序

扫描二维码关注公众号，回复： 14299753 查看本文章

在Unity中，那些渲染队列数目小于2 500 ( 如“Background”“Geometry"和“AlphaTest")的对象都被认为是不透明(opaque)的物体，这些物体总体上是从前往后绘制的，而使用其他的队列(如“Transparent”“Overlay”等)的物体，则是从后往前绘制的。这意味着，我们可以尽可能地把物体的队列设置为不透明物体的渲染队列，而尽量避免使用半透明队列。

而且，我们还可以充分利用Unity的渲染队列来控制绘制顺序。例如，在第一人称射击游戏中，对于游戏中的主要人物角色来说，他们使用的shader往往比较复杂，但是，由于他们通常会挡住屏幕的很大一部分区域，因此我们可以先绘制它们(使用更小的渲染队列)。而对于一些敌方角色，它们通常会出现在各种掩体后面，因此，我们可以在所有常规的不透明物体后面渲染它们(使用更大的渲染队列)。而对于天空盒子来说，它几乎覆盖了所有的像素，而且我们知道它永远会出现在所有物体的后面，因此，它的队列可以设置为“Geometry+1"。这样，就可以保证不会因为它而造成overdraw。

2 透明物体

我们可以尽量减少窗口中GUI所占的面积。如果实在无能为力，我们可以把GUI的绘制和三维场景的绘制交给不同的摄像机，而其中负责三维场景的摄像机的视角范围尽量不要和GUI的相互重叠。当然，这样会对游戏的美观度产生一定影响，因此，我们可以在代码中对机器的性能进行判断，例如，首先关闭一些耗费性能的功能，如果发现这个机器表现非常良好，再尝试开启一些特效功能。

在移动平台上，透明度测试也会影响游戏性能。虽然透明度测试没有关闭深度测试，但由于它的实现使用了discard或clip操作，而这些操作会导致一些硬件的优化策略失效。

例如，我们之前讲过PowerVR使用的基于瓦片的延迟渲染技术，为了减少overdraw它会在调用片元着色器前就判断哪些瓦片被真正渲染的。但是，由于透明度测试在片元着色器中使用了discard 函数改变了片元是否会被渲染的结果，因此，GPU就无法使用上述的优化策略了。也就是说，只要在执行了所有的片元着色器后，GPU才知道哪些片元会被真正渲染到屏幕上，这样，原先那些可以减少overdraw的优化就都无效了。

这种时候，使用透明度混合的性能往往比使用透明度测试更好。

3 减少实时光照和阴影

对于多个光源的多Pass，由于无法进行批处理会显著提升drawcall。

使用烘培技术，把光照提前烘焙到一张光照纹理(lightmap) 中，然后在运行时刻只需要根据纹理采样得到光照结果即可。
另一个模拟光源的方法是使用God Ray。场景中很多小型光源的效果都是靠这种方法模拟的。它们一般并不是真的光源，很多情况是通过透明纹理模拟得到的。

在移动平台上，一个物体使用的逐像素光源数目应该小于1 (不包括平行光)。如果一定要使用更多的实时光，可以选择用逐顶点光照来代替。

在游戏《ShadowGun》中，游戏角色看起来使用了非常复杂高级的光照计算，但这实际上是优化后的结果。开发者们把复杂的光照计算存储到一张查找纹理( lookup texture，也被称为查找表，lookup table, LUT)中。然后在运行时刻，我们只需要使用光源方向、视角方向、法线方向等参数，对LUT采样得到光照结果即可。使用这样的查找纹理，不仅可以让我们使用更出色的光照模型，例如，更加复杂的BRDF模型，还可以利用查找纹理的大小来进一步优化性能，例如，主要角色可以使用更大分辨率的LUT,而一些NPC就使用较小的LUT。

实时阴影同样是一个非常消耗性能的效果。不仅是CPU需要提交更多的draw call, GPU也需要进行更多的处理。因此，我们应该尽量减少实时阴影，例如，使用烘焙把静态物体的阴影信息存储到光照纹理中，而只对场景中的动态物体使用适当的实时阴影。