Unity Shader Early-Z技术

Early-Z技术

传统的渲染管线中，ZTest其实是在Blending阶段，这时候进行深度测试，所有对象的像素着色器都会计算一遍，没有什么性能提升，仅仅是为了得出正确的遮挡结果，会造成大量的无用计算，因为每个像素点上肯定重叠了很多计算。因此现代GPU中运用了Early-Z的技术，在Vertex阶段和Fragment阶段之间（光栅化之后，fragment之前）进行一次深度测试，如果深度测试失败，就不必进行fragment阶段的计算了，因此在性能上会有很大的提升。但是最终的ZTest仍然需要进行，以保证最终的遮挡关系结果正确。
前面的一次主要是Z-Cull为了裁剪已达到优化的目的，后一次主要是Z-Check，为了检查，如下图：
在这里插入图片描述
Early-Z的实现，主要是通过一个Z-pre-pass显示，简单来说，对于所有不透明的物体（透明的没有用，本身不会写入深度），首先用一个超级简单的shader进行渲染，这个shader不写入颜色缓冲区，只写深度缓冲区，第二个pass关闭深度写入，开启深度测试，用正常的shader进行渲染。其实这种技术，我们也可以借鉴，在渲染透明物体时，因为关闭了深度写入，有时候会有其他不透明的部分遮挡住透明的部分，而我们其实不希望他们被遮挡，仅仅希望被遮挡的物体半透，这时我们就可以用两个pass来渲染，第一个pass使用Color Mask屏蔽颜色写入，仅写入深度，第二个pass正常渲染半透，关闭深度写入。关于Early-Z技术可以参考ATI的论文Applications of Explicit Early-Z Culling以及PPT，还有一篇Intel的文章。

Unity渲染顺序总结

如果我们先绘制后面的物体，再绘制前面的物体，就会造成over draw；而通过Early-Z技术，我们就可以先绘制较近的物体，再绘制较远的物体（仅限不透明物体），这样，通过先渲染前面的物体，让前面的物体先占坑，就可以让后面的物体深度测试失败，进而减少重复的fragment计算，达到优化的目的。Unity中默认应该就是按照最近距离的面进行绘制的，我们可以看一下Unity官方的文档中显示的：
在这里插入图片描述

从文档给出的流程来看，这个Depth-Test发生在Vertex阶段和Fragment阶段之间，也就是上面所说的Early-Z优化。
简单总结一下Unity中的渲染顺序：先渲染不透明物体，顺序是从前到后；再渲染透明物体，顺序是从后到前。

Alpha Test（Discard）在移动平台消耗较大的原因

从本人刚刚开始接触渲染，就开始听说移动平台Alpha Test比较费，当时比较纳闷，直接discard了为什么会费呢，应该更省才对啊？这个问题困扰了我好久，今天来刨根问底一下。还是跟我们上面讲到的Early-Z优化。正常情况下，比如我们渲染一个面片，不管是否是开启深度写入或者深度测试，这个面片的光栅化之后对应的像素的深度值都可以在Early-Z（Z-Cull）的阶段判断出来了；而如果开启了Alpha Test（Discard）的时候，discard这个操作是在fragment阶段进行的，也就是说这个面片光栅化之后对应的像素是否可见，是在fragment阶段之后才知道的，最终需要靠Z-Check进行判断这个像素点最终的颜色。其实想象一下也能够知道，如果我们开了Alpha Test并且还用Early-Z的话，一块本来应该被剃掉的地方，就仍然写进了深度缓存，这样就会造成其他部分被一个完全没东西的地方遮挡，最终的渲染效果肯定就不对了。所以，如果我们开启了Alpha Test，就不会进行Early-Z，Z Test推迟到fragment之后进行，那么这个物体对应的shader就会完全执行vertex shader和fragment shader，造成over draw。有一种方式是使用Alpha Blend代替Alpha Test，虽然也很费，但是至少Alpha Blend虽然不写深度，但是深度测试是可以提前进行的，因为不会在fragment阶段再决定是否可见，因为都是可见的，只是透明度比较低罢了。不过这样只是权宜之计，Alpha Blend并不能完全代替Alpha Test。

关于Alpha Test对于Power VR架构的GPU性能的影响，简单引用一下官方的链接以及一篇讨论帖：

在这里插入图片描述

类人_猿

发布了62 篇原创文章 · 获赞 5 · 访问量 3888

私信关注