写在前面

直接光昨天已经实现了：【Unity Shader】Build-in管线实现PBR：直接光部分，今天趁热打铁，补完剩下的间接光计算。

1 补一个法线纹理

突然法线直接光部分忽略了法线纹理应用的部分，这当然也是不可或缺的部分，之前学习入门精要的时候，就已经分别在法线空间和世界空间下实现了：

【Unity Shader】纹理实践3.0：切线空间下使用法线纹理

【Unity Shader】纹理实践5.0：世界空间下使用法线纹理

这里要使用Cubemap的话，就必须要用世界空间下的方法了，补充一下就好！

（顺便说明一点，暂时先不考虑必要时候使用half变量来优化整个shader，所以暂时所有变量都用的float，等所有工作都做完后再针对性的优化~）

1.1 UnpackNormalWithScale

我们既然引用了Unity的文件，那就最大可能的不自己算！实现什么的先找找有无对应的封装函数，简化计算！但是在用的过程中需要注意，

不同版本之间：Unity每个版本之间可能存在函数没更新、函数冲突等情况
不同管线之间：我这里是在Build-in固定管线下实现的PBR Shader，其他管线下（例如URP）函数一定会有冲突，需要进行很多的修改

好的，回到这个函数，这个函数会自动对法线贴图使用正确的解码，并缩放法线，意味着它同时具备Unpack和Scale缩放两个功能，之前的老办法是：

        float3 normal = UnpackNormal(tex2D(_NormalMap, i.uv)); // 纹理采样+解码，得到法线方向
        normal.xy *= _NormalScale; // 缩放
        normal.z = sqrt(1.0 - saturate(dot(normal.xy, normal.xy)));

现在只需要一个函数就解决了：

float3 normal = UnpackNormalWithScale(tex2D(_NormalMap, i.uv), _NormalScale);

函数源码：

fixed3 UnpackNormalWithScale(fixed4 packednormal, float scale)
{
#ifndef UNITY_NO_DXT5nm
    // Unpack normal as DXT5nm (1, y, 1, x) or BC5 (x, y, 0, 1)
    // Note neutral texture like "bump" is (0, 0, 1, 1) to work with both plain RGB normal and DXT5nm/BC5
    packednormal.x *= packednormal.w;
#endif
    fixed3 normal;
    normal.xy = (packednormal.xy * 2 - 1) * scale;
    normal.z = sqrt(1 - saturate(dot(normal.xy, normal.xy)));
    return normal;
}

另外关于法线应用部分其他的点，我几乎在之前的两篇文章中都有涉及了，所以这里其他的函数、方法之类的就不再赘述。

1.2 部分代码展示

首先是vertex shader的输入输出结构体，主要是输出部分吧，有需要传给fragment shader的东西：

        float2 uv : TEXCOORD0;
        float4 pos : SV_POSITION;
        // float4 worldPos : TEXCOORD1; // 存入变换矩阵中，节省空间
        // float3 worldNormal : TEXCOORD2; // 跟着下面的变换矩阵一起传入，节省空间
        float4 TtoW0 : TEXCOORD1;  
        float4 TtoW1 : TEXCOORD2;
        float4 TtoW2 : TEXCOORD3; // xyz存入变换矩阵，w储存世界坐标

然后是vert shader部分，相对来说比较简单，就是加入计算变换矩阵的步骤：

        o.TtoW0 = float4(worldTangent.x, worldBinormal.x, worldNormal.x, worldPos.x);
        o.TtoW1 = float4(worldTangent.y, worldBinormal.y, worldNormal.y, worldPos.y);
        o.TtoW2 = float4(worldTangent.z, worldBinormal.z, worldNormal.z, worldPos.z);

接着是fragment shader中：

        // 计算世界空间法线
        float3 normal = UnpackNormalWithScale(tex2D(_NormalMap, i.uv), _NormalScale); // 采样+解码+缩放 
        // 原始方法
        //float3 normal = UnpackNormal(tex2D(_NormalMap, i.uv)); // 纹理采样+解码，得到法线方向
        // normal.xy *= _NormalScale; // 缩放
        // normal.z = sqrt(1.0 - saturate(dot(normal.xy, normal.xy)));
        float3 worldNormal = normalize(float3(dot(i.TtoW0.xyz, normal), dot(i.TtoW1.xyz, normal), dot(i.TtoW2.xyz, normal)));

1.3 测测效果

这样整个NormalMap部分就完成了！给个法线贴图试试：

芜湖，一切正常！那我们继续！

2 捋一捋Unity中间接光来源

回顾一下：【技术美术图形部分】PBR全局光照：理论知识补充

Unity中间接光照有3个来源：Light Probe、LightMap和实时GI，划分的话，这里放上一张简洁明了的图：

所以说我们写的Shader是否也要根据光照去分一分呢？伴随着这种想法，我在一众实现间接光只做简单的SH计算的文章中发现了它：【学习笔记】Unity PBR的实现，刚好跟我的想法拟合！那么就重点参考他，继续我们的实现之旅。

2.1 Unity的VertexGIForward

UnityStandardCore.cginc文件中，这个函数做工作大概就是上面那个图里面描述的，把光照方式分门别类，执行各自的计算工作，源码如下：

inline half4 VertexGIForward(VertexInput v, float3 posWorld, half3 normalWorld)
{
    half4 ambientOrLightmapUV = 0;
    // Static lightmaps
    #ifdef LIGHTMAP_ON
        ambientOrLightmapUV.xy = v.uv1.xy * unity_LightmapST.xy + unity_LightmapST.zw;
        ambientOrLightmapUV.zw = 0;
    // Sample light probe for Dynamic objects only (no static or dynamic lightmaps)
    #elif UNITY_SHOULD_SAMPLE_SH
        #ifdef VERTEXLIGHT_ON
            // Approximated illumination from non-important point lights
            ambientOrLightmapUV.rgb = Shade4PointLights (
                unity_4LightPosX0, unity_4LightPosY0, unity_4LightPosZ0,
                unity_LightColor[0].rgb, unity_LightColor[1].rgb, unity_LightColor[2].rgb, unity_LightColor[3].rgb,
                unity_4LightAtten0, posWorld, normalWorld);
        #endif

        ambientOrLightmapUV.rgb = ShadeSHPerVertex (normalWorld, ambientOrLightmapUV.rgb);
    #endif

    #ifdef DYNAMICLIGHTMAP_ON
        ambientOrLightmapUV.zw = v.uv2.xy * unity_DynamicLightmapST.xy + unity_DynamicLightmapST.zw;
    #endif

    return ambientOrLightmapUV;
}

其中：

VERTEXLIGHT_ON

这个关键字是需要Pass去自己定义的吧，有些情况下需要用顶点光照用以节省性能。

详细的话可以参考：翻译5 Unity Advanced Lighting - 带着红领巾 - 博客园 (cnblogs.com)

unity_lightmap

从烘焙好的lightmap贴图中获取光照颜色

UNITY_SHOULD_SAMPLE_SH

从light probe中读取光照颜色，有点类似于

ShadeSH9

这个其实不是上面源码中的，其实我也不是很明白ShadeSHPerVertex和ShadeSH9的区别，由于后面我实现这部分想用ShadeSH9，所以这里标出的是ShadeSH9，关于它的源码在后面会有所体现。

2.2 我的实现

// 间接光
inline half4 VertexGIForward(float2 uv1, float2 uv2, float3 posWorld, float3 normalWorld)
{
    half4 ambientOrLightmapUV = 0;
    
    // 静态物体
    
    //勾选了Static
    // 开启Lightmap，计算lightmap坐标
    #ifdef LIGHTMAP_ON
        ambientOrLightmapUV.xy = uv1.xy * unity_LightmapST.xy + unity_LightmapST.zw;
        ambientOrLightmapUV.zw = 0;
    
    // 动态物体
    // 采样light probe
    #elif UNITY_SHOULD_SAMPLE_SH

    // 计算非重要光源
        #ifdef VERTEXLIGHT_ON
            // 选择不使用探针，计算4个顶点光照
            ambientOrLightmapUV.rgb = Shade4PointLights (
                unity_4LightPosX0, unity_4LightPosY0, unity_4LightPosZ0,
                unity_LightColor[0].rgb, unity_LightColor[1].rgb, unity_LightColor[2].rgb, unity_LightColor[3].rgb,
                unity_4LightAtten0, posWorld, normalWorld);
        #endif
        // 选择使用探针，计算球谐光照
        ambientOrLightmapUV.rgb = ShadeSH9 (normalWorld);
    #endif

    // 开启动态lightmap
    // 计算动态lightmap坐标
    #ifdef DYNAMICLIGHTMAP_ON
        ambientOrLightmapUV.zw = v.uv2.xy * unity_DynamicLightmapST.xy + unity_DynamicLightmapST.zw;
    #endif

    return ambientOrLightmapUV;
}

3 LightPrbe+SH

捋清楚了Unity间接光照分类，下面开始大概解释一下Light Probe和球谐函数把！

3.1 探针照明 Probe Lighting

光照探针Light Probe

一切还要从睡前有一天看到了这个教程说起：Light Probes 基本理论介绍

对于场景中的静态物体，我们可以预先烘焙好Lightmap.而对于动态物体，Unity采用的是往场景中放很多Light Probe（光照探针）来实现。

想象场景中有很多小球，每个小球保存小球在的这一点的环境光信息，这些信息可以是，

一张Cubemap

但是场景中可能会有很多小球欸！就像下图：

每个小球来一张Cubemap？

这有点类似于给场景中的静物每个都给个Cubemap的操作，反正都是一个缺点——开销太大。

或许可以降低Cubemap精度？

emmm，我们先一步一步来想吧，要么就尽可能把Cubemap缩小，例如256x256缩放成4x4（仅假设），原本需要给100个小球每个分配一张256x256，现在变成了100张4x4，确实节省了很多，但采样效果一定大打折扣！

球谐函数

不行了，继续在Cubemap上绕来绕去似乎必定行不通，需要请出我们的球谐函数——球谐光照。

还记得我们讨论过Cubemap和球谐函数的关联吗？球谐函数是搬出来的救兵，给Cubemap的缺点打补丁的，这里也差不多，过程大概就是：

先给光照信息编码 -> 编码后的信息存入一个大小为27的float数组中 -> 游戏运行起来时，重构光照信息（这个具体过程可以看看后面会体现的Unity中实现过程）

求解间接光漫反射只需要3阶球谐基函数就能模拟个大概，例如下图就是仅仅通过前几项基函数，对某一张Cubemap的重建效果：

噢！我们再分析分析为什么3阶（9个函数）就足够模拟间接光漫反射了？——这与低频信息和高频信息有关。间接光漫反射属于低频环境光照，意味着少量的基函数就能高度拟合，意味着图不用非常清晰！模模糊糊就够用了！

有什么不足？

LightProbe会使得动态物体本身不会有反射光：但通常用probe的都是较小的物体，反射的光很微弱，对周围环境的影响也很小
LightProbe难以表达出复杂的照明效果：这一点你要么模拟精度高一点（取比3更高阶的基函数），但是这开销又大了，出于性能考虑本身引擎就会限制LightProbe的计算精度

总结总结，LightPrbe应用在小的、凸状物体效果会很好！

3.2 Unity的思路

球谐基函数

开始进入正题，Unity中间接光漫反射的实现本质上就是采样light probe的过程。Unity使用了3阶的伴随勒让德多项式作为基函数，也就是l=0，l=1，l=2：

Unity中定义的系数

9个函数的系数取值如下所示：

图源如何在Unity中造一个PBR Shader轮子 - 知乎 (zhihu.com)

我们只需要知道，这9个系数实际上是代表着球的每个面的光照就行了，如下图，

因为光照颜色是RGB，也就是3通道，每个分量都需要跟这9个系数做运算，运算数字就有27个，Unity把这27个变量存入了7个float4变量中，存在了UnityShaderVariables.cginc文件中，系数定义源码如下：

    // SH lighting environment
    half4 unity_SHAr;
    half4 unity_SHAg;
    half4 unity_SHAb;
    half4 unity_SHBr;
    half4 unity_SHBg;
    half4 unity_SHBb;
    half4 unity_SHC;

从LightProbe重构光照

参考：unity中的球谐光照_unity 球谐光照

最后一步了！要用的时候需要把光照信息取出来，这就是光照信息的重构环节。Unity把这个步骤封装到了ShaderSH9()中，传入法线信息，返回的就是环境光照信息。它的源码：

half3 ShadeSH9 (half4 normal)
{
    // Linear + constant polynomial terms
    half3 res = SHEvalLinearL0L1 (normal);

    // Quadratic polynomials
    res += SHEvalLinearL2 (normal);

#   ifdef UNITY_COLORSPACE_GAMMA
        res = LinearToGammaSpace (res);
#   endif

    return res;
}

它将SHEvalLinearL0L1和SHEvalLinearL2两个函数结果累加，并根据gamma空间的宏决定是否转换到gamma空间。

我们用的话，就用ShadeSH9()就好，传入世界空间下归一化后的法线，就能取出储存的漫反射光照信息。

3.3 实现漫反射

其实就是ShadeSH9函数了，上面的vertexGIForward()函数的属于UNITY_SHOULD_SAMPLE_SH且光源是重要光源的分支就做了计算了。

当然，我希望像参考文章那样，把漫反射和镜面反射都封装出来，而不是制作精要的计算，这样的话代码适用性不强。这样的话，我也为间接光漫反射计算单独建一个函数：

//间接光漫反射
// 参考自https://zhuanlan.zhihu.com/p/60972473
inline half3 ComputeIndirectDiffuse(float4 ambientOrLightmapUV,float occlusion){
    
	half3 indirectDiffuse = 0;

	//动态物体
	#if UNITY_SHOULD_SAMPLE_SH
		indirectDiffuse = ambientOrLightmapUV.rgb; // 顶点or探针SH	
	#endif

	//静态物体
	#ifdef LIGHTMAP_ON
		//对光照贴图进行采样和解码
		//UNITY_SAMPLE_TEX2D定义在HLSLSupport.cginc
		//DecodeLightmap定义在UnityCG.cginc
		indirectDiffuse = DecodeLightmap(UNITY_SAMPLE_TEX2D(unity_Lightmap,ambientOrLightmapUV.xy));
	#endif
	#ifdef DYNAMICLIGHTMAP_ON
		//对动态光照贴图进行采样和解码
		//DecodeRealtimeLightmap定义在UnityCG.cginc
		indirectDiffuse += DecodeRealtimeLightmap(UNITY_SAMPLE_TEX2D(unity_DynamicLightmap,ambientOrLightmapUV.zw));
	#endif

	//将间接光漫反射乘以环境光遮罩，返回
	return indirectDiffuse * occlusion;
}

还需要在vertex shader就传入环境光的UV：

o.ambientOrLightmapUV = VertexGIForward(v.texcoord1, v.texcoord2, worldPos, worldNormal); // 环境光orlightmap的UV坐标

前两个是输入struct定义的，

        struct appdata
        {
            float4 pos : POSITION;
            float2 uv : TEXCOORD0;
            float3 normal : NORMAL;
            float4 tangent : TANGENT;
            float2 texcoord1 : TEXCOORD1; // 储存动态环境光照的uv坐标
            float2 texcoord2 : TEXCOORD2; // 储存静态光照贴图的uv坐标

但说实话，感觉这里面texcoord1和2没起到作用。

事实上，这部分做了这么多，如果不考虑这么复杂，就是一句代码的事：

float3 ambient_contrib = ShadeSH9(half4(worldNormal, 1));

这样的话就是完全只能采用采样lightprobe存入SH并重构出环境光颜色的方法去计算间接光漫反射了。

3.4 效果展示

这里单独输出

float3 result = indirectDiffuse * kd;

金属度=1的两个球完全是黑色，这是因为我们的PBR默认金属没有漫反射，kd=0.

4 镜面反射：采样Cubemap

【学习笔记】Unity PBR的实现在镜面反射部分涉及到了很多探针的内容，我其实没太看明白。这里我还是采用大部分实现PBR的文章的方法吧。

还记得之前的分析文章中说的吗，间接光镜面反射分为两个部分，正常的计算方案是，

前项：根据粗糙度采样Cubemap
后项：预计算LUT

而Unity在计算后项时没有采样LUT贴图，而是选择了曲线拟合的思路。

本小节先介绍如何根据粗糙度采样，后面第5小节介绍Unity的拟合计算方法。

4.1 基于粗糙度计算Mip层

由于Unity的粗糙度和Mip层不是线性关系，如下图：

截图自 unity build-in管线中的PBR材质Shader分析研究_pbr shader_郭大钦的博客-CSDN博客

所以需要拟合一下求出近似的层mip_roughness，至于为什么取值，在这篇文章中作者有所体现，就不赘述了，放代码：

// Mip层
float CubeMapMip(_Roughness){
    //基于粗糙度计算CubeMap的mip层
    float mip_roughness = _Roughness * (1.7 - 0.7 * _Roughness);
    float mip = mip_roughness * UNITY_SPECCUBE_LOD_STEPS;
    return mip;
}

UNITY_SPECCUBE_LOD_STEPS

是个常数值，默认为6，意思是整个粗糙度划分为0-6，7个阶层

4.2 采样贴图LOD

下一步需要对天空盒立方体贴图进行采样，再次封装一个方法：

// 反射探针获取颜色值
inline float3 IndirectSpecularCube(float _Roughness, float3 viewDir, float3 worldNormal, float occlusion){
    float mip = CubeMapMip(_Roughness); // 按粗糙度取mip层
    float3 reflectVec = normalize(reflect(-viewDir, worldNormal)); // 计算采样方向
    float4 rgbm = UNITY_SAMPLE_TEXCUBE_LOD(unity_SpecCube0, reflectVec, mip); // 采样内部存的一个Cubemap的LOD
    float3 iblSpecular = DecodeHDR(rgbm, unity_SpecCube0_HDR); // 把颜色从HDR编码下解码
    return iblSpecular * occlusion;
}

先按粗糙度取mip层，然后计算了一个反射方向，最后采样，最后那个是解码HDR，因为HDR本身非常亮，要是不解码会让传出的结果不正确？这里我简单试了一下没发现有什么不同，可能是我尝试方式不对吧。。。先不管了，就写在这儿。

反射向量reflectVec

这里相当于基于世界法线对视线方向的负方向做了个镜面，用得到的这个反射向量作为采样Cubemap的方向向量。在Cubemap实现环境映射那篇文章里，已经提到过了：

unity_SpecCube0

UnityShaderVariables.cginc中定义的变量，它会把传入的Cubemap模糊模糊，储存成带LOD的图：

这个变量的类型取决于目标平台。

4.3 单独输出

我们可以单独输出这一项，看看是什么效果：

可以看出这是没有任何光照的反射效果，只是一个采样结果。粗糙度的不同，采样结果也不同。

5 镜面反射：曲线拟合LUT

没有选择传入LUT那个红红的图，Unity选择了用系数拟合。Unity计算这部分的源码：

surfaceReduction * gi.specular * FresnelLerp (specColor, grazingTerm, nv);

其中gi.specular这一项就是我们在第4节里计算的东西，于是！Unity曲线拟合具体应该就是体现在了surfaceReduction这个系数。

5.1 SurfaceReduction

Unity源码计算这一项：

ifdef UNITY_COLORSPACE_GAMMA
        // 1-0.28*x^3 as approximation for (1/(x^4+1))^(1/2.2) on the domain [0;1]
        surfaceReduction = 1.0-0.28*roughness*perceptualRoughness;      
#   else
        // fade \in [0.5;1]
        surfaceReduction = 1.0 / (roughness*roughness + 1.0);           
#   endif

照着写一个：

        float surfaceReduction = 1.0 / (roughness * roughness + 1.0); // linear空间下
        //float surfaceReduction = 1.0 - 0.28 * roughness * _Roughness; // Gamma

单独给他输出的话，

后面两个roughness=0，前面的roughness=1.

5.2 菲涅尔项的影响

我们可以拿直接光中计算菲涅尔项和间接光的做对比，下面是直接光考虑菲涅尔自定义的函数：

// Unity这里传入的是ldoth,而非vdoth
inline float3 Unity_Fresnel(float3 F0, float cosA){
    float a = pow((1 - cosA), 5);
    return (F0 + (1 - F0) * a);
}

这个是Unity源码中定义的FresnelLerp函数：

half3 FresnelLerp(half3 F0,half3 F90,half cosA){
half t=Pow5(1-cosA);
return lerp(F0,F90,t);
}

其中，

float3 F0 = lerp(unity_ColorSpaceDielectricSpec.rgb, albedo, metallic);

float grazingTerm = saturate(1 - _Roughness + (1 - kd));

直接光传入的是ldoth，间接光的是ndotv。后者的亮度变化效果完全符合菲涅尔效果的样子，

正对视角F0的地方为0
掠射角F90为1

这会带来什么最终效果？

我们先只把grazingTerm这一项输出：

噢！影响的是非金属，随着_Roughness的增大而变灰，这一项就是一个灰度值在调整非金属，其实是很符合菲涅尔效应的，越光滑，菲涅尔效应才越强。

再只把FresnelLerp这一项输出，看看效果：

总结一下，

金属：F0处是albedo值，随着视角向F90移动，边会变成亮度高的白色
非金属：F0处的影响是很大的，会衰减反射效果

5.3 结果

都算了一下，然后整个乘在一起：

        float surfaceReduction = 1.0 / (roughness * roughness + 1.0); // linear空间下
        //float surfaceReduction = 1.0 - 0.28 * roughness * _Roughness; // Gamma
        float grazingTerm = saturate(1 - _Roughness + (1 - kd));
        
        float3 indirectSpecular = surfaceReduction * indirectSpecularPro * FresnelLerp(F0, grazingTerm, ndotv) * occlusion;

场景中给了一个cubemap：