# Shader优化

# 前言

为了做出更加炫酷的效果,我们往往会自定义材质,然后定义自己的Shader,或者直接重写替换原版Shader,特别是目前的很多光影MOD,基本都需要对Shader进行修改。Shader与GPU性能密切相关,Shader写得好能让配置不是很高的玩家也能流畅体验炫酷的效果。写得不好,则可能导致高端机也很卡。

# 尽量少用 if else 条件语句

GPU是并行处理逻辑的,采用SIMD(单指令多数据)结构, 同一段代码,同一时刻会被多个GPU的处理单元同时处理,这段代码的执行耗时取决于会被执行到的时间最长的代码。为了充分发挥GPU的并行性,我们尽量少用条件分支逻辑,让所有GPU处理单元都执行相同的代码。

if else的写法如果底下逻辑不多,大部分可以合并,则常常可以改用step()函数进行优化

step(a,b)的功能为:

若b >= a则返回1,否则返回0

所以如果有这么一个写法:

if(r >= 0.5)
{
    r = 0.6;
}else{
    r = 0.4;
}

则应该写成:

r = 0.4 + step(0.5, r) * (0.6 - 0.4);

逻辑上相当于若r >= 0.5 ,则:

r = 0.4 + 1 * 0.2 = 0.6;

否则r < 0.5,则:

r = 0.4 + 0 * 0.2 = 0.4;

由此即可消去if else语句。

  • 错误写法: (if else大量使用)
    // 简单的卡通着色例子,把连续的颜色值映射到几个特殊的离散的值上面
    //根据传入的颜色值取得一个新的颜色值, 这里为了展示简单,我们用仅用一个通道进行举例
    void main()
    {
        color.r = getNewRedColor(color.r);
        ...(省略无关代码)
    }
    float getNewRedColor(float r)
    {
        float newR;
        if(r >= 0.6)
        {
            newR = 0.8;
        }else if(r >= 0.3)
        {
            newR = 0.5;
        }else{
            newR = 0.1;
        }
        return newR;
    }
  • 正确写法: (分开每帧只处理5个)
    // 简单的卡通着色例子,把连续的颜色值映射到几个特殊的离散的值上面
    //根据传入的颜色值取得一个新的颜色值, 这里为了展示简单,我们用仅用一个通道进行举例
    void main()
    {
        color.r = getNewRedColor(color.r);
        ...(省略无关代码)
    }
    float getNewRedColor(float r)
    {
        float newR = 0.0;
        newR = newR + step(0.6, r) * 0.8;
        newR = newR + step(0.3, r) * step(r, 0.6) * 0.5;
        newR = newR + step(r, 0.3) * 0.1;
        return newR;
    }

# 循环语句

for, while这类的循环语句内部实现其实也会有条件判断if else语句,并行性比较低,所以如果可以不用尽量不用,但这并不是让大家去复制粘贴多少次代码,这没有意义,则是尽量从逻辑上避免循环逻辑的出现,如果实在需要使用,则建议循环体内不要做太多耗性能的操作。 除此之外,循环变量一定要记得初始化!变量的初始值在不同设备上有时候是不一样的, 比如int的初始值并不一定在所有设备上都是0。

  • 错误写法: (循环变量i没有初始化)
    for(int i; i < 5; i ++)
    {
        func();
    }

在一些设备上i的值会被初始化为0,循环5次没有问题。但在一些设备上,i的默认值可能是一个没有意义的数,甚至是负数!例如是−2147483648,上面循环则会循环超级多次,玩家会直接卡到动不了。

  • 正确写法: (分开每帧只处理5个)
    //这里i一定要给一个默认值
    for(int i = 0; i < 5; i ++)
    {
        func();
    }

# 精美贴图开关

开关在游戏中的位置:设置->视频->精美贴图 开发者可根据玩家是否开启精美贴图执行不一样的shader逻辑。这里需要声明两个文件,materials/sad.json 和 materials/fancy.json。我们先看下原版中两个文件的内容:

    sad.json:
    [
        {"path":"materials/sad.material"},
        {"path":"materials/entity.material"},
        {"path":"materials/terrain.material"},
        {"path":"materials/portal.material"},
        {"path":"materials/barrier.material"},
        {"path":"materials/wireframe.material"}
    ]

    fancy.json:
    [
        {"path":"materials/fancy.material", "+defines":["FANCY"]},
        {"path":"materials/entity.material", "+defines":["FANCY"]},
        {"path":"materials/terrain.material", "+defines":["FANCY"]},
        {"path":"materials/hologram.material"},
        {"path":"materials/portal.material", "+defines":["FANCY"]},
        {"path":"materials/barrier.material"},
        {"path":"materials/wireframe.material"}
    ]

开启精美贴图的时候会加载下面的材质,不开启的话加载上面的材质。我们用一个材质进行举例,比如sad和fancy中都有的terrain.material材质,fancy中不同在于额外定义了FANCY字段,则在Shader中可以这样写:

    void main()
    {
#ifdef FANCY
    //这里可以做更多的逻辑,渲染更好的效果
    renderBeautiful();
#else
    // 这里是关闭了精美贴图,这里不应该执行过多逻辑,只需要提供简单的显示效果就可以了
    renderSimple();
#endif
    }

# 降低精度

通常来说,我们写的shader不需要过于关注精度,因为大部分情况下性能瓶颈不在这里,但一些过于复杂,大部分玩家都说卡的MOD,建议可以考虑在精度方面做一些优化。

shader中变量精度越低,GPU运算越快,精度分为3档,关键字分别为:

低:lowp
中:mediump
高:highp

int(整数):建议256内的整数使用lowp, 1024内的整数使用mediump,其它情况则使用highp float(浮点):建议256内的浮点数使用lowp, 16384内的浮点数使用mediump,其它情况则使用highp

默认精度:

顶点着色器中float, int均为highp
像素着色器中intmediumpfloat根据设备不同无默认精度

声明方法例子(直接把精度关键字加在变量类型前面):

lowp float color

# 移除无用变量与逻辑

部分开发者编写Shader的时候可能会偷下懒,从自己以前写的代码里面复制粘贴过来,但这部分代码可能有很多逻辑或者变量都没有用上,导致大量的运算是无意义浪费性能的,需要去掉。

  • 错误写法: (包含大量无用逻辑)
    void main()
    {
        //这里声明多个变量,又或许是从其它地方复制过来,具体值先省略
        A = ...;
        B = ...;
        C = ...;

        //这里只用了变量A;B和C都没有用到
        DoSomeThingWithA(A);
        return;
    }
  • 正确写法: (删除无用逻辑)
    void main()
    {
        //只留下A,把其它没用上的都删除掉
        A = ...;        

        //这里只用了变量A;B和C都没有用到
        DoSomeThingWithA(A);
        return;
    }

# 分级做多个MOD版本

开发者可根据Shader复杂度上架不同版本,举个例子,例如可以有“网易光影低配版”, “网易光影高配版”,玩家看名字就大概知道对性能有不同的要求了,让玩家下载时自行选择。