Unity URP高质量渲染开发实践¶
随着移动端芯片(如高通骁龙 Elite)性能的飞跃,移动平台对光线追踪等高端渲染技术的支持已成为可能。然而,作为Unity移动端开发首选的URP(Universal Render Pipeline),其原生Feature在应对高质量角色渲染需求时显得捉襟见肘。
为了在移动端实现高品质的角色渲染,笔者历时一年开发了IllusionRP。插件除了提升角色渲染质量,还吸收了大量来自HDRP和开源社区的渲染功能。
IllusionRP完全基于URP的RendererFeature开发,无缝衔接现有URP项目,目前适用于Unity 2022.3.62 和 URP14.0.12,理论上也支持基于22版本的团结引擎(没测试过),仓库链接放在了文章末尾,欢迎在GitHub收藏关注。
本篇文章就开发IlluionRP的设计思路以及工程实现方面进行经验分享。
现有方案¶
作为Unity开发者,想要提升画面表现力,通常有以下几种路径:
-
直接用HDRP。Feature很多,但由于大部分使用ComputeShader,只适用于主机和高端PC。在国内因为没法做手游,市面上几乎没多少使用HDRP的商业项目。但现在移动端性能逐渐变强的情况下,也存在有优化能力的团队将HDRP适配到移动端,例如搜狐畅游引擎部的图形引擎实战:HDRP移动版高清渲染管线改造。
-
URP加插件。URP可以直接通过RendererFeature注入ScriptableRenderPass方便拓展功能,AssetStore和Github都能找到非常多的插件。
-
自己写SRP,例如蛋白胨大佬的DanbaidongRP,前提是有比较强的图形学知识和工程能力。
第一种我觉得对于普通开发者来说不太可能,等搞完都出Unity7了(Unity之前说会在Unity7整合URP和HDRP,但在发此文的时候Unity把合并计划挪到了6.3,现在可以坐等了)。
第二种我认为有好有坏,将渲染功能拆分成RenderFeature让社区开发者可以协作是一件好事,但也会导致冗余浪费和隐藏成本的提高。
譬如A插件实现了一个SSR,在Forward渲染路径下增加一个ThinGBufferPass,而B插件实现了一个SSGI,也在Forward渲染路径下增加了类似的Pass,那么很自然会看到这里要渲染两次实则功能一样的ThinGBuffer。
再譬如对于需要修改Shader的效果,插件一般都会单独提供一个Shader,而要使用多个插件的效果就需要开发者手动整合。
因此在接入各类插件后,整体优化和整合的问题还是落在了开发者头上,改完了还不方便更新。
第三种对我这样的民科菜鸟来说属实太难了... 客观来讲,自定义的SRP难以随引擎升级以适配新功能(例如Unity6的GPU Driven),维护成本比较高。
最终选型¶
由于笔者认为自己的工程能力尚可,不想直接摆烂,结合自己对SRP的理解攒出了第四个方案——在URP基础上再搭一层管线,将HDRP迁移过来的渲染功能合并在一个RendererFeature中以便管线调度RendererPass。
因为没有重写渲染管线,基本都是加法,这让笔者能在一边迁移功能的同时学习相关概念和算法~
然后渲染路径的选择上,使用Deferred的话需要修改LightLoop源码比较麻烦,最后选择只兼容Forward和Forward+渲染路径,添加Shader和Pass比较灵活。
主要拓展¶
大概可以分为Shading-着色器、Rendering-渲染管线以及Workflow-工作流三大部分。
Shading¶
着色器的拓展主要依赖于添加新的Shading Model,URP只有一个Lit,对于复杂的材质是完全不够的。
IllusionRP添加了以下Shading Model:
- Skin 皮肤
- Hair 头发
- Fabric 布料
Rendering¶
光添加ShadingModel对于提高渲染质量是不够的,例如URP的SSAO对于角色渲染就是非常糟糕,至少也得调整为HBAO才能看。
IllusionRP集成了以下渲染功能:
-
Per Object Shadow 逐物体阴影
-
Percentage Closer Soft Shadows (PCSS) 高质量的软阴影
-
Contact Shadow 接触阴影
-
Ground Truth Ambient Occlusion (GTAO)高质量的屏幕空间环境光遮蔽
-
Screen Space Reflection (SSR)屏幕空间反射
-
Screen Space Subsurface Scattering (5S)屏幕空间次表面散射
-
Screen Space Global Illumination (SSGI)屏幕空间全局光照
-
Precomputed Radiance Transfer Global Illumination (PRTGI)预计算辐照度全局光照
-
Reflection Normalization 反射标准化
-
Order Independent transparency (OIT)顺序无关半透明
-
Volumetric Fog 体积雾
-
Convolution Bloom 卷积泛光(替换原生Bloom)
-
Auto Exposure 自适应曝光
-
仿原神的Gran-Turismo Tonemapping(替换原生Tonemapping-Neural)
-
Unreal的Filmic ACES Tonemapping(替换原生Tonemapping-ACES)
其中PerObjectShadow、GTAO和5S对于提升角色渲染质量影响最大,如果读者也想要提高角色渲染质量,可以尝试只添加这3个功能。
给这些功能细分一下的话:
1~3是阴影渲染提升
4~7是屏幕空间光照提升
7~9是全局光照提升
10是半透明渲染提升
11~15是后处理提升
我会在后面的实现部分会再介绍其中的实现细节。
Workflow¶
工作流这部分可以分为着色器开发流程、效果管理流程、渲染调试流程与构建流程。
- 着色器开发:提供 ASE (Amplify Shader Editor) 模板,分离设计层与模型层。
- 效果管理:通过 RendererFeature 全局开关与 VolumeComponent 进行分级控制。
- 渲染调试:集成CVar。
- 构建:定制 Shader Stripper,剔除无用变体。
着色器实现细节¶
IllusionRP在着色器实现上的过程与细节。
皮肤材质¶
皮肤核心是次表面散射,笔者起初尝试了Matt大神提供的球面高斯次表面散射(SGSSS),用公式拟合替代了过去移动端经常使用的预计算次表面散射技术中的LUT,在Forward渲染路径下为着色器节省了宝贵的一个Sampler。但因为没有屏幕空间的模糊,效果我感觉还是不够好,一种方式是再使用一个模糊过的法线,但这样就又把省下的Sampler还了回去。
之后还是完全使用(照抄)了屏幕空间次表面散射(5S),并且还原了HDRP的多Profile方式以支持多种次表面散射材质。
剩下的就是皮肤比较特殊的双镜叶高光来模拟皮肤的油脂层。
头发材质¶
Kajiyakay模型目前都是使用双层高光的变体版本,可以参考HDRP接入。
Marschner模型则直接使用了UE5中的版本。
额外参考神秘海域4中分享的Volumetric-based方式,增加了一个背面体积散射,搭配体积光有不错的视觉效果。
剩下就是为了让头发边缘没有锯齿or噪点,使用顺序无关的透明渲染方式,详细可见如何在Unity URP中让头发渲染更丝滑。
布料材质¶
布料主要就两部分:
Anisotropy Specular各项异性高光
Ashikhmin和Charlie两种Sheen Scattering模型。
需要注意在URP下因为设计原因,Lambert漫反射都没有除PI,为了保证能量守恒,对于自定义的Shading Model,需要使用NoPI版本即未除PI的版本。
然后因为前面适配了多Profile的次表面散射,理论上可以根据需要可以加入布料的次表面散射。
阴影质量提升细节¶
由于CSM的阴影精度并不高,对于需要高精度阴影的角色,除了增加CSM等级的方式,更普遍的做法是使用逐物体阴影PerObjectShadow。
这里使用了Stalo大佬星穹铁道复刻项目stalomeow/StarRailNPRShader中的PerObjectShadow实现。
其次参考HDRP和recaeee大佬的渲染项目recaeee/RecaNoMaho_P,为主光源阴影和逐物体阴影适配了PCSS软阴影,越远越模糊的表现能提高阴影的质感,从实践上看在开启了PenumbraMask标记半影区域以及使用ScreenSpaceShadow后,PCSS的开销比较可控,移动端可以选择开启。
另一方面,URP由于使用Shadow Caster Vertex Based Bias会在特定角度有很多瑕疵(具体可参考zilch - 自适应Shadow Bias算法的分享,因此IllusionRP使用了Shadow Receiver Fragment Based Bias。
但这也有一定弊端,即IllusionRP的Shader无法和其他URP Shader一起使用,例如要添加AssetStore的Shader,就需要逐个手动适配。
屏幕空间光照实现细节¶
屏幕空间光照接入了SSAO(使用了GTAO算法)、SSGI、SSR。
SSR在我之前的文章UPR Screen Space Reflection实践中提过,和HDRP不同的是IllusionRP额外包含了几个更轻量的不使用Hiz的方法。
对于前向渲染管线中实现屏幕空间光照的工程实践中,我认为有以下几个重点:
GBuffer获取¶
因为IllusionRP没有侵入式修改URP,所以是单独增加了一个ForwardGBufferPass来收集GBuffer数据,更好的方式是放在DepthNormalPass中MRT一起收集。
历史帧管理¶
SSR和SSGI都有时域混合降噪的需求,因此管线需要支持历史帧管理。
SRP提供了BufferedRTHandleSystem专门用于管理历史帧RT资源的Swarp。
需要注意的是BufferedRTHandleSystem只会在RT尺寸超过缓冲区大小时重新创建RenderTexture,而如果是RT尺寸变小,则直接通过修改全局的HistoryRTHandleSize来调整采样和写入时的UV,减少运行时DynamicResolution伸缩RTSize带来的Allocation。
URP下因为不开启DynamicResolution可以关掉这个功能,防止手机屏幕转动导致RTSize不匹配。
AsyncCompute优化¶
屏幕空间光照的计算量比较大,因此可以使用AsyncCompute来提高效率。
根据英伟达Advanced API Performance: Async Compute and Overlap的建议,我们可以在Compute Queue中计算SSR、GTAO,在Graphics Queue中做一些计算较轻的任务,例如阴影图的渲染。
所以我们可以在启用AsyncCompute时修改一下URP中MainLightShadowCasterPass和AdditionalLightsShadowCasterPass的renderPassEvent。注意这里在实践中发现URP14.0.12因为会在场景中没有相应光源阴影时Clear了错误的RenderTarget,会导致Pre-Z深度被清掉,所以要视情况调整顺序。
半分辨率优化¶
屏幕空间光照如果启用全分辨率,可以在Shader中直接LoadTexture减少一个Sampler,但带宽会吃的比较紧。如果使用半分辨率,就需要在ForwardPass中额外使用一个Sampler,这对于前向渲染来说比较够呛(启用SSR+SSGI+SSAO三个效果的话则可能需要3个Sampler)。
因此HDRP对ScreenSpaceLighting功能普遍使用Compute In Half Resolution + Upsampling to RTSize的做法,Lighting就可以直接LoadTexture,这比URP原生SSAO只做半分辨率更为合理。
全局光照方案细节¶
在Unity2022中,URP还未支持APV,只有LightMap+LightProbes一套原始人方案。前者纯静态、需要UV2,后者面向动态物体,但由于URP没有LightProbeProxy构建3d纹理,只能逐物体对附近的LightProbe做插值,这使得角色模型等复杂模型的间接光光照效果很差(与环境不一致)。
所以IllusionRP亟需接入一套更方便的全局光照方案。
接入SSGI是比较轻松的,但SSGI由于无法获取屏幕外的信息,我们还需要有一套Fallback的方案,因此IllusionRP采取了PRTGI+SSGI的全局光照组合。
预计算辐照度全局光照¶
预计算辐照度全局光照(PRTGI)的实践在我之前的文章Unity预计算辐照度全局光照PRTGI实践与拓展(上)和Unity预计算辐照度全局光照PRTGI实践与拓展(下)已介绍过,其缺点就是很容易丢失高频的漫反射信息,所以对于室内细节表现不佳。
编辑器工具上,我提供了和APV一样的Adjustment Volume来调整Probe位置。
屏幕空间全局光照¶
迁移HDRP中的SSGI方案后,将fallback到APV的部分改成采样PRT的IrradianceVolume即可。
参考了HDRP和jiaozi158/UnitySSGIURP中的做法,对未命中的像素fallback到AmbientProbe和ReflectionProbes上。
HDRP中的AmbientProbe来自物理天空盒,URP中我们暂未实现类似功能,因此直接使用RenderSettings中的ambientProbe(即LightSettings中设置的环境颜色)。
后处理提升细节¶
这块因为笔者用的模型不是那么写实(日式写实),使用ACES时感觉效果不好,就找了两个方案:
Filmic ACES Tonemapping:参照UE将ACES参数暴露出来, 根据场景调整。
Gran-Turismo Tonemapping:使用更简单的曲线在不降低饱和度的情况下拉低过曝区域。
到应用方面,URP实际也给我们开了口子, 我们可以创建一个新的PostProcessData,在里面替换后处理Shader,然后在原有Shader基础上增加关键词控制Tonemapping算法即可。
从接入结果上看,对于我这里的角色,个人认为GT效果要更好些。
工作流细节¶
着色器开发流程¶
IllusionRP将Shader开发分为了设计层和模型层,插件为每个新增的Shading Model都提供了Amplify Shader Editor的Template,设计师可以像在HDRP或UE中一样直接选择Shading Model练练看创建Shader, 并且使用了HDRP的Surface Input提供了几个示例(HD Skin、HD Hair、HD Fabric等)。
IllusionRP使用ASE作为设计层工具的一大原因是ASE的模板开发比较方便,可以通过注释来创建静态编译选项,例如Hair Template就可以直接在ASE编辑器中切换KajiyaKay和Marschner模型。
效果管理流程¶
IllusionRP将为每个效果在RendererFeature上提供了全局开关,方便在不同平台下切换可使用的效果,以及之后方便剔除Shader变体。其次提供了VolumeComponent方便配置效果参数以及Gameplay侧的效果开关。
渲染调试流程¶
RendererDebugger是Unity原生的运行时调试工具,但可惜不支持非侵入式的拓展,所以我基于之前写的开发框架AkiKurisu - Chris走了自己的一套调试方式。
Chris提供了类似Unreal的CVar功能,我们可以在控制台中输入变量来调整运行时启用的渲染效果以及一些Debug效果。
构建流程¶
对于渲染管线,构建部分要考虑的实际就是Shader变体控制,IllusionRP完全参考URP的Shader变体管理,使用Shader Prefiltering和Variant Stripper两个工具来分别进行剔除。
Shader Prefiltering是Unity提供的粗筛漏斗,但这里存在设计问题导致有一些坑点。
例如[RemoveIf]和[SelectIf]这几个Attribute只能作用在Const或序列化字段中,静态字段是不生效的。其次因为URP会在自己的Prefiltering中剔除掉例如ScreenSpaceShadow和ScreenSpaceOcclusion,我们需要标记overridePriority为true来覆盖URP的设置。
Variant Stripper是更加精细化针对特定变体的剔除工具。IllusionRP直接参考URP,对于每一个Shader变体判断关键词组合是否有效,例如开启SURFACE_TYPE_TRANSPARENT后,因为没有写入深度,就不应该使用屏幕空间的效果例如SSAO、SSR、SSAO,我们就可以在Variant Stripper中剔除掉这些变体。
参考资料¶
Matt - Approximating Subsurface Scattering With Spherical Gaussians
傻头傻脑亚古兽 - Unity实现SSS皮肤次表面散射 - 知乎
jplee - Extra technique for Skin shader by URP
jplee - UE4 ACES Tone mapping port URP
Naughty Dog - The Process of Creating Volumetric-based Materials in Uncharted 4
NVIDIA - Weighted Blended Order-Independent Transparency
Casual Effects - Weighted, Blended Order-Independent Transparency
ZZNEWCLEAR13 - 在URP的片元着色器中应用阴影偏移
其他参考项目可以在项目文档中查看。
仓库链接¶
欢迎Star、Fork和Contribute~













