A comparative review of tone-mapping algorithms for high dynamic range video(高动态范围视频色调映射算法的比较研究)(—)
研读论文A comparative review of tone-mapping algorithms for high dynamic range video(高动态范围视频色调映射算法的比较研究)(—)
目录
0、摘要
色调映射是高动态范围(HDR)成像领域中的关键组成部分。 它的重要性体现在文献中可以找到的大量色调映射方法上,这是该地区二十多年积极发展的结果。 尽管这些可以满足显示HDR图像的大多数要求,但是随着HDR视频的出现,出现了新的挑战,这在色调映射运算符(TMO)的设计中需要更多的考虑。 如今,存在许多支持视频资料的TMO。 现在,由于标准显示设备的局限性,我们可以达到大多数摄像机捕获的HDR视频的高质量,而没有可见的伪影。
在本报告中,我们着手总结和分类到目前为止的色调映射研究,以提炼色调再现管道的最重要趋势和特征。 虽然这提供了对该区域的广泛概述,但是我们接下来专门关注HDR视频的色调映射以及这种媒体所带来的问题。 首先,我们制定视频TMO需要解决的主要挑战。 然后,我们提供每个现有视频TMO的描述和分类。 最后,通过构造一组定量度量,我们评估了许多运算符的性能,以提示可以预期的渲染最少数量的伪像。 这可以作为对HDR视频色调映射的最新技术的综合参考,分类和比较评估。
1、介绍
在过去的二十年中,高动态范围(HDR)成像技术得到了巨大的发展,如今已成为计算机图形和图像处理的广泛应用中的重要方面。 HDR视频采集也日趋成熟,可以使用通用的研究原型轻松捕获高质量的HDR视频序列。 鉴于最近的发展,HDR视频现在开始在许多应用中确立其地位,并且构成了未来研究的重要课题。
HDR成像管道中的重要组成部分是色调映射。 色调映射的目的是使最终HDR内容适合在动态范围和色域方面受限制的显示设备上查看。 尽管确实存在HDR显示系统,并且动态范围扩大的电视目前正在商业市场中确立地位,但它们在动态范围和色域方面存在局限性。 因此,为HDR显示器准备的材料将不可避免地需要某种形式的色调映射。 而且,绝对绝大部分显示器都将具有非常有限的动态范围。 因此,色调映射的领域将继续是一个重要的主题,随着HDR视频及其分发解决方案的可用性的迅速提高,色调映射的领域将更加重要。
色调映射方法开始出现在1990年代初期,并且随着文献中引入的大量色调映射(TMO)迅速发展。 从静态HDR图像过渡到视频序列后,必须在色调映射管道中进行特殊考虑。 除了最明显的挑战是保持时间上一致的色调映射外,时间维度的含义还包括由于捕获过程而引起的差异。 例如,HDR视频更可能包含噪声,运动模糊和肤色。
在此报告中,我们提供了对明确说明时域的TMO的审查。这是由HDR视频的色调映射所面临的挑战所激发的。这也是对HDR视频捕获的最新发展的回应。审查包括可用方法的描述和分类以及比较评估。比较基于一组重要的属性,包括时间一致性,噪声可见度,对比度和曝光。结果表明操作员能够产生曝光良好和高对比度的视频,而不会显示时间伪像和相机噪声。此外,为了提供我们审查的起点和背景,我们首先对色调映射进行了历史概述。这并不打算广泛涵盖图像色调映射的大量研究;相反,我们专注于色调映射管道的演变。概述之后是音调映射问题的一般表述,以便明确定义所涉及的计算。
文献中已经在一定程度上涵盖了色调映射的领域。 但是,早期总结最新技术的尝试已经过时了[DCWP02]。 此外,对TMO的最新描述并未明确地集中在视频色调映射问题上,没有包括许多最新的贡献,并且/或者没有提供与我们所做的相同的分类和评估[Hoe07,MMK08,RWP * 10,MR11,BADC11,DCMM16]。 因此,本报告在该领域提供了新颖的贡献。 它可以作为视频色调映射的最新技术的综合参考和比较,以促进该地区的未来发展。
为了总结报告的内容,该报告旨在提供以下内容:
1.简短的文献综述,提供了有关HDR和色调映射领域的历史概述(第3节)。
2.色调曲线的一般表述,以明确定义色调映射的概念并促进不同方法之间的联系(第4节)。
3.对视频色调映射的描述,以及在摄像机捕获的HDR视频上进行操作时需要特别解决的最重要问题(第5节)。
4.关于视频TMO分类的一般建议,使用5个不同的类别(第5.4节)。这是基于前面几节中解释的概念。
5.通过对所有TMO的文献综述,我们找到了一种关于如何处理时间方面的显式算法(第6节)。
6.根据上述分类(表1),列出了26个分类的视频色调映射。
7.对一组视频色调映射算法的定量评估,我们在其中制定措施,以根据许多重要属性对它们进行比较(第7节)。
2. 一般的背景
HDR图像的色调映射涉及将HDR信号转换为可以在标准显示设备上呈现的动态范围的减小。 因此,该转换通常涉及非线性和压缩功能。可以通过多种方式构造完整的色调映射管线,但图1描绘了最常见的设计之一。这将输入亮度转换为对数域,其中保留了边缘 应用了过滤器。 然后,将过滤后的图像用于提取图像细节,这些细节与由色调曲线执行的压缩变换保持独立。 因此,保留了局部细节,同时减小了整体动态范围。 最后,将色调映射的结果转换回线性域,从原始输入恢复颜色,并为特定的显示设备准备材料。
在本节中,我们简要介绍HDR和色调映射的基本原理,以及如何激发图1中的概念。 然后在第4节中提供了更详细的实际映射表述。我们还认识到,根据色调映射的特定意图,动机可能会有所不同。 此事实随后用于将TMO分为三个不同的组。
图1:用于执行空间变化的(局部)色调映射的非典型管线设置。作为场景的一组预处理操作将输入场景称为图像。 然后使用保留边缘的过滤器过滤处理后的输入,以创建基础层。 基础层用于提取细节层。 在使用色调曲线变换基本层的同时,细节层保持不变,并在映射后添加回去。 最终,准备好带有保留细节的色调映射图像,以便在后期处理步骤中显示。 在插图中,中间图像显示为蓝色圆圈,某些图像也显示在图的底部。
2.1.LDR和HDR图像之间的差异
高动态范围图像可以描述比低动态范围(LDR)图像更大的颜色和亮度范围。标准的LDR图像通常使用8位来存储每个像素像素的颜色,而HDR图像最常指定为浮点精度。该差异使得可以对人眼可见的颜色和亮度的整个范围进行编码。但是,差异不仅在于代表能力。 LDR图像几乎专门用于发送到显示设备。因此为此目的对其进行校准,并称其为显示参考。例如,伽马校正,l = T1 /γ,已经被应用于编码图像。在这里,T是强度,l是应该发送到显示器的最终亮度值。通常,伽玛在γ∈[1.8,2.8]范围内。虽然校正原本打算用于CRT显示器,但非线性与人类对亮度的感知很好地对应。因此,伽马校正可以看作是色调映射的一种非常简单的形式。此外,可以使用伽玛偏移增益模型对伽玛校正进行补充,以解决显示和观看环境的问题。
Ld描述了从显示表面测得的亮度。 Lmax和Lblack分别是显示峰值亮度和黑电平。 Lrefl是从显示器表面反射的环境光,它近似于环境照度Eamb和显示器的反射率。
与LDR图像相反,HDR通常是场景引用的。它描述了捕获的场景中照明的物理属性。 因此,HDR图像可以用于需要精确的物理测量的多个目的,例如。 为了在标准显示器上显示HDR图像,必须将其转换(或色调映射)为显示参考格式。色调映射用于在HDR显示器上准备用于显示参考的HDR图像,请根据显示器的某些特性进行缩放和调整。 此外,色调映射可以涉及不同的显示器参考格式之间的映射。这可以通过例如首先将图像转换为场景参考格式来实现,然后将色调映射到目标显示器。
严格来说,色调映射是图像色调从一个域到另一个域的映射。 但是,今天,该术语的最常用用法是描述从HDR信号中的线性场景参照亮度到显示设备的受限域的映射。 色调映射现在或多或少是此定义的同义词,在此形式中,我们在此使用术语。 通常,映射会转到应该显示的强度值T。 为了最终创建以显示为参考的LDR图像,在进行色调映射之后,进行裁剪和伽马校正以适应显示设备。 可替代地,等式1中的显示模型的逆可用于补偿显示和观看环境。
还应注意,色调映射不仅适用于捕获或渲染的自然图像。 它也可以用在抽象表示上,例如 在体积可视化中,其中HDR可以提供扩展的尺寸来传达信息。 尽管如此,在大多数情况下,体绘制仍直接以显示为参考的格式进行,并且通过调整传递函数,可以达到与最终HDR渲染的色调映射相似的目标。
2.2.HDR视频采集、显示和分发
自1990年代初以来,已经出现了用于生成HDR图像的技术。这些包括基于物理的渲染引擎,体绘制技术,以及从相机曝光包围中重建。尽管渲染引擎能够生成HDR视频序列,但从静态图像到摄像机捕获的HDR的视频过渡要困难得多。为了用标准摄像机记录HDR视频,可以使用时间复用,在帧之间的短曝光和长曝光之间交替。这就要求随着时间对视频进行插值,以便重建HDR帧,例如使用光学流或基于补丁的技术。另外,也可以使用多台摄像机的系统捕获HDR视频,以拍摄同一场景。但是,直到2010年代才出现用专用的多功能多传感器摄像机捕获的高质量HDR视频。这些已被证明具有高达20-24个光圈的动态范围。近期的发展还带来了诸如ArriAlexaXT和RedEpicDragon等专业的HDR相机系统,其动态范围扩展至14-16.5个f档。
对于HDR显示器,可以克服LCD面板的一些限制,例如通过激光显示器。但是,最常见的技术是使用双重调制,通过背光LCD面板提高亮度。 HDR图像被分解为调制强度的低分辨率背光图像和高分辨率补偿图像。实际上,8位图像用于背光和补偿,有效地将可获得的位深度加倍。 Brightside进一步开发了该技术,产生了诸如DR37-P之类的显示器,其峰值亮度约为4000 cd / m2。后来,它也用于杜比脉冲星监视器,峰值亮度为4000 cd / m2。此外,Sim2还发布了基于其HDR47系列技术的显示器,包括能够提供6000 cd / m2峰值亮度的最新HDR47ES6MB。与专业的HDR显示器相比,标准LCD监视器的峰值亮度通常在200-300 cd / m2附近,对于高保真度显示器可能超过500 cd / m2。但是,消费市场目前正在快速发展,2016年期间发布了许多支持HDR的电视。尽管这些显示器远未达到与专业设备相同的亮度,但它们能够增加动态范围和亮度,达到–对于某些电视机,超过–峰值亮度为1000 cd / m2。
尽管HDR显示器通常可以匹配重现场景的动态范围,但由于多种原因,它们并不能消除对色调映射的需求。 首先,HDR显示器仅在正确的观看条件下才能产生高对比度的图像,这是一个黑暗的房间,没有环境光。 如果存在环境光,则它们的有效对比度会大大降低,从而需要进行色调映射。其次,HDR显示器的性能会有很大差异,因此需要使内容适应显示器的特定功能。 se调映射非常适合此任务。
通过转换亮度并将其编码为10-12位,可以使用现有视频编解码器的功能来完成HDR视频的分发。此外,存在允许向后兼容的技术。响应于HDR TV的最新发展,一些组织在HDR视频编码所涉及技术的标准化方面也做出了许多努力。从高清晰度电视(HDTV)到超高清电视的过渡已经通过从ITU-R Rec。4转变为更宽的色域。 BT.709至BT.2020。对于HDR和宽动态范围的编码,使用感知量化器(PQ)传递函数(SMPTE ST-2084)和Hybrid Log-Gamma(HLG)对亮度的转换进行了标准化。现在,PQ和HLG都包含在最新的ITU-R建议BT.2100中。为了分发HDR视频,不同的计划产生了Dolby Vision [Dol16]和MPEG HDR-10 [KYH16]编解码器。此外,现在可以将HDR视频编解码器实现为开源API。
2.3.色调映射的知觉动机
色调映射是由人类视觉系统(HVS)的属性所激发的,该属性同时可以在场景中注册约3.7 log单位的动态范围。虽然HVS的单个神经单元被限制在大约1.5 log个单位的范围内响应,但这种能力是通过利用局部适应机制(例如空间变化的神经增益控制)来实现的。局部处理可以将适应限制在小于0.5视觉度的区域。此外,通过使用例如在瞳孔调节和色素漂白/再生过程中,HVS的亮度范围约为10-6 cd / m2至108 cd / m2。这使得有效动态范围约为14个对数单位。在色调映射中,目标是实现相同或更高的功能。尽管对HVS的模拟并不总是明确的目标,但重要的是要了解内在的感知方面。这些在制备用于显示装置的HDR材料的过程中起着基本作用。
作为色调映射含义的一个示例,它是一种感知上的动机操作,它通常是用于执行映射的对数空间。 根据Weber-Fechner定律,这是由于HVS在亮度范围较大的区域中接近对数响应。 该定律暗示了物理亮度和感知亮度之间的对数关系。 因此,在许多情况下,由于改善了感知线性,对数域中的计算使模拟变得更简单。
2.4. 色调映射中的细节保留
色调映射中的细节保留在图像处理的早期工作中,就已经引入了从内在特征描述图像的想法。对象可能是多方面的,例如提供一些不变的描述以用于更高层次的图像理解,或者被视为HVS早期阶段的初始描述。一种这样的想法可以描述照明和反射所产生的可能的图像。观察者能够确定物体在大范围照明情况下的反射率,从而有效地描述了对照明不变的度量。反射是场景的基本描述之一,可以使用非常有限的动态范围(大约100:1)进行指定。因此,在仅压缩包含在照度描述中的动态范围的同时,尝试通过色调映射来保持该特性具有直观意义。这些原则体现在局部色调映射运算符的构造中,其目的是在压缩全局对比度的同时保留局部对比度或细节。一种常见的方法是使用保边滤波器将图像大致分为照度和反射,如图1所示。
2.5. 颜色的色调映射
尽管有时会使用颜色外观模型来重现HDR颜色,但是为了简化和计算效率,色调映射通常仅处理亮度,并保留原始信号中的颜色。 或者,可以在一些合适的颜色空间中在颜色通道上分别执行映射。 但是,在单个颜色通道上进行色调映射往往会使颜色饱和度不足,而对单个亮度通道进行单独处理则会产生相反的效果。 为解决此问题,当从原始HDR图像恢复颜色时,可以执行启发式去饱和步骤:
此处,C和c分别是色调映射之前和之后的颜色,L是输入亮度,T是色调映射值。 参数s引导结果的颜色饱和度,其中值s <1导致饱和度饱和。还必须尝试表征颜色饱和度行为,以便得出特定色调映射中所需的饱和度校正量。
2.6.色调映射的目的
尽管我们在此处定义的色调映射旨在将HDR信号映射到显示器的受限空间,但目标可能会发生很大变化,重要的是要认识到不同的TMO试图实现不同的目标。 因此,色调映射的自然分类方法是其特定意图。
我们使用具有三种不同意图的分类。 这遵循了我们在先前工作中用于评估视频TMO的区别。 目的如图2所示,可以描述如下:
图2:根据意图使用不同类型的中间处理进行色调映射。算法的动机和设计是基于对特定目的的色调再现质量的评估。
视觉系统模拟器(VSS)此类操作员尝试模拟人类视觉系统(HVS)的属性,包括其局限性。 例如,TMO可以增加眩光,模拟人类夜视的局限性,或减少黑暗场景区域的色彩和对比度。 目的是在观看真实场景与其在特定显示器上捕获的和映射的对应色调之间实现最小的感知差异。
最佳主观质量(BSQ)在许多情况下,对所描绘场景的忠实再现并不重要,而要获得在主观质量方面最优选的色调映射。 但是,主观质量是一个高度依赖于情况的广义术语,可以用更近的术语来确定,例如 与某些艺术目标保持一致。 该类别包括例如分级特征影片的创意方面,其中结果可能高度取决于特定的观看环境。 与VSS类别相比,主观偏好通常是外观有些夸张,对比度,细节和色彩饱和度都增加了。
场景再现(SRP)在这里,操作员尝试使映射V(L)(到功能降低的显示设备)对某些属性不变。 目的是使原始场景外观尽可能地接近,并根据属性进行度量。 这些可以例如包括相对亮度,对比度,颜色,噪声可见性等。然而,只能同时捕获有限数量的属性,并且在许多其他方面,色调映射的图像仍可能与物理场景有很大偏离。
3.历史概述
关于上一节中的概念,我们在这里简要回顾一下色调映射领域中已发表的工作。 由于有大量的研究致力于该主题,并且多年来提出了许多专门的运算符和建议,因此,我们选择关注于跟踪色调映射的演变。 然后,我们分别在第5节和第6节中分别对此进行了更加严格的视频色调映射和算法审查。
总结一下我们在本报告中提到的运营商的数量,图3显示了每年发布的运营商数量以及分类方式。 尽管这些图未包含所有可能的TMO,但它们可以使您了色音色映射的工作方式。
图3:随时间变化的直方图(左):已发布的色调映射操作数,以及分类的平行坐标图(右)。这些图是使用本报告中引用的所有tmo创建的,并不包括所有现有的tmo。TMO直方图中的线从静态(蓝色)、时间(红色)和所有(黑色、虚线)TMO直方图中进行低通滤波,以显示随时间的进展情况。
3.1. Background
Oppenheim等人在1960年代就已经引入了压缩数字图像信号动态范围的技术。此外,在1980年代上提出了在现实世界和展示广告之间匹配感知属性的想法。 但是,在1990年代初,色调映射的概念首次在计算机图形学领域正式引。 从那时起,色调映射作为研究领域迅速发展(见图4)。 借助从多重曝光序列中重建自然HDR图像的技术,开发用于显示计算机生成的HDR媒体和相机捕获的HDR媒体的算法变得更加重要。 此外,随着HDR视频捕获的引入,TMO需要考虑的新问题。 在第5节中,我们将回到HDR视频色调映射的挑战。
为了说明HDR和色调映射的日益普及,图4绘制了出现在用于Google NGram查看器的Google图书数据库中的术语。 在1975年至1990年期间,术语映射是在语言学领域的第一波浪潮中出现的,它描述了声调的映射。 第二波是在计算机图形学中引入了色调映射。 因此,我们在此处定义的用于HDR图像显示的色调映射是一个新兴且迅速扩展的领域。
3.2.色调曲线
显示HDR图像最简单的方法是线性缩放,然后进行裁剪和最终的伽玛校正,从而有效地执行曝光校正。 作为第一个示例,Ward使用线性缩放,着重于保留图像对比度。 该方法基于Blackwell产生的检测阈值实验数据,被设计为亮度的全局缩放。
对于亮度的非线性映射,可以在对数域中应用线性缩放,或者等效地在线性域中将其用作指数函数。 这种色调曲线最初是由Tumblin和Rushmeier 使用的,目的是在动态范围压缩期间保持感知的亮度,如Stevens和Stevens 所述。 后来对该方法进行了改进,并将其用于凝视导向的自适应实现。 替代地,代替形式为V(L;α)=Lα的色调曲线V,可以将指数色调曲线公式化为V(L;α)=1-e-α。 在指数色调曲线家族中,文献中最常用的一种是对数色调曲线,最初由Drago等人提出。
由于色调映射的目标是将所有输入亮度映射到预定的有限范围,因此可以直观地理解逻辑或S型函数(请参见公式5)。 该功能通常发生在自然过程中。 例如,它在生物化学中被称为MichaelisMenten方程,在视觉研究中被称为Naka-Rushton方程。 对应于HVS的另一种安全曲线,并大量使用了VSS运算符。 明确地说,音色映射的第一个用途是Schlick ,尽管引入它的动机是相似的,但与指数或对数函数相比,在计算上更经济。 后来,使用S形函数,其动机类似于光感受器响应曲线,例如。 由Pattanaik等人撰写。
包含输入平均值或中值的色调曲线能够适应以提供输出的最佳总体曝光。 但是,使用图像直方图可以在亮度上实现更好的分布。 制定色调曲线,其中每个亮度Li的斜率取决于相应的概率pL(Li),从而可以生成在图像的更重要区域显示更好的对比度和曝光的结果。 Ward等人提出了使用该技术的第一种方法。 它从标准直方图均衡算法开始,并通过对概率pL(Li)的某些限制对其进行补充,以匹配HVS的功能。 最近,例如,已经使用了基于直方图的音调曲线。 为了在色调映射中提供最小的对比度失真,以执行基于聚类的色调映射,并在映射下从头到尾提高可视性。
色调曲线族的另一个重要例子是那些应用于梯度域的例子。Fattal等人引入了这一概念,该概念通过对图像梯度进行与大小成比例的抑制来对其进行色调曲线操作。
图4:用于谷歌NGram查看器的图书的谷歌图书数据库中短语“tone mapping”和“high dynamic range”的出现次数。这些情节反映了在过去50年里文学术语的流行(直到70年代早期音调映射才出现)。注意,y轴是以对数为单位的,这意味着当曲线是线性时,y轴呈指数增长。
3.3.细节保存
高斯滤波器为近似图像的照度特性提供了一种有效的方法,以便执行局部色调映射。 在第一个探索性工作中,Chiu等人。 利用这个想法。但是,近似值假定平滑过渡的强度。 靠近大梯度边缘时,过滤器将受到不同强度区域的很大影响,从而导致可见的最终色调映射中的光晕。Rahman等人对高斯滤波器进行了处理。 [RJW96]和Jobson等。 [JRW97]受retinex理论[LM71]中使用的中心环绕操作的启发。
第一个尝试明确解决由标准低通滤波器引起的问题的实验尝试[Sch94],其中在一个简化的示例中,通过使用图像分割建议局部适应。 尽管在实践中不可行,但该方法是迈向稍后在色调映射中常用的边缘保留滤波器的一步。 后来,Yee和Pattanaik [YP03]提出了一种更为通用的基于照度估计的分割方法。 分割也已用于在同一张图像中组合多个TMO [KMS05a,adCad07,BAS * 12,SLF * 15],用于局部交互调整色调再现[LFUS06],以及直接组合来自曝光包围序列的不同曝光 不需要中间的HDR重建步骤[MKVR09]
减轻高斯滤波器问题的另一种方法是执行非滤波方式,例如利用Pattanaik等人所述的拉普拉斯金字塔。 [PFFG98]。 Tumblin和Turk [TT99]使用LCIS过滤器提出了更严格的分层分解尝试。 它从各向异性扩散[PM90]中汲取了灵感,并代表了在色调映射环境下使用边缘保留滤波的首次认真尝试。 然而,伪影仍然是问题,并且该方法相对昂贵。 用于局部色调映射的金字塔过滤结构的其他早期示例包括Ashikhmin [Ash02]的迭代高斯滤波器,Reinhard等人使用的高斯金字塔。 受摄影实践的启发[RSSF02],以及Li等人提出的子带架构。 [LSA05]。
Tumblin等人给出了色调映射的逆变换,即照度和反射率的比较。 [THG99]。 该方法使用分层方法,其中从计算机生成的场景中提取照明/反射对,但是仅限于计算机生成的图像。
在没有伪像高斯滤波器的情况下,可以通过保留边缘的滤波器来完成在相机捕获的图像中提取照度的近似值。尽管早期的过滤金字塔结构实际上是保留边缘的过滤器,但在2000年代初,广泛流行的双边过滤器在色调映射的背景下已成为一种常用方法。 [DW00]中首次讨论了使用双边过滤器内核的公式进行局部色调映射的想法,尽管尚未经过真正的测试和确认。 Pattanaik和Yee [PY02]提出了双边滤波器在色调映射中的首次成功使用之一。过滤器在强度域中使用统一的空间核和指数核,并受到SUSAN过滤器的启发[SB97]。但是,到目前为止,最常见的双边过滤器公式是使用高斯核[AW95,TM98]。它是由Durand和Dorsey [DD02]在色调映射中介绍的,并且在色调映射文献中经常使用。
除了通用的边缘感知滤波器外,还提出了许多专门用于色调映射的滤波器。 这些方法包括早期的迭代方法,以及更新的过滤器[ASC ∗ 14,EMU15]。 例如,[EMU15]中的快速细节提取扩散是通过对双边滤波器的迭代简化来设计的,以便有效克服在陡峭但光滑的边缘处的有偏重构问题。
为了保留细节的局部处理不一定必须直接从(可能是经过变换的)亮度值执行。 Oppenheim等。 利用空间变化的伽马函数,该函数取决于图像的本地频率内容[OSS68]。 Fattal等。 提出了一种用于梯度域色调映射的方法[FLW02]。 使用高斯金字塔在不同级别上缩放梯度,比例因子描述为梯度大小的函数。 操纵之后,求解泊松方程以返回强度域。 Mantiuk等人提出了类似的方法。 [MMS05]。 然而,代替直接使用图像梯度,该方法对图像对比度进行了感知驱动的公式化。
4. 定义和分类
在本节中,我们仔细构建执行色调映射所涉及的中央计算的一般公式。 我们从色调曲线开始,这是TMO的主要元素。 随后,我们对公式进行了补充,以允许空间变化的局部计算。 色调曲线和本地处理是本地TMO管道中的主要构建块。 参考图1,它是管道的两个中心部分。 这些应辅以预处理和后处理步骤,以构建完整的TMO。
4.1. 色调曲线
TMO的最终目标是使用变换M:L→l从HDR输入L∈R +映射到显示参考像素值l∈Nd = {0,...,255}。 L可以是任意单位,但对于大多数色调映射算法,它与捕获的亮度值线性相关。 但是,不同的方法处理音调映射的方式不同。 有些TMO直接将像素映射为像素值{0,...,255},而另一些TMO则映射为显示亮度T,需要显示模型将其转换为像素值。在下文中,我们将色调曲线描述为V:L →T到输出T∈R +。 最后应将其最终转换为显示值l(图1中的最终步骤)。
色调曲线函数V可以取决于一组用户指定的常数ααα= {α1,...,αKα},还取决于一组图像统计量常数α例如可以是整体亮度,对比度,饱和度等。图像统计信息可以包括诸如图像平均值φ= µ = 1 N ∑s Ls的度量,诸如中位数,最大值或最小值的一些百分位数( 分别为0.5%,1%和0%)或图像直方图φi= pL(Li)。
使用α和φ,空间的通用配方不变的映射在一个像素位置可以写成
例如,可以将简单的曝光补偿描述为Ts = V(Ls;α)=αLs。 另一个例子是S形曲线,可以将其表示为输入的舒适值φ= µ,以适应整体亮度,
4.2.局部适应
可将公式4中的音调曲线公式化为压缩动态范围,例如压缩 像等式5一样,但这是以压缩整个软件输入的代价为代价的。尽管全球对比不可避免地要限制在较低的动态范围内,但一个共同的目标是保留局部对比(或细节)以模仿HVS的功能,请参见第2.4节。为了更好地再现局部对比度,我们可以引入一组参数ξs(L),该参数的设置与φ(L)相同,取决于L中的信息,但在像素s周围的局部邻域s中加权 。
局部适应度量的一个简单例子是加权局部均值,它是用高斯核Gσ,ξξξs(L)=(Gσ∗ L)s计算的。 空间变化的统计量可以直接用于色调曲线的公式中,例如在等式5中以在图像中局部适应,而不是使用所有图像像素的平均值V(Ls;φ(L);α)→ V(Ls;ξs(L);α)。 但是,给定一个估计图像全局变化的滤波器ξs(L),通常的公式是将图像分为基础层Bs =ξs(L)和细节层Ds = Ls-Bs。 映射后又重新添加了细节层。
在此,局部色调曲线V已被分解为全局图像对比度B的全局映射〜V,以及细节D,其与映射分开保存。 还应注意,这些操作通常在对数域中执行,但此处为了简化表示法未明确说明。最后,我们还可以更改图像本身的映射,
V = {V1,...,Vn},并引入一组不依赖于图像内容的空间变化参数θs=θ1,...,θkθ。 这些参数例如可以根据图像中的垂直和水平像素位置来表述。 现在,我们得出音调曲线的最一般的表述,