图 5:使用DBSCAN对图 3所示框架进行聚类分析。
2.3 凝聚聚类
在最后一次尝试通过聚类分析来表示框架的颜色结构时,使用了凝聚聚类或层次聚类的方法。在层次凝聚聚类分析中,每个单独的像素最初被视为一个独立的聚类。因此,最初像素的数量与簇的数量一样多。该算法现在使用距离测量来比较哪两个簇(最初是两个像素)在所有簇中最接近。然后将这两个集群合并为一个新的集群。第二步,再次计算彼此之间距离最小的两个聚类。如果一个簇由多个像素组成,这在第二步中是不可避免的,那么就需要一种所谓的融合算法,它将簇的各个像素组合起来并将它们相互关联。
因此,聚集过程中的每个步骤都会减少集群的数量。一旦所有集群合并为一个,该过程就结束。结果是一个树结构,它模拟了总结的过程,并使其可视化为树突图(图 6)。每条垂直线代表一个簇,该簇由与其左侧连接的簇组成。垂直线的长度表示簇的数值距离,它是根据之前使用的融合算法计算出来的。横轴指示组合在一个簇中的输出簇(这里是像素)的数量。
图 6:图 3 中使用的框架的聚集聚类分析的系统树图。
图 6:图 3中使用的框架的聚集聚类分析的系统树图 。
层次聚类分析的灵活性在于,可以根据所需的聚类数或不应超过的最大距离值来指定结果。因此,查询可以返回最接近特定距离值但不超过该距离值的所有聚类。这意味着分离性可以成为聚类分析的唯一标准。对于电 乌拉圭电报数据 用结果簇之间的距离(不考虑其大小)作为计算主色的基础的可能性,相对于其他两种聚类分析方法中的颜色混合而言,具有决定性的优势。然而,从垂直轴的标记来看,它们对于电影科学色彩结构研究的缺点已经很明显了。与K-Means和DBSCAN 相比,凝聚聚类的计算量非常大,因为必须确定所有聚类之间的距离。在所使用的参考计算机上,计算一帧包含 41,472 个像素的数据需要花费 7 分 15 秒。相比之下,K-Means只需 21 秒即可完成聚类分析。
事实上,在计算机辅助人文学科研究过程的背景下,凝聚聚类分析更有可能用于初始聚类数量较少的项目。巴克斯特给出了一个在Cinemetrics项目中基于编辑长度对影片进行聚集聚类的例子。[41] Duntze 使用凝聚聚类分析来重现古版印刷类型的谱系。[42]然而,在本申请中,大量的输出簇不仅被证明是一个效率问题。它还阻止了沿特定距离值更准确地计算聚类,因为它推断出SciPy所用实现中的一个错误,而当初始聚类数较高时,出现该错误的可能性会更大。[43] 毫无疑问,可以采用不同的凝聚聚类算法的实现。然而,这并不能改变重大的性能问题,即使在降低图像分辨率的情况下,在分析多部影片的情况下,这个问题也很难克服。[44]另一种选择是在开始聚类分析之前减少要聚类的数据点的数量。为此,与ACTION项目类似,可以对帧进行光栅化,或者使用更大片段内的所谓超像素来确定帧。第3节 解释了为什么没有进一步推行这种方法,以及为什么上述问题最终导致决定不在此项目中使用聚类方法。
2.4 颜色量化和颜色模型
从数字上来说,颜色通常表示为三维空间中的坐标。这个空间的维度指的是颜色的不同属性,例如红色、绿色和蓝色成分。使用哪些属性进行数字表示取决于所使用的颜色模型。这些颜色模型的数量是难以管理的,因为根据费尔柴尔德的说法,颜色不是一个物体,而是一个过程,“存在于环境和观察者的头脑中”。[45]根据费尔柴尔德的说法,问题不是“什么是颜色”,而是“为什么会有颜色”。
这个›为什么›引起了人们对谈论颜色的不同接受背景的关注,并且也证明了不同颜色模型的存在。许多这样的模型对应于生产彩色印刷品的特定生产技术。例如,前面提到的具有红、绿、蓝 (RGB) 维度的色彩空间可以追溯到20 世纪 20 年代国际照明委员会(CIE) 首次尝试标准化色彩索引。在他们的实验装置中,他们使用了三盏上述颜色的灯,每盏灯的颜色强度都是可调的。利用所谓的加色过程,应该可以产生人类能够感知的所有颜色。[46]最后但并非最不重要的一点是,可行彩色电影工艺本身的发展历史,始于 19 世纪末威廉·弗里斯-格林 (William Friese-Greene),一直到 1929 年的特艺彩色3 号 (Technicolor No. 3),是色彩概念化和技术设备之间关系最令人印象深刻的背景之一。[47]其他模型是颜色模型的变换,例如,旨在使颜色索引更易于理解。 HSV 颜色空间只是 RGB 颜色空间的一种变换。
图 7:图 3 中的帧的颜色值在 RGB 和 HSV 颜色模型中的空间分布。
图 7 :图 3中的帧在 RGB 和 HSV 颜色模型中的颜色值的空间分布。
在基于聚类的颜色分析中,不同颜色模型的重要性是显而易见的。根据所使用的颜色模型,颜色值或像素在相应的颜色空间中具有不同的坐标。由于聚类分析是一种根据各自颜色空间内的接近度和距离对颜色值进行分组的方法,因此这种分组以及聚类的颜色值在每个颜色空间中都是不同的。图 7通过将《行尸走肉》中一帧的RGB 颜色空间中的所有像素与 HSV 颜色空间中的图像进行比较来说明这些差异。由于距离差异本身在不同颜色模型的背景下是系统性的,因此可以得出结论,在聚类分析的背景下,每个颜色模型都会突出或将某些颜色现象推到背景中。
2.5 色彩感知
然而,出于电影科学分析目的确定主色的复杂性不仅仅是不同颜色表示和计算方法的结果。它还受到许多与色彩感知有关的因素的影响。最为人所知的是所谓的色彩适应:颜色的感知根据感知环境中最亮光脉冲的波结构而变化。相应现象的列表是开放的; Fairchild 的“色彩外观模型”中的选择已经包含十二个示例。[48]
不过,我们不会在这里明确讨论具体的颜色感知现象。相反,我们将使用西班牙僵尸电影《REC》中的一帧来阐明数值色彩分析问题所带来的困难。[49]该帧(图8)显示主角介绍有关消防站的报告,构成了电影情节的框架。色彩方面,消防车、主角外套、麦克风之间形成的红与绿的互补对比,瞬间吸引眼球。红色和绿色以及蓝色和黄色互补对比的象征性使用是这部电影美学设计最引人注目的特征之一,并且实际上对数值分析提出了挑战。虽然一开始红色明显占主导地位,但在最后的场景中,整个图像通过滤镜沐浴在绿色中。最后的红色痕迹,是主人公标志性的白衬衫上不明来源的血迹。