ISAL最佳海报奖：高效的概率行人标记灯

ISAL 2025 最佳海报奖授予了多特蒙德工业大学控制理论与系统工程研究所的 Felix Glatzel 及其同事。他们的海报标题为《基于姿态概率的计算机视觉节能行人标志灯》，介绍了一种利用高清矩阵大灯普及来提供行人标志灯功能的方法。该功能在检测到行人时会进行聚光，以确保驾驶员能够看到他们。Glatzel 及其团队指出，大多数灯光会照亮比实际需要更大的区域，这会造成光污染和眩光，同时浪费能源。

他们的方法提出选择性地照亮行人，从而避免浪费。他们仔细分析了每束车灯光线在行人边界框内到达行人的概率，并基于该分析为边界框内的行人开发了一种自适应发光强度分布（LID）。这种“姿态-概率发光强度分布”在检测到行人后会调整到行人的边界框上。如图所示，对头部、肩部和腿部等特征的照明可以比对整个边界框的照明更精确。

从 PETA 行人数据集中处理了 405 张图像。首先，每张图像被重新调整为 640 × 640 像素的正方形。然后，每张调整后的图像通过 YOLOv8 检测神经网络处理，以检测图像中行人的边界框坐标，同时 YOLOv8 分割神经网络将相同的图像分成两个部分：行人和周围环境。随后从分割图像中提取边界框。为了在不同图像之间规范化数据，剪切出来的分割边界框随后被重新调整为 640 × 640 像素的正方形图像。

图像的重塑裁剪部分随后被叠加并取平均，从而生成行人对应边界框的姿态概率热图。为了使姿态概率 LID 对称，它会与自身的镜像叠加并取平均，从而有效地将用于 LID 的考虑姿态数量翻倍。在所有生成的矩阵被叠加后，得到的姿态概率 LID 类似于模糊的人形或白雪天使。

一旦姿态概率 LID 被对称平均后，可以通过应用不同的像素级权重函数来修改，以使特定区域变亮或变暗。可选的额外步骤可以对热图进行专门的修改。例如，通过调暗 LID 中类似头部的区域，可以实现无闪光的人行标记灯。为了评估姿态概率 LID，在 Unreal Engine 5 的仿真环境中研究了六种情景。所有场景都包含一个背景为自由夜空、铺有沥青地面的场景，以及一名行人。在三种情景中，行人穿着明亮的衣服，在另外三种情景中穿着深色衣服；明亮的衣服使行人与背景之间的对比度更高。检测质量由 YOLOv8 网络的置信度（Conf）和交并比（IoU）来决定。

对两种姿态概率 LID 变体进行了评估，并将它们与另外两种也适用于行人边界框的 LID 进行了比较。PP 是姿态概率 LID，而 PPgf 是一种通过加权函数增强亮度并具有抑光无眩光区域的姿态概率 LID。HBox 类似于整个边界框的光照，而 GBox 是基于二维高斯钟形曲线的 LID。

评估显示，对于行人衣物是亮还是暗，结果会有所不同。在行人与背景对比度较高的场景中，PP、PPgf 和 GBox 有可能在保持与 HBox 可比的检测质量的同时（置信度约为 80%，IoU 约为 90%），降低能耗。在背景亮度为 30%、最大亮度为 100% 的情况下，PP 在边界框内节省了 29.7% 的能量；PPgf 节省了 19.1%，GBox 节省了 33.5%，而 HBox 的亮度为 100%。

当行人和背景之间的对比度较低时，情况会有所不同。在一个低对比度的场景中，PP 和 PPgf（分别为 56.1% 和 61.2% 置信度；85.4% 和 88.9% IoU）以及 GBox（38.9% 置信度，88.1% IoU）的表现明显不如 HBox（70.0% 置信度，91.5% IoU）。然而，在另外两个低对比度的案例中，PP 和 PPgf 的检测表现与 HBox 相当（置信度约为 75%，IoU 约为 93%）。GBox 在剩余的低对比度场景下表现明显较差（置信度约为 58%，IoU 约为 79%）。在检测质量方面，姿态概率 LID 优于二维高斯钟形 LID，并且在保持类似检测质量的同时，比照亮整个边界框消耗的能量更少。

评估显示，在静态情况下，姿态概率LID的性能总体良好。然而，在动态情况下的性能，例如多帧间的跟踪能力，仍有待评估。这些评估结果可用于开发更高级的LID，包括增加额外的行人姿态以及可能的改进（例如，增强动态情况下的跟踪性能）。