Meta AI在计算机视觉公平性方面的两项新尝试：引入DINOv2许可证和发布FACET

Meta AI在计算机视觉公平性方面的两项新尝试：引入DINOv2许可证和发布FACET 四海第1张

在不断发展的计算机视觉领域中，一个紧迫的问题是确保公平性。这篇文章揭示了人工智能技术（尤其是计算机视觉）中潜在的巨大潜力，它是促成各个领域变革性突破的催化剂，从维护生态保护努力到推动开拓性的科学探索。然而，它对这项技术崛起所带来的固有风险保持了坦诚的态度。

Meta AI的研究人员强调必须达到的关键平衡，即快速创新的节奏与必要时出现的有意识的开发实践之间的和谐平衡。这些实践不仅仅是一种选择，而且是对这项技术可能无意中给历史上被边缘化社区带来的潜在伤害的重要防护。

Meta AI的研究人员针对这个多方面的挑战制定了一项全面的路线图。他们首先通过开源Apache 2.0许可证使DINOv2成为一种先进的计算机视觉模型，该模型通过自监督学习的锻炼器锻炼而成。DINOv2是Data-Efficient Image Neural Network Version 2的缩写，代表着计算机视觉模型的一次重要飞跃。它利用自监督学习技术创建通用特征，使其能够以高度灵活的方式理解和解释图像。

DINOv2的能力不仅限于传统的图像分类。它在许多任务中表现出色，包括语义图像分割，可以准确识别物体边界并将图像分割成有意义的区域，以及单目深度估计，使其能够感知图像中物体的空间深度。这种多功能性使DINOv2成为计算机视觉应用的强大工具。这种扩展的可访问性使开发人员和研究人员能够在广泛的应用领域中利用DINOv2强大的功能，进一步推动计算机视觉创新的前沿。

Meta对计算机视觉中公平性的承诺的核心在于引入FACET（计算机视觉评估中的公平性）。FACET是一个里程碑式的基准数据集，包含约32,000张图片，涵盖约50,000个个体。然而，FACET的独特之处在于专家人工标注者的细致注释。这些专家经过细心的注释工作，将数据集按多个维度进行分类。其中包括感知性别表达、年龄组别以及感知肤色和发型等身体属性。值得注意的是，FACET引入了与个人相关的类别，涵盖了像“篮球运动员”和“医生”这样多样化的职业。该数据集还通过包含69,000个口罩标签增强了其研究目的的重要性。

使用FACET进行的初步研究已经揭示了先进模型在不同人群中的性能差异。例如，这些模型在准确检测肤色较暗或头发卷曲的个体方面经常遇到挑战，揭示了潜在的偏见，值得仔细研究。

在使用FACET进行性能评估时，最先进的模型在不同人群之间展示出性能差异。例如，模型可能难以检测到肤色较暗的个体，对于头发卷曲的个体则更加困难。这些差异凸显了对计算机视觉模型中的偏见进行全面评估和缓解的必要性。

Meta AI在计算机视觉公平性方面的两项新尝试：引入DINOv2许可证和发布FACET 四海第3张

尽管主要用于研究评估而不是用于训练目的，但FACET有可能成为评估计算机视觉模型公平性的卓越标准。它为对人工智能中的公平性进行深入细致的检查奠定了基础，超越了传统的人口属性，包括了与个人相关的类别。

总之，Meta的文章放大了计算机视觉中的公平性问题，并揭示了FACET揭示的性能差异。Meta的方法包括扩大对DINOv2等先进模型的访问，并引入一种开创性的基准数据集。这种多方面的方法彰显了他们对促进创新、坚持道德标准和缓解公平问题的坚定承诺。它突显了他们对负责任的发展的不懈奉献，为实现一个公平的人工智能领域铺平了道路，即利用技术造福于所有人的领域。