Press "Enter" to skip to content

“为什么包含多样图片集合能帮助我们制作更好的产品”

我们致力于以多种方式使我们的产品更具包容性。我们在这方面面临的最大挑战之一是找到并使用具有代表性的数据。我们希望反映使用Google产品的所有人的经验和需求,尤其是历史上处于边缘化背景的人。

当产品不使用多样化和具有代表性的数据构建时,它们可能对每个人都不太有用。因此,我们一直在使用更具包容性的数据集对一些早期的机器学习模型进行重新训练:这些数据集是我们用来构建硬件和软件产品的数据集。

对于依赖相机的产品,例如拍照或在手机上使用面部解锁,这一点尤为重要。我们能够使用更具包容性的数据集来创建Google Pixel上的真实色调,为所有用户真实而美观地呈现肤色。

在过去的两年里,我们的团队与我们的负责创新团队的同事合作,与肤色摄影公司TONL合作,其名称是对准确美观地捕捉所有肤色的重要性的致敬。他们与我们合作,为我们提供了数千张历史上边缘化背景的人的照片。我们的目标是包括跨性别光谱的模特照片、肤色较深的模特照片以及具有残疾的模特照片(以及代表这些身份交叉性的人)。该项目现在已扩展到与Chronicon和RAMPD合作,以获取具有慢性疾病和残疾的个体为中心的定制照片。

“为什么包含多样图片集合能帮助我们制作更好的产品” 四海 第1张

Google正在使用这些图像数据集来帮助产品团队识别他们正在开发的机器学习模型中的潜在公平性挑战。我们期待继续改善数据集的表征,以确保我们为所有用户构建最具包容性和公正性的技术。

Google负责AI的肤色团队还与TONL合作,策划了Monk肤色示例(MST-E)数据集,其中包含19个人的示例,他们的肤色覆盖了10级Monk肤色(MST)刻度。该数据集包含1515张图像和31个视频,捕捉了人们在各种姿势和光照条件下的形象,以及佩戴或不佩戴口罩或眼镜等配件。由于人们对肤色的分类方式可能是主观的,Monk博士亲自为数据集中的人物图像进行了标注。我们希望这个数据集能帮助从业者教会人工标注者如何在各种条件下进行一致的肤色标注测试,如高亮度和低亮度。最终,这有助于使基于人工智能的产品更好地为各种肤色的人服务。

“为什么包含多样图片集合能帮助我们制作更好的产品” 四海 第2张

通过这些项目,我们希望继续努力实现改进机器学习模型中肤色评估的目标。请访问 skintone.google 了解更多信息。

Leave a Reply

Your email address will not be published. Required fields are marked *