Press "Enter" to skip to content

我们对生成AI构建防护措施的负责任态度

超过二十年来,谷歌一直致力于利用机器学习和人工智能使我们的产品更有帮助。人工智能已经在各方面帮助我们的用户,从Gmail中的智能撰写到在地图中找到更快的回家路线。人工智能还让我们能够为大家共同面临的重大问题做出贡献,无论是推动医学发展还是寻找更有效的应对气候变化的方法。随着我们继续将人工智能以及最近的生成式人工智能融入更多谷歌体验中,我们知道,勇敢而负责任地共同前行是至关重要的。点击此处一起大胆而负责任

从一开始就为我们的产品构建保护措施

负责任地引入这项技术的重要部分是预测和测试广泛的安全和保密风险,包括由人工智能生成的图像带来的风险。我们正在采取措施,通过默认设置来嵌入保护措施到我们的生成式人工智能功能中,我们会按照我们的人工智能原则进行指导:

  • 防止不公平偏见:我们开发了工具和数据集来帮助识别和减轻我们机器学习模型中的不公平偏见。这是我们团队研究的一个活跃领域,在过去几年里,我们已经发表了几篇关键的论文。我们也经常寻求第三方意见,以帮助考虑社会背景,并评估培训数据集中潜在的不公平偏见来源。
  • 红队测试:我们邀请内部和外部专家参与红队测试计划,以测试各种漏洞和滥用的潜在领域,包括网络安全漏洞以及更复杂的社会风险,如公平性。这些专门的对抗性测试努力,包括我们在今年8月参加DEF CON人工智能村红队活动,有助于识别当前和新兴的风险、行为和政策违规,使我们的团队能够主动减轻这些风险。
  • 实施政策:利用我们在政策制定和技术执行方面的深厚经验,我们制定了生成式人工智能禁止使用政策,概述了我们禁止的有害、不适当、误导或非法内容。然后,我们使用广泛的分类器系统来检测、预防和移除违反这些政策的内容。例如,如果我们识别出有违规的提示或输出,我们的产品将不会提供响应,还可能引导用户查找有关敏感主题的其他资源,如危险行为或自残。
  • 保护青少年:随着我们逐渐向青少年拓展生成式人工智能体验(如SGE),我们针对根据他们的发展需求可能存在风险的领域制定了额外的安全措施。这包括限制与欺凌和年龄限制或非法物质相关的输出。
  • 为版权提供赔偿:我们在用于生成式人工智能模型的培训数据和用户使用谷歌工作区和谷歌云服务生成的输出上提供赔偿保护。简单地说,如果客户在版权方面受到挑战,我们将承担潜在的法律风险责任。

为生成式人工智能输出提供额外的上下文

在为人们提供关于网络信息的上下文方面,我们一直拥有悠久的历史,我们正在添加新的工具来帮助人们评估我们模型生成的信息。例如,我们在搜索中为生成式人工智能添加了关于此结果的信息,以帮助人们评估他们在体验中找到的信息。我们还引入了新的方式来帮助人们双重检查他们在Bard中看到的回应。

对于图像来说,上下文尤其重要,我们致力于确保通过我们的产品生成的每张图像都带有元数据标签和嵌入式水印,使用SynthID技术。同样,我们最近更新了我们的选举广告政策,要求广告主在他们的选举广告中包含数字变形或生成内容时进行披露。这将有助于为在我们平台上看到选举广告的人们提供额外的上下文信息。

我们推出Bard和SGE作为实验,因为我们认识到作为新兴技术,基于大型语言模型(LLM)的体验可能会出现错误,尤其是在破坏性新闻方面。我们始终致力于确保产品在获得更多信息时更新,并且我们的团队将根据需要迅速实施改进。

我们如何保护您的信息

新技术自然会引发关于用户隐私和个人数据的问题。我们正在构建私有设计的AI产品和体验。多年来我们已实施的许多隐私保护措施也适用于我们的生成型AI工具,并且与您Google账户中的其他类型的活动数据一样,我们使其随时可以轻松暂停、保存或删除,包括对于Bard和Search。

我们从不向任何人出售您的个人信息,包括广告目的-这是谷歌的长期政策。此外,我们还为我们的生成型AI产品实施了针对隐私的保护措施。例如,如果您选择在Bard中使用Workspace扩展程序,您的Gmail、Docs和Drive内容不会被人工审核员查看,也不会被Bard用于显示广告,或用于训练Bard模型。

与利益相关者合作塑造未来

AI引发了复杂的问题,谷歌或任何其他单个公司都无法单独回答。为了正确应对AI,我们需要各公司、学术研究人员、公民社会、政府和其他利益相关者的合作。我们已经与“AI合作伙伴关系”和“ML Commons”等组织进行了讨论,并与其他领先的AI实验室共同启动了“前沿模型论坛”,以促进前沿AI模型的负责任发展。我们还发表了几十篇研究论文,以便与研究人员和行业分享我们的专业知识。

我们也对我们所做的承诺的进展保持透明,包括我们在今年早些时候在白宫峰会上与其他技术公司自愿做出的承诺。我们将继续在整个行业、与政府、研究人员和其他人合作,拥抱AI带来的机遇并应对风险。

Leave a Reply

Your email address will not be published. Required fields are marked *