Press "Enter" to skip to content

宣布新的工具和能力,以实现负责任的人工智能创新

生成性人工智能的快速发展带来了有前景的新创新,同时也带来了新的挑战。这些挑战包括一些在生成性人工智能之前就存在的问题,比如偏见和可解释性,以及基础模型(FMs)独有的一些新问题,包括幻觉和有害性。在AWS,我们致力于负责任地开发生成性人工智能,通过以人为本的方式,优先考虑教育、科学和我们的客户,将负责任的人工智能融入到端到端的人工智能生命周期中。

在过去的一年里,我们在生成性人工智能应用和模型中引入了新的功能,例如Amazon CodeWhisperer中内置的安全扫描,在Amazon Titan中用于检测和阻止有害内容的训练,以及Amazon Bedrock中的数据隐私保护。我们在安全、透明和负责任的生成性人工智能方面的投资包括与全球社区和政策制定者的合作,我们鼓励并支持白宫自愿人工智能承诺英国AI安全峰会。我们继续与客户紧密合作,利用Amazon SageMaker ClarifyAmazon SageMaker的ML治理工具等专为实施负责任的人工智能而设计的工具。

宣布新的工具和能力,以实现负责任的人工智能创新 四海 第1张

推出新的负责任人工智能创新

随着生成性人工智能扩展到新的行业、组织和用例,这种增长必须伴随着对负责任FM开发的持续投资。客户希望他们的FM构建时考虑到安全、公平和安全性,以便他们可以负责任地部署人工智能。在今年的AWS re:Invent大会上,我们很高兴地宣布推出新的功能,通过新的内置工具、客户保护措施、增强透明度的资源和对抗虚假信息的工具,促进负责任的生成性人工智能创新的发展。我们旨在提供客户评估FM的必要信息,比如有害性和鲁棒性,同时引入屏障,根据客户的用例和负责任的人工智能政策应用保障措施。与此同时,我们的客户希望更好地了解AI服务和FM的安全性、公平性、安全性及其他属性,因为他们在自己的组织内使用它们。我们很高兴地宣布推出更多的资源,帮助客户更好地了解我们的AWS AI服务,并提供他们所要求的透明度。

实施保障措施:Amazon Bedrock的保护措施

在大规模引入生成性人工智能时,安全是首要考虑的问题。组织希望在整个组织中建立一致的保障措施,以促进客户与生成性人工智能应用之间的安全互动,避免使用有害或冒犯性语言,并与公司政策相一致。最简单的方法是在整个组织中统一实施保障措施,以便每个人都能安全创新。昨天,我们宣布了Amazon Bedrock的保障措施预览版,这是一种全新的功能,可以根据客户用例和负责任的人工智能政策轻松实施特定于应用程序的保障措施。

护栏在亚马逊Bedrock上的FM上确保了对应用程序中不良和有害内容的一致性响应。顾客可以将护栏应用于亚马逊Bedrock上的大型语言模型,以及微调模型和与亚马逊Bedrock代理相结合。护栏允许您指定要避免的主题,服务会自动检测和阻止属于受限类别的查询和响应。顾客还可以配置各类别中有害内容的过滤阈值,包括仇恨言论、侮辱、性话语和暴力,以达到所期望的过滤级别。例如,可以设置在线银行应用程序以避免提供投资建议,并限制不适当的内容(如仇恨言论、侮辱和暴力)。不久的将来,顾客还可以编辑用户输入和FM的回复中的个人可识别信息(PII),设置亵渎过滤器,并提供一系列自定义屏蔽用户和FM之间交互中的词汇表,以提高合规性和进一步保护用户。有了护栏,您可以在保持与公司政策一致的保护和安全措施的同时,更快地进行生成AI的创新。

识别特定用例的最佳FM:在亚马逊Bedrock中进行模型评估

如今,组织在为其生成AI应用程序提供动力的FM选项很多。为了在其用例中找到准确性和性能的最佳平衡,组织必须高效比较模型,并据此找到最佳选项,这些选项基于对它们而言重要的负责任AI和质量度量标准。要评估模型,组织必须首先花费数天时间来确定基准、设置评估工具并运行评估,所有这些都需要深入的数据科学专业知识。此外,这些测试对于评估主观标准(例如品牌声音、相关性和风格)并不有用,这需要通过繁琐、耗时的人工审查工作流程来进行判断。对于每个新的用例,这些评估所需的时间、专业知识和资源,使得组织难以对模型进行负责任的AI维度评估,并在选择哪个模型能为其客户提供最准确、安全的体验方面做出明智选择。

现在,在预览中提供的亚马逊Bedrock上的模型评估帮助客户根据自定义指标(如准确性和安全性)为特定用例评估、比较和选择最佳FM,无论是通过自动评估还是人工评估。在亚马逊Bedrock控制台中,客户选择要为给定任务(如问答或内容概述)进行比较的FM。对于自动评估,顾客选择预定义的评估标准(如准确性、鲁棒性和有毒性),并上传自己的测试数据集,或从内置的公开可用数据集中进行选择。对于需要判断的主观标准或细致的内容,顾客可以仅需点击几下即可轻松设置基于人工评估工作流。这些工作流利用客户的内部工作团队,或使用由AWS提供的托管工作团队来评估模型回复。在人工评估期间,顾客会定义用例特定的指标(如相关性、风格和品牌声音)。一旦顾客完成设置流程,亚马逊Bedrock会运行评估并生成报告,以便顾客可以轻松了解模型在关键安全性和准确性标准上的性能,并为其用例选择最佳模型。

评估模型的能力不仅限于亚马逊Bedrock,顾客还可以使用亚马逊SageMaker Clarify中的模型评估轻松评估、比较和选择跨所有FM的最佳选项,包括关键的质量和责任度量标准,如准确性、鲁棒性和有毒性。

打击虚假信息:亚马逊Titan中的水印

今天,我们在预览中宣布了亚马逊Titan图像生成器,它使客户能够快速生成和增强大规模的高质量图像。在模型开发过程的每个阶段,我们都考虑了负责任的AI,包括培训数据选择、构建过滤能力以检测和删除不适宜的用户输入和模型输出,以及改进模型输出的人口多样性。所有亚马逊Titan生成的图像默认包含一个隐形水印,旨在通过提供一个不显眼的机制来减少虚假信息的传播。AWS是首批广泛发布内置隐形水印的模型提供商之一,这些水印已集成到图像输出中,并且在设计上能够抵抗篡改。

建立信任:通过补偿来支持我们的模型和应用

建立客户信任是AWS的核心价值观。从我们成立以来,我们一直与客户并肩前行,在生成式人工智能的发展过程中,我们致力于与客户共同构建创新技术。为了让客户能够利用我们的生成式人工智能的威力,他们需要知道他们受到保护。AWS为以下Amazon生成式人工智能服务的输出提供版权赔偿保障:Amazon Titan Text Express,Amazon Titan Text Lite,Amazon Titan Embeddings,Amazon Titan Multimodal Embeddings,Amazon CodeWhisperer Professional,AWS HealthScribeAmazon Lex,以及Amazon Personalize。这意味着,只要客户负责地使用这些模型,就可以免受第三方声称因这些服务生成的输出侵犯版权的索赔(请参阅《服务条款》第50.10节)。此外,我们为使用这些服务的客户提供标准知识产权赔偿,以保护他们免受第三方声称使用这些服务和训练数据侵犯知识产权的索赔。换句话说,如果您使用上述列出的Amazon生成式人工智能服务,而有人以知识产权侵权对您提起诉讼,AWS将会为您辩护,包括承担您的一切判决或和解费用。

我们支持我们的生成式人工智能服务,并致力于不断改进它们。随着AWS推出新的服务和生成式人工智能不断发展,AWS将继续不懈地专注于赢得和维护客户的信任。

提高透明度:Amazon Titan Text的AWS AI服务卡片

我们在2022年的re:Invent上推出了AWS AI服务卡片,作为一种透明性资源,帮助客户更好地了解我们的AWS AI服务。AI服务卡片是一种负责任的人工智能文档形式,为客户提供一个单一的位置,以了解我们的人工智能服务的预期用途和限制、负责任的人工智能设计选择,以及部署和性能优化的最佳实践。它们是我们全面开发我们的服务的一个组成部分,以负责任的方式解决公平性、可解释性、真实性和稳健性、治理、透明性、隐私和安全、安全性以及可控性等问题。

今年的re:Invent上,我们宣布推出一个针对Amazon Titan Text的新的AI服务卡片,以增加基础模型的透明度。我们还推出了四个新的AI服务卡片,包括:Amazon Comprehend检测PIIAmazon Transcribe毒性检测Amazon Rekognition人脸活体检测,以及AWS HealthScribe。您可以在AWS网站上探索每个卡片。随着生成式人工智能的不断发展,透明化技术的开发、测试和使用方式将成为赢得组织和客户信任的重要组成部分。在AWS,我们致力于继续为更广泛的社区提供像AI服务卡片这样的透明性资源,并在最佳前进方式上进行迭代和收集反馈。

在整个生成式人工智能生命周期中投资负责任的人工智能

我们为本周在re:Invent上宣布的新创新感到兴奋,这些创新为我们的客户提供了更多工具、资源和内置保护措施,让他们能够更安全地构建和使用生成式人工智能。从模型评估到防护措施再到水印技术,现在客户可以更快地将生成式人工智能引入他们的组织中,同时降低风险。为客户提供的新的保护措施,如知识产权保护和增强透明度的新资源,例如额外的人工智能服务卡片,也是我们在技术公司、政策制定者、社区组织、科学家等方面建立信任的承诺的关键示例。我们将继续在基础模型的整个生命周期中对负责任的人工智能进行有意义的投资,以帮助我们的客户以安全、可靠和负责任的方式扩展人工智能。

Leave a Reply

Your email address will not be published. Required fields are marked *