Press "Enter" to skip to content

使用亚马逊床岩和亚马逊转录,利用生成式人工智能生成记录摘要

会议记录是协作的重要组成部分,但它们经常被遗漏。在主持讨论、仔细倾听和输入笔记之间,关键信息很容易被忽视而没有记录下来。即使有记录,它们可能无组织或难以辨认,使它们变得无用。

在这篇文章中,我们探讨如何使用Amazon TranscribeAmazon Bedrock自动生成视频或音频记录的简洁、清晰摘要。无论是内部团队会议、会议讲座还是财报电话,这种方法都可以帮助您将数小时的内容提炼为要点。

我们将介绍如何使用Amazon Bedrock转录项目团队会议并总结关键要点。我们还会讨论如何根据课程讲座、面试和销售电话等其他常见场景定制此解决方案。继续阅读,简化和自动化您的记笔记过程。

解决方案概述

通过结合Amazon Transcribe和Amazon Bedrock,您可以节省时间、捕捉见解并增强协作。Amazon Transcribe是一种自动语音识别(ASR)服务,可以简单地向应用程序添加语音转文本功能。它使用先进的深度学习技术将音频准确地转录为文本。Amazon Bedrock是一个完全托管的服务,它提供了来自领先人工智能公司(如AI21 Labs、Anthropic、Cohere、Meta、Stability AI和Amazon)的高性能基础模型(FM)选择,以及构建生成性人工智能应用所需的广泛功能集。使用Amazon Bedrock,您可以轻松尝试各种顶级FM,并使用微调和检索增强生成(RAG)等技术私人定制它们。

本文介绍的解决方案使用由触发器S3桶中的录音触发的AWS Step Functions状态机进行编排。Step Functions允许您创建无服务器工作流,以编排和连接跨AWS服务的组件。它处理底层复杂性,使您可以专注于应用程序逻辑。它对于协调任务、分布式处理、ETL(提取、转换和加载)和业务流程自动化非常有用。

以下图示了高级解决方案架构。

使用亚马逊床岩和亚马逊转录,利用生成式人工智能生成记录摘要 四海 第1张

解决方案的工作流程包括以下步骤:

  1. 用户将录音存储在S3资产桶中。
  2. 此操作触发Step Functions转录和摘要状态机。
  3. 作为状态机的一部分,触发AWS Lambda函数,使用Amazon Transcribe进行转录,并将转录存储在资产桶中。
  4. 第二个Lambda函数检索转录,并使用Amazon Bedrock中的Anthropic Claude模型生成摘要。
  5. 最后,最终的Lambda函数使用Amazon Simple Notification Service(Amazon SNS)将录音摘要发送给收件人。

此解决方案支持Anthropic Claude on Amazon Bedrock可用的区域。

状态机编排了执行特定任务的步骤。以下图解释了详细的过程。

使用亚马逊床岩和亚马逊转录,利用生成式人工智能生成记录摘要 四海 第2张

先决条件

在使用之前,Amazon Bedrock 用户需要申请访问模型。这是一次性操作。对于这个解决方案,您需要在 Amazon Bedrock 中启用对Anthropic Claude模型的访问权限(而不是 Anthropic Claude Instant)。有关更多信息,请参阅 模型访问权限

部署解决方案资源

该解决方案使用 AWS CloudFormation 模板进行部署,模板可以在 GitHub 代码库 中找到,可以自动在您的 AWS 账户中创建所需的资源。模板需要以下参数:

  • 用于发送摘要的电子邮件地址 – 摘要将发送至此地址。在收到其他通知之前,您必须确认初始的 Amazon SNS 确认电子邮件。
  • 摘要说明 – 这是提供给 Amazon Bedrock 模型用于生成摘要的说明。

运行解决方案

在使用 AWS CloudFormation 部署解决方案后,请完成以下步骤:

  1. 确认您在创建 CloudFormation 栈之后,几分钟后应该会收到的 Amazon SNS 电子邮件确认。
  2. 在 AWS CloudFormation 控制台中,导航到您刚刚创建的栈。
  3. 在栈的 输出 选项卡中,查找与 AssetBucketName 相关联的值;它将类似于 summary-generator-assetbucket-xxxxxxxxxxxxx
  4. 在 Amazon S3 控制台中,导航到您的资产存储桶。

这是您要上传录音的地方。有效的文件格式包括 MP3、MP4、WAV、FLAC、AMR、OGG 和 WebM。

  1. 将录音上传到 recordings 文件夹。

上传录音将自动触发 Step Functions 状态机。对于此示例,我们使用 GitHub 存储库的 sample-recording 目录中的示例团队会议录音。

  1. 在 Step Functions 控制台中,导航到 summary-generator 状态机。
  2. 选择具有状态为 正在运行 的状态机运行的名称。

在这里,您可以观察状态机处理录音的进度。

  1. 在达到 成功 状态后,您应该会收到录音的摘要邮件。

或者,您可以导航到 S3 资产存储桶并在 transcripts 文件夹中查看转录。

查看摘要

您将收到发送到您在创建 CloudFormation 栈时提供的地址的录音摘要电子邮件。如果您在几分钟内没有收到电子邮件,请确保您确认了在创建栈后应该收到的 Amazon SNS 确认电子邮件,然后重新上传录音以触发摘要处理。

此解决方案包含一个模拟的团队会议录音,您可以用来测试解决方案。摘要将类似于以下示例。由于生成式人工智能的性质,您的输出可能会有所不同,但内容应该接近。

以下是会议总结的要点:

  • Joe 完成了对任务 EDU1 当前状态的审查,并创建了一个新任务来开发未来状态。这个新任务已放入待处理任务列表中。他现在开始了 EDU2,但因为资源选择的原因而受阻。
  • Rob 基于最佳实践为 SLG1 创建了一个标签策略,但可能需要与其他已创建自己的策略的团队协调,以统一方法。已创建一个新任务来协调标签策略。
  • Rob 在为 SLG2 进行调试方面取得了进展,但可能需要额外的帮助。将此任务移至第二阶段,以便有时间获取额外的资源。

下一步:

  • Joe 在资源选择确定之前继续工作 EDU2
  • 创建新任务,将团队之间的标签策略进行协调
  • 将 SLG2 移至第二阶段
  • 从下周开始,将 Standups 迁移到周一

扩展解决方案

现在你有了一个可行的解决方案,下面是一些潜在的想法,可以根据你特定的用例来定制解决方案:

  • 尝试修改流程以适应你可用的源内容和期望的输出:
    • 对于可用的转录情况,创建一个替代的 Step Functions 工作流,以导入现有的基于文本或基于 PDF 的转录。
    • 不使用 Amazon SNS 通过电子邮件通知接收方,你可以使用它将输出发送到其他端点,例如团队协作网站或团队的聊天频道。
  • 尝试修改提供给 Amazon Bedrock 的 CloudFormation 堆栈参数,以生成适用于你的用例的特定输出(这是生成式 AI 提示):
    • 当总结公司的业绩电话时,模型可以关注潜在的有前景的机会、关注的领域和需要继续监控的事项。
    • 如果你使用它来总结一门课程讲座,模型可以识别即将发布的作业、总结关键概念、列出事实,并过滤掉录音中的闲聊。
  • 对于同一录音,为不同的受众创建不同的摘要:
    • 工程师的摘要侧重于设计决策、技术挑战和即将交付的成果。
    • 项目经理的摘要侧重于时间表、成本、交付成果和行动项。
    • 项目赞助人获得有关项目状态和升级的简要更新。
    • 对于较长的录音,尝试生成不同兴趣级别和时间承诺的摘要。例如,创建一个句子、一个段落、一页长或详细的摘要。除了提示外,您可能还需要调整 max_tokens_to_sample 参数以适应不同的内容长度。

清理

为了清理解决方案,删除之前创建的 CloudFormation 堆栈。请注意,删除堆栈不会删除资源桶。如果你不再需要录音或转录,可以单独删除此桶。Amazon Transcribe 将在 90 天后自动删除转录作业,但你也可以在此之前手动删除。

结论

在本文中,我们探讨了如何使用 Amazon Transcribe 和 Amazon Bedrock 自动生成清晰简洁的视频或音频录音摘要。我们鼓励你继续评估 Amazon Bedrock,Amazon Transcribe 和其他 AWS AI 服务,如 Amazon TextractAmazon TranslateAmazon Rekognition,以了解它们如何帮助实现你的业务目标。

Leave a Reply

Your email address will not be published. Required fields are marked *