Press "Enter" to skip to content

利用生成式人工智能增强AWS智能文档处理

对于处理大量文档的组织来说,数据分类、提取和分析可能具有挑战性。传统的文档处理解决方案是手动的、昂贵的、容易出错的,而且很难扩展。AWS智能文档处理(IDP)通过使用Amazon Textract等人工智能(AI)服务,让您能够利用行业领先的机器学习(ML)技术,快速准确地处理来自任何扫描文档或图像的数据。生成式人工智能(生成式AI)与Amazon Textract相辅相成,进一步自动化文档处理工作流。通过对关键字段进行规范化和对输入数据进行汇总等功能,支持更快速地管理文档处理工作流周期,同时减少错误的可能性。

生成式AI由称为基础模型(FMs)的大型ML模型驱动。FMs正在改变您解决传统复杂文档处理工作负载的方式。除了现有的功能外,企业还需要总结特定类别的信息,包括从财务报告和银行对账单等文档中提取的借方和贷方数据。FMs使得从提取的数据中生成这样的洞察变得更加容易。为了优化人工审核所花费的时间并提高员工的工作效率,可以以自动化的方式标记电话号码中缺失的数字、缺少文档或没有街道号码的地址等错误。在当前情况下,您需要投入资源来完成这些任务,使用人工审核和复杂脚本。这种方法繁琐且昂贵。FMs可以帮助更快地完成这些任务,使用更少的资源,并将不同的输入格式转换为可进一步处理的标准模板。在AWS上,我们提供了诸如Amazon Bedrock之类的服务,它是使用FMs构建和扩展生成式AI应用程序的最简单方法。Amazon Bedrock是一个完全托管的服务,通过API提供来自领先AI初创公司和亚马逊的FMs,因此您可以找到最适合您要求的模型。我们还提供Amazon SageMaker JumpStart,它允许ML从业者从广泛的开源FMs中进行选择。ML从业者可以从网络隔离的环境中部署FMs到专用的Amazon SageMaker实例,并使用SageMaker自定义模型进行模型训练和部署。

Ricoh提供的工作场所解决方案和数字化转型服务旨在帮助客户管理和优化业务中的信息流。Ashok Shenoy,产品组解决方案开发副总裁表示:“我们正在将生成式AI添加到我们的IDP解决方案中,通过利用问答、汇总和标准输出等新功能,帮助我们的客户更快速、更准确地完成工作。AWS使我们能够利用生成式AI,同时保持每个客户的数据分离和安全。”

在本文中,我们将分享如何使用生成式AI来增强您在AWS上的IDP解决方案。

改进IDP流程

在本节中,我们将回顾如何通过FMs来增强传统的IDP流程,并通过使用Amazon Textract与FMs的示例用例进行演示。

AWS IDP由三个阶段组成:分类、提取和增强。有关每个阶段的详细信息,请参阅使用AWS AI服务进行智能文档处理:第1部分和第2部分。在分类阶段,FMs现在可以在没有额外训练的情况下对文档进行分类。这意味着即使模型以前没有看到类似的示例,也可以对文档进行分类。在提取阶段,FMs规范化日期字段,验证地址和电话号码,并确保一致的格式。在增强阶段,FMs允许推理、逻辑推理和汇总。当您在每个IDP阶段使用FMs时,您的工作流程将更加流畅,性能将得到提升。下图说明了具有生成式AI的IDP流程。

利用生成式人工智能增强AWS智能文档处理 四海 第1张

IDP流程的提取阶段

当FMs无法直接处理原生格式的文档(如PDF、img、jpeg和tiff)作为输入时,需要一种将文档转换为文本的机制。在将文档发送给FMs之前从文档中提取文本,您可以使用Amazon Textract。使用Amazon Textract,您可以提取行和单词,并将它们传递给下游的FMs。下图使用Amazon Textract从任何类型的文档中准确提取文本,然后将其发送给FMs进行进一步处理。

利用生成式人工智能增强AWS智能文档处理 四海 第2张

通常,文档由结构化和半结构化信息组成。Amazon Textract 可用于从表格和表单中提取原始文本和数据。表格和表单中的数据关系在自动化业务流程中起着至关重要的作用。某些类型的信息可能无法由 FMs 处理。因此,我们可以选择将此信息存储在下游存储中,或将其发送到 FMs。下图是 Amazon Textract 如何从文档中提取结构化和半结构化信息以及需要由 FMs 处理的文本行的示例。

利用生成式人工智能增强AWS智能文档处理 四海 第3张

使用 AWS 无服务器服务以 FMs 进行摘要

我们之前所示的 IDP 管道可以无缝地使用 AWS 无服务器服务进行自动化。大型企业通常使用高度非结构化的文档。这些文档可以跨越银行业的证券交易委员会 (SEC) 文件到健康保险业的覆盖文件。随着 AWS 中生成性 AI 的发展,这些行业的人们正在寻找以自动化和成本效益的方式从这些文档中获取摘要的方法。无服务器服务可帮助快速构建 IDP 解决方案的机制。例如,AWS Lambda、AWS Step Functions 和 Amazon EventBridge 等服务可帮助构建与 FMs 集成的文档处理管道,如下图所示。

利用生成式人工智能增强AWS智能文档处理 四海 第4张

前面架构中使用的示例应用程序是由事件驱动的。事件定义为最近发生的状态变化。例如,当对象上传到 Amazon Simple Storage Service (Amazon S3) 存储桶时,Amazon S3 会触发对象创建事件。来自 Amazon S3 的此事件通知可以触发 Lambda 函数或 Step Functions 工作流。这种类型的架构被称为事件驱动架构。在本文中,我们的示例应用程序使用事件驱动架构处理示例医疗出院文件并摘要文档的详细信息。工作流程如下:

  1. 当文档上传到 S3 存储桶时,Amazon S3 触发对象创建事件。
  2. EventBridge 默认事件总线基于 EventBridge 规则将事件传播到 Step Functions。
  3. 状态机工作流程从 Amazon Textract 开始处理文档。
  4. Lambda 函数将分析的数据转换为下一步所需的格式。
  5. 状态机调用 SageMaker 端点,使用直接的 AWS SDK 集成来托管 FM。
  6. 摘要 S3 目标存储桶接收从 FM 收集的摘要响应。

我们使用了具有 flan-t5 Hugging face 模型的示例应用程序,使用 Step Functions 工作流程对以下示例患者出院摘要进行摘要。

利用生成式人工智能增强AWS智能文档处理 四海 第5张

Step Functions 工作流程使用 AWS SDK 集成来调用 Amazon Textract AnalyzeDocument 和 SageMaker runtime InvokeEndpoint API,如下图所示。

利用生成式人工智能增强AWS智能文档处理 四海 第6张

该工作流程将结果摘要的 JSON 对象存储在目标存储桶中。JSON 对象如下所示:

{
  "summary": [
    "John Doe 是一名35岁的男性,他已经患有胃部问题两个月了。他在过去两周里一直在服用抗生素,但他的食量不大。他一直感到腹部疼痛、胀气和疲劳。他还注意到他的大便颜色发生了变化,现在更加深色。他一直在服用抗酸药物两周,但它们不再起作用。他一直感到非常疲劳,并且已经两周不能工作了。他还一直感到腹部疼痛、胀气和疲劳。他一直在服用抗酸药物两周,但它们不再起作用。他一直感到腹部疼痛、胀气和疲劳。他一直在服用抗酸药物两周,但它们不再起作用。他一直感到腹部疼痛、胀气和疲劳。他一直在服用抗酸药物两周,但它们不再起作用。他一直感到腹部疼痛、胀气和疲劳。他一直在服用抗酸药物两周,但它们不再起作用。"
  ],
  "forms": [
    {
      "key": "电话:",
      "value": "(888)-(999)-(0000) "
    },
    {
      "key": "传真:",
      "value": "(888)-(999)-(1111) "
    },
    {
      "key": "患者姓名:",
      "value": "John Doe "
    },
    {
      "key": "患者 ID:",
      "value": "NARH-36640 "
    },
    {
      "key": "性别:",
      "value": "男性 "
    },
    {
      "key": "主治医师:",
      "value": "Mateo Jackson, 博士 "
    },
    {
      "key": "入院日期:",
      "value": "2020年9月7日 "
    },
    {
      "key": "出院日期:",
      "value": "2020年9月8日 "
    },
    {
      "key": "出院去向:",
      "value": "带有支持服务的家庭 "
    },
    {
      "key": "影响住院的既往/现有疾病情况:",
      "value": "35 岁男性,两个月来一直有胃部问题。患者报告发作性上腹疼痛,不放射。疼痛被描述为刺痛和灼烧感,间歇性持续1-2小时,并且越来越严重。抗酸药物曾用于缓解疼痛,但现在无效;没有任何加重疼痛的因素。疼痛与白天时间或进餐无关。患者否认便秘或腹泻。患者否认大便中有血液,但注意到大便变得更加深色。患者还报告恶心。否认最近病情或发热。他还报告疲劳已有2周,并且饭后腹胀。ROS:除上述发现外,均为阴性。药物:Motrin每周一次。之前使用 Tums。PMHx:背痛和肌肉痉挛。无手术史。NKDA。FHx:叔叔有出血性溃疡。社交史:15岁开始吸烟,每天半包到一包。最近没有饮酒。否认非法药物使用。从事高海拔建筑工作。快餐饮食。每周运动3-4次,但在2周前停止。"
    },
    {
      "key": "摘要:",
      "value": "建议限制某些活动,完成全程抗生素治疗,与医生回访以防复发,严格控制饮食 "
    }
  ]
 }

使用无服务器实现的IDP来生成这些摘要,可以帮助组织以经济高效的方式获得有意义、简洁和可呈现的数据。Step Functions不限制一次只能处理一个文档的方法。其分布式映射功能可以按计划摘要大量文档。

示例应用程序使用了一个flan-t5 Hugging Face模型;但是,您可以使用您选择的FM端点。训练和运行模型不在示例应用程序的范围内。请按照GitHub存储库中的说明部署示例应用程序。上述架构是如何使用Step Functions编排IDP工作流程的指南。有关使用AWS AI服务和FM构建应用程序的详细说明,请参阅IDP生成AI研讨会。

设置解决方案

按照README文件中的步骤设置解决方案架构(但不包括SageMaker端点)。在您拥有自己的SageMaker端点后,可以将端点名称作为参数传递给模板。

清理

为了节省成本,请删除教程的一部分部署的资源:

  1. 按照README文件中的清理部分的步骤进行操作。
  2. 从您的S3存储桶中删除任何内容,然后通过Amazon S3控制台删除存储桶。
  3. 通过SageMaker控制台删除可能已创建的任何SageMaker端点。

结论

生成AI正在改变您使用IDP处理文档以获取洞察力的方式。AWS AI服务(如Amazon Textract)以及AWS FM可以帮助准确处理任何类型的文档。有关在AWS上使用生成AI的更多信息,请参阅Announcing New Tools for Building with Generative AI on AWS。

Leave a Reply

Your email address will not be published. Required fields are marked *