Press "Enter" to skip to content

使用Amazon Translate实时翻译文档

业务成功的关键组成部分是与客户建立联系。如今,企业希望通过实时提供多种语言的内容来与客户建立联系。对于大多数客户而言,内容创建过程与将内容翻译成多种目标语言的本地化工作是分离的。这些分离的流程延迟了企业同时发布多种语言的内容的能力,抑制了他们的推广努力,从而对上市时间和收入产生了负面影响。

Amazon Translate是一种神经机器翻译服务,可提供快速、高质量和实惠的语言翻译。现在,Amazon Translate提供实时文档翻译,以无缝地集成和加速内容创建和本地化。您可以从AWS管理控制台、AWS命令行界面(AWS CLI)或AWS SDK提交文档,并在保持原始文档格式的同时实时接收翻译后的文档。此功能消除了等待以异步批处理模式翻译文档的时间。

实时文档翻译目前支持纯文本和HTML文档。您可以在实时文档翻译中使用其他Amazon Translate功能,如自定义术语表、亵渎掩盖和形式化。

在本文中,我们将向您展示如何使用这个新功能。

解决方案概述

本文介绍了使用控制台、AWS CLI和Amazon Translate SDK使用实时文档翻译所需的步骤。作为示例,我们将把这个样本文本文件从英语翻译成法语。

通过控制台使用Amazon Translate

按照以下步骤在控制台上尝试实时文档翻译:

  1. 在Amazon Translate控制台中,选择导航窗格中的实时翻译
  2. 选择文档选项卡。
  3. 指定源文件的语言为英语。
  4. 指定目标文件的语言为法语。

注意:实时文档翻译的源语言或目标语言应为英语。

  1. 选择选择文件并上传要翻译的文件。
  2. 指定文档类型。

在本文撰写时,支持文本和HTML格式。

  1. 其他设置下,您可以在实时文档翻译中与其他Amazon Translate功能结合使用。 使用Amazon Translate实时翻译文档 AI 新闻 第1张

有关Amazon Translate功能的更多信息,请参见以下资源:

    • 自定义术语表 – 自定义Amazon Translate输出,以满足您的域和组织特定的词汇表
    • 形式化 – 选择翻译文本的正式或非正式形式
    • 亵渎掩盖 – 在Amazon Translate中应用亵渎掩盖
  1. 选择翻译并下载

翻译后的文件会自动保存到您的浏览器下载文件夹中,通常是下载文件夹。目标语言代码将作为翻译后文件名的前缀。例如,如果您的源文件名为lang.txt,目标语言为法语(fr),那么翻译后的文件将被命名为fr.lang.txt

使用Amazon Translate实时翻译文档 AI 新闻 第2张

使用AWS CLI使用Amazon Translate

您可以使用以下AWS CLI命令翻译文件的内容。在本示例中,将把source-lang.txt的内容翻译成target-lang.txt

aws translate translate-document --source-language-code en --target-language es 
--document-content fileb://source-lang.txt 
--document ContentType=text/plain 
--query "TranslatedDocument.Content" 
--output text | base64 
--decode > target-lang.txt

使用Amazon Translate SDK(Python Boto3)

您可以使用以下Python代码调用Amazon Translate SDK API来同步翻译文本或HTML文档:

import boto3
import argparse

# 初始化解析器
parser = argparse.ArgumentParser()
parser.add_argument("SourceLanguageCode")
parser.add_argument("TargetLanguageCode")
parser.add_argument("SourceFile")
args = parser.parse_args()


translate = boto3.client('translate’)

localFile = args.SourceFile
file = open(localFile, "rb")
data = file.read()
file.close()


result = translate.translate_document(
    Document={
            "Content": data,
            "ContentType": "text/html"
        },
    SourceLanguageCode=args.SourceLanguageCode,
    TargetLanguageCode=args.TargetLanguageCode
)
if "TranslatedDocument" in result:
    fileName = localFile.split("/")[-1]
    tmpfile = f"{args.TargetLanguageCode}-{fileName}"
    with open(tmpfile,  'w', encoding='utf-8') as f:
     
    f.write(str(result["TranslatedDocument"]["Content"]))

    print("Translated document ", tmpfile)

该程序接受三个参数:源语言、目标语言和文件路径。使用以下命令调用此程序:

python syncDocumentTranslation.py en es source-lang.txt

结论

Amazon Translate中的实时文档翻译功能可以通过与内容创建和本地化的轻松集成来加快上市时间。实时文档翻译改善了内容创建和本地化过程。

有关Amazon Translate的更多信息,请访问Amazon Translate资源,以查找视频资源和博客文章,并参考AWS Translate常见问题解答。

Leave a Reply

Your email address will not be published. Required fields are marked *