Condividi tramite

什么是 Azure 翻译器文档翻译?

文档翻译是 Azure Translator 的基于云的机器翻译功能。 可以跨所有支持的语言和方言翻译多个复杂文档,同时保留原始文档结构和数据格式。 文档翻译 API 支持两种翻译流程:

  • 异步批量翻译支持处理多个文档和大型文件。 批量翻译过程需要一个 Azure Blob 存储帐户,其中包含源文档和翻译文档的存储容器。

  • 同步处理单个文件支持单个文件的翻译工作。 文件翻译过程不需要 Azure Blob 存储帐户。 最终响应包含翻译后的文档,会直接返回给调用客户端。

先决条件

异步批处理翻译先决条件

在开始之前,你需要:

同步翻译先决条件

在开始之前,你需要:

小窍门

将订阅密钥存储在安全位置(例如 Azure Key Vault),并避免将密钥置于源代码管理中。

主要功能

功能 说明
翻译大型文件 异步翻译整个文档。
翻译大量文件 在保留文档结构和数据格式的同时,翻译所有支持的语言和方言的多个文件。
翻译图像文件格式(预览版) 🆕 在保持原始设计和布局的同时翻译图像中的文本
支持的格式.jpeg、、.png.bmp.webp
定价:按图像计算。 有关详细信息, 请参阅定价
在 Word 文档文件中翻译图像文本(.docx)。 此功能适用于用于文件格式的.docx API。
保留源文件显式 在保留原始布局和格式的同时翻译文件。
应用自定义词汇表 使用自定义词汇表翻译文档。
自动检测文档语言 让文档翻译服务确定文档的语言。
翻译包含多种语言的文档内容 使用自动检测功能,将包含多种语言的文档翻译成目标语言。

文档翻译的工作原理

异步(批处理)

  1. 将源文档上传到源容器。
  2. 提交批处理翻译请求。
  3. 监视作业和文档状态。
  4. 从目标容器下载已翻译的文档。

有关详细的请求/响应流,请参阅 文档翻译 REST API 参考指南

同步

  1. 发送包含一个文档(和可选术语表)的请求。
  2. 在响应中接收翻译的文档。

有关请求详细信息和示例,请参阅 同步文档翻译

开发选项

使用以下开发选项将文档翻译添加到项目和应用程序。

注释

Microsoft Foundry 目前仅支持同步(单文件)文档翻译。 使用 REST API 或客户端库进行异步批处理文档翻译。

使用异步工作流翻译多个文档和大型文件。

发展选项 说明
REST API REST API 是一个与语言无关的接口,可用于创建 HTTP 请求和授权标头来翻译文档。
客户端库(SDK) 客户端库(SDK)是特定于语言的类、对象、方法和代码,可通过在项目中添加引用来快速使用。 目前,文档翻译对 C#/.NETPython 具有编程语言支持。

支持的文档和术语表格式

批处理文档支持的格式

Get 支持的文档格式方法返回文档翻译服务支持的文档格式列表。 该列表包括常见的文件扩展名和内容类型。

文件类型 文件扩展名 说明
Adobe PDF pdf 可移植文档文件格式。 文档翻译使用光学字符识别(OCR)技术提取和翻译扫描的 PDF 文档中的文本,同时保留原始布局。
逗号分隔值 csv 电子表格程序使用的且以逗号分隔的原始数据文件。
HTML htmlhtm 超文本标记语言。
图片(2025-12-01-preview) .jpeg.png.bmp.webp 存储数字图像数据的文件。
OpenDocument 演示文稿 odp 一个开源演示文稿文件。
OpenDocument 电子表格 ods 一个开源电子表格文件。
OpenDocument 文本文档 odt 一个开源文本文档文件。
Markdown markdownmdownmkdnmdmkdmdwnmdtxtmdtextrmd 用于创建带格式文本的轻型标记语言。
MHTML mhtmlmht 一种网页存档格式,用于组合 HTML 代码及其配套资源。
Microsoft Excel xlsxlsx 用于数据分析和文档的电子表格文件。
Microsoft Outlook msg 在 Microsoft Outlook 中创建或保存的电子邮件。
Microsoft PowerPoint pptpptx 用于以幻灯片格式显示内容的演示文稿文件。
Microsoft Word docdocx 文本文件。
RTF 格式 rtf 包含格式的文本文档。
制表符分隔值/TAB tsv/tab 电子表格程序使用的且以制表符分隔的原始数据文件。
文本 txt 无格式的文本文档。
XLIFF xlf 翻译和本地化中使用的并行文档格式。

批量处理旧版文件类型

在文档翻译过程中保留源文件类型,但存在以下例外

源文件扩展名 翻译后的文件扩展名
.doc、.odt、.rtf .docx
.xls、.ods .xlsx
.ppt、.odp .pptx

批处理术语表支持的格式

文档翻译支持以下术语表文件类型:

文件类型 文件扩展名 说明
逗号分隔值 csv 电子表格程序使用的且以逗号分隔的原始数据文件。
XLIFF xlf 翻译和本地化中使用的并行文档格式。
制表符分隔值/TAB tsvtab 电子表格程序使用的且以制表符分隔的原始数据文件。

文档翻译请求限制

有关 Azure 翻译器请求限制的详细信息, 请参阅文档翻译请求限制

后续步骤

在本快速入门中,你将了解如何开始使用批处理和同步翻译。