Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
文档翻译是一种基于云的机器翻译功能,Azure Translator。 跨所有 支持的语言和数据方言 翻译多个复杂文档,同时保留原始文档结构和数据格式。 文档翻译 API 支持两种翻译流程:
异步批量翻译支持处理多个文档和大型文件。 批处理翻译过程需要一个Azure Blob 存储帐户,其中包含源文档和已翻译文档的存储容器。
同步处理单个文件支持单个文件的翻译工作。 文件转换过程不需要Azure Blob 存储帐户。 最终响应包含翻译后的文档,会直接返回给调用客户端。
先决条件
异步批处理翻译先决条件
在开始之前,你需要:
- 活动的 Azure 订阅。
- 翻译器资源。 有关资源创建和终结点/密钥检索步骤,请参阅 以编程方式使用文档翻译 API。
- 具有源容器和目标容器的Azure Blob Storage帐户。 有关设置指南,请参阅 创建Azure Blob Storage容器。
- 授权访问存储 URL 的方法:
同步翻译先决条件
在开始之前,你需要:
- 活动的 Azure 订阅。
- 具有自定义域终结点的翻译器资源。 有关设置和终结点/密钥检索,请参阅 以编程方式使用文档翻译 API。
小窍门
将订阅密钥存储在安全位置(如 Azure Key Vault),并避免将密钥置于源代码管理中。
主要功能
| 功能 | 说明 |
|---|---|
| 翻译大型文件 | 异步翻译整个文档。 |
| 翻译大量文件 | 在保留文档结构和数据格式的同时,翻译所有支持的语言和方言的多个文件。 |
| 翻译图像文件格式(预览版) 🆕 | • 在保持原始设计和布局的同时翻译图像中的文本。 • 支持的格式: .jpeg、、.png、 .bmp.webp• 定价:按每张图像计算。 有关详细信息,请参阅定价。 |
| 翻译Word文档文件(.docx)中的图像文本。 | 此功能适用于用于文件格式的.docx API。 |
| 保留源文件显式 | 在保留原始布局和格式的同时翻译文件。 |
| 应用自定义词汇表 | 使用自定义词汇表翻译文档。 |
| 自动检测文档语言 | 让文档翻译服务确定文档的语言。 |
| 翻译包含多种语言的文档内容 | 使用自动检测功能,将包含多种语言的文档翻译成目标语言。 |
文档翻译的工作原理
文档翻译支持两个工作流。 选择与方案匹配的方法。
异步(批处理)
- 将源文档上传到源容器。
- 提交批处理翻译请求。
- 监视作业和文档状态。
- 从目标容器下载已翻译的文档。
有关详细的请求/响应流,请参阅 文档翻译 REST API 参考指南。
同步
- 发送包含一个文档(和可选术语表)的请求。
- 在响应中接收翻译的文档。
有关请求详细信息和示例,请参阅 同步文档翻译。
开发选项
使用以下开发选项将文档翻译添加到项目和应用程序。
使用异步工作流翻译多个文档和大型文件。
| 发展选项 | 说明 |
|---|---|
| REST API | REST API 是一个与语言无关的接口,可用于创建 HTTP 请求和授权标头来翻译文档。 |
| 客户端库(SDK) | 客户端库(SDK)是特定于语言的类、对象、方法和代码,可通过在项目中添加引用来快速使用。 目前,文档翻译支持 C#/.NET 和 Python。 |
支持的文档和术语表格式
下表列出了每个翻译方法支持的文档和术语表文件格式。
批处理文档支持的格式
Get 支持的文档格式方法返回文档翻译服务支持的文档格式列表。 该列表包括常见的文件扩展名和内容类型。
| 文件类型 | 文件扩展名 | 说明 |
|---|---|---|
| Adobe PDF | pdf |
可移植文档文件格式。 文档翻译使用光学字符识别(OCR)技术提取和翻译扫描的 PDF 文档中的文本,同时保留原始布局。 |
| 逗号分隔值 | csv |
电子表格程序使用的且以逗号分隔的原始数据文件。 |
| HTML |
html、htm |
超文本标记语言。 |
| 图片(2025-12-01-preview) |
.jpeg、.png、.bmp、.webp |
存储数字图像数据的文件。 |
| OpenDocument 演示文稿 | odp |
一个开源演示文稿文件。 |
| OpenDocument 电子表格 | ods |
一个开源电子表格文件。 |
| OpenDocument 文本文档 | odt |
一个开源文本文档文件。 |
| Markdown |
markdown、mdown、mkdn、md、mkd、mdwn、mdtxt、mdtext、rmd |
用于创建带格式文本的轻型标记语言。 |
| MHTML |
mhtml、mht |
一种网页存档格式,用于组合 HTML 代码及其配套资源。 |
| Microsoft Excel |
xls、xlsx |
用于数据分析和文档的电子表格文件。 |
| Microsoft Outlook | msg |
在Microsoft Outlook中创建或保存的电子邮件。 |
| Microsoft PowerPoint |
ppt、pptx |
用于以幻灯片格式显示内容的演示文稿文件。 |
| Microsoft Word |
doc、docx |
文本文件。 |
| RTF 格式 | rtf |
包含格式的文本文档。 |
| 制表符分隔值/TAB | tsv/tab |
电子表格程序使用的且以制表符分隔的原始数据文件。 |
| 文本 | txt |
无格式的文本文档。 |
| XLIFF | xlf |
翻译和本地化中使用的并行文档格式。 |
批量处理旧版文件类型
在文档翻译过程中保留源文件类型,但存在以下例外:
| 源文件扩展名 | 翻译后的文件扩展名 |
|---|---|
| .doc、.odt、.rtf | .docx |
| .xls、.ods | .xlsx |
| .ppt、.odp | .pptx |
批处理术语表支持的格式
文档翻译支持以下术语表文件类型:
| 文件类型 | 文件扩展名 | 说明 |
|---|---|---|
| 逗号分隔值 | csv |
电子表格程序使用的且以逗号分隔的原始数据文件。 |
| XLIFF | xlf |
翻译和本地化中使用的并行文档格式。 |
| 制表符分隔值/TAB |
tsv、tab |
电子表格程序使用的且以制表符分隔的原始数据文件。 |
文档翻译请求限制
有关翻译器请求限制的详细信息,请参阅 文档翻译请求限制。
故障排除
使用以下检查诊断常见问题。
批量翻译
- 如果翻译的文件未显示在目标容器中,请使用 特定翻译作业的“获取状态 ”检查作业状态,并使用 特定文档的“获取”状态检查作业状态。
- 如果服务无法读取或写入存储容器,请确认存储授权:
- 如果使用 SAS 令牌,请参阅 为存储容器和 Blob 创建共享访问签名(SAS)令牌。
- 如果使用托管标识,请参阅 “创建和使用托管标识”。
- 如果作业因输入不受支持而失败,请使用 “获取支持的文档格式”确认格式。