通过“文档翻译”使用术语表

术语表是术语列表,包含为“文档翻译”服务创建的定义,以供在翻译过程中使用。 目前,术语表功能支持一对一源语言到目标语言的翻译。 术语表的常见用例包括:

  • 特定于上下文的术语。 创建术语表,为独特的上下文指定特定的含义。

  • 无翻译。 例如,可以通过使用具有相同源文本和目标文本的术语表来限制文档翻译来翻译产品名称品牌。

  • 歧义词的指定翻译。 为多义词选择特定翻译​。

创建、上传和使用术语表文件

  1. 创建术语表文件。 以支持的格式(最好是制表符分隔值)创建文件,其中包含要在翻译中使用的所有术语和短语。

    若要检查文件格式是否受支持,请参阅获取支持的词汇表格式

    以下英语源术语表包含的单词根据上下文的不同可能具有不同的含义。 术语表提供了文件中每个单词的预期翻译,以帮助确保准确度。

    例如,当单词 Bank 出现在金融文档中时,应该进行翻译以反映其金融含义。 如果单词 Bank 出现在地理文档中,它可能指的是海岸,以反映其地形意义。 同样,单词 Crane 既可以指鸟,也可以指机器。

    示例术语表 .tsv 文件: 英语-法语

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. 将术语表上传到 Azure 存储。 要完成此步骤,需要具有容器Azure Blob 存储帐户,以便在存储帐户中存储和组织 Blob 数据。

  3. 在翻译请求中指定术语表。glossary URLformatversion 包含在 POST 请求中:

     {
         "inputs": [
             {
                 "source": {
                     "sourceUrl": "https://my.blob.core.chinacloudapi.cn/source-en"
                 },
                 "targets": [
                     {
                          "targetUrl": "https://my.blob.core.chinacloudapi.cn/target-fr",
                         "language": "fr",
                         "glossaries": [
                             {
                                 "glossaryUrl": "https://my.blob.core.chinacloudapi.cn/glossaries/en-fr.tsv",
                                 "format": "tsv"
                             }
                         ]
    
                     }
                 ]
             }
         ]
     }
    

    注意

    该示例使用了已启用的系统分配托管标识存储 Blob 数据参与者 角色分配进行授权。 有关详细信息,请参阅用于文档翻译的托管标识

事例敏感性

默认情况下,Azure AI 翻译服务 API 区分大小写,这表示它根据大小写匹配源文本中的术语。

  • 句子部分的应用。 当术语表应用于句子的部分时,文档翻译 API 会检查术语表术语是否与源文本中的大小写匹配。 如果大小写不匹配,则不应用术语表。

  • 完整句子的应用。 当术语表应用于完整的句子时,服务将不区分大小写。 它与术语表术语相匹配,而不考虑其在源文本中的大小写。 此预配可将正确的结果应用于涉及习语和引述的用例。

后续步骤

请尝试使用文档翻译操作指南,使用选择的编程语言异步翻译整个文档: