什么是 Azure AI 语言中的语言检测功能?

语言检测是Azure AI 语言提供的功能之一,它是云中机器学习和 AI 算法的集合,用于开发涉及书面语言的智能应用程序。 语言检测能够在其主要脚本中检测超过 100 种语言。 此外,它还提供脚本检测,可根据 ISO 15924 标准针对 Azure AI 语言服务支持选定的多种语言检测每种检测语言支持的脚本。

本文档包含以下类型的文章:

  • 快速入门 介绍了入门说明,指导您完成向服务发出请求。
  • 操作指南包含以更具体的方式或自定义方式使用服务的说明。

语言检测功能

  • 语言检测:根据 ISO 15924 标准,为提交的每个文档返回一种主要语言及其 ISO 639-1 名称、人类可读名称、置信度分数、脚本名称和脚本代码。

  • 脚本检测:为了区分用于编写某些语言(如哈萨克语)的多个脚本,语言检测会根据 ISO 15924 标准返回脚本名称和脚本代码。

  • 不明确的内容处理:为了帮助根据输入消除语言歧义,可以指定 ISO 3166-1 alpha-2 国家/地区代码。 例如,“communication”一词在英语和法语中都很常见。 将文本来源指定为法国可以帮助语言检测模型确定正确的语言。

典型工作流

若要使用此功能,需要提交数据进行分析并处理应用程序中的 API 输出。 分析按原样执行,不会对数据所用的模型进行额外的自定义。

  1. 创建 Azure AI 语言资源,它会授权你访问 Azure AI 语言提供的功能。 它会生成一个密码(称为密钥)和一个终结点 URL,你将使用它们来对 API 请求进行身份验证。

  2. 使用 REST API 或 C#、Java、JavaScript 和 Python 的客户端库创建请求。 还可以使用批处理请求发送异步调用,以将多个功能的 API 请求合并到一个调用中。

  3. 发送包含文本数据的请求。 密钥和终结点将用于进行身份验证。

  4. 在本地流式处理或存储响应。

开始使用语言检测

若要使用语言检测,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过三种方式使用语言检测:

开发选项 说明
Language Studio Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站Language Studio 快速入门
REST API 或客户端库 (Azure SDK) 使用 REST API 或以各种语言提供的客户端库将语言检测集成到应用程序中。 有关详细信息,请参阅语言检测快速入门
Docker 容器 使用可用的 Docker 容器在本地部署此功能。 借助这些 Docker 容器,你能够将服务进一步引入数据,以满足合规性、安全性或其他操作目的。

后续步骤

可以通过两种方式开始使用实体链接功能:

  • Language Studio 是一个基于 Web 的平台,通过该平台,你无需编写代码即可试用多种 Azure AI 语言功能。
  • 有关使用 REST API 和客户端库 SDK 向服务发出请求的说明,请参阅快速入门文章