什么是 Azure AI 语言中的语言检测功能?
语言检测是Azure AI 语言提供的功能之一,它是云中机器学习和 AI 算法的集合,用于开发涉及书面语言的智能应用程序。 语言检测能够在其主要脚本中检测超过 100 种语言。 此外,它还提供脚本检测,可根据 ISO 15924 标准针对 Azure AI 语言服务支持选定的多种语言检测每种检测语言支持的脚本。
本文档包含以下类型的文章:
语言检测功能
语言检测:根据 ISO 15924 标准,为提交的每个文档返回一种主要语言及其 ISO 639-1 名称、人类可读名称、置信度分数、脚本名称和脚本代码。
脚本检测:为了区分用于编写某些语言(如哈萨克语)的多个脚本,语言检测会根据 ISO 15924 标准返回脚本名称和脚本代码。
不明确的内容处理:为了帮助根据输入消除语言歧义,可以指定 ISO 3166-1 alpha-2 国家/地区代码。 例如,“communication”一词在英语和法语中都很常见。 将文本来源指定为法国可以帮助语言检测模型确定正确的语言。
典型工作流
若要使用此功能,需要提交数据进行分析并处理应用程序中的 API 输出。 分析按原样执行,不会对数据所用的模型进行额外的自定义。
创建 Azure AI 语言资源,它会授权你访问 Azure AI 语言提供的功能。 它会生成一个密码(称为密钥)和一个终结点 URL,你将使用它们来对 API 请求进行身份验证。
使用 REST API 或 C#、Java、JavaScript 和 Python 的客户端库创建请求。 还可以使用批处理请求发送异步调用,以将多个功能的 API 请求合并到一个调用中。
发送包含文本数据的请求。 密钥和终结点将用于进行身份验证。
在本地流式处理或存储响应。
开始使用语言检测
若要使用语言检测,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过两种方式使用语言检测:
开发选项 | 说明 |
---|---|
Language Studio | Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站或 Language Studio 快速入门。 |
REST API 或客户端库 (Azure SDK) | 使用 REST API 或以各种语言提供的客户端库将语言检测集成到应用程序中。 有关详细信息,请参阅语言检测快速入门。 |
Docker 容器 | 使用可用的 Docker 容器在本地部署此功能。 借助这些 Docker 容器,你能够将服务进一步引入数据,以满足合规性、安全性或其他操作目的。 |
后续步骤
可以通过两种方式开始使用实体链接功能:
- Language Studio 是一个基于 Web 的平台,通过该平台,你无需编写代码即可试用多种 Azure AI 语言功能。
- 有关使用 REST API 和客户端库 SDK 向服务发出请求的说明,请参阅快速入门文章。