Lire en anglais
创建 CLU 微调任务
通过本文了解如何设置这些要求并创建项目。
先决条件
创建“语言”资源
在开始使用对话语言理解(CLU)之前,需要一个 Azure AI 语言资源。
注释
需要为资源组分配“所有者”角色才能创建语言资源。
从 Azure 门户创建新资源
登录到 Azure 门户 以创建新的 Azure 语言资源。
选择“创建新资源”。
在出现的窗口中,搜索 语言。
选择 创建。
创建包含以下信息的语言资源:
| 实例详细信息 |
所需的值 |
| 区域 |
语言资源支持的区域之一。 |
| 名称 |
语言资源所需的名称。 |
| 定价等级 |
语言资源支持的定价层之一。 |
通过 Language Studio 创建新语言资源
如果是首次登录,可以在 Language Studio 中看到一个窗口,可用于选择现有语言资源或创建新的语言资源。 还可以通过在右上角选择设置图标,选择 “资源”,然后选择“ 创建新资源”来创建资源。
创建包含以下信息的语言资源:
| 实例详细信息 |
所需的值 |
| Azure 订阅 |
您的 Azure 订阅。 |
| Azure 资源组 |
你的 Azure 资源组。 |
| Azure 资源名称 |
你的语言资源名称。 |
| 位置 |
语言资源支持的区域。 |
| 定价等级 |
您的语言资源支持的定价层级。 |
重要
- 创建语言资源时,请确保启用托管标识。
- 阅读并确认负责任 AI 声明。
登录到 Language Studio
访问Language Studio并使用您的 Azure 帐户登录。
在出现的“选择语言资源”窗口中,找到你的 Azure 订阅,然后选择你的语言资源。 如果没有资源,可新建一个。
| 实例详细信息 |
所需的值 |
| Azure 订阅 |
您的 Azure 订阅。 |
| Azure 资源组 |
你的 Azure 资源组名称。 |
| Azure 资源名称 |
你的 Azure 资源名称。 |
| 位置 |
语言资源支持的区域之一。 例如中国北部 2。 |
| 定价等级 |
语言资源的有效定价层之一。 可以使用免费 (F0) 层级来试用该服务。 |
创建对话项目
创建语言资源后,创建 CLU 项目。
在 Language Studio 中,找到名为 “了解问题和对话语言 ”的部分,然后选择“ 对话语言理解”。
当 对话语言理解项目 页面打开时,选择“ 创建新项目”。
若要创建新项目,请提供以下信息:
| 价值 |
DESCRIPTION |
| 名称 |
项目名称。 创建后,无法更改名称。 |
| DESCRIPTION |
可选项目说明。 |
| 语句主要语言 |
项目的主要语言。 训练数据应主要使用此语言。 |
| 启用多种语言 |
是否要让项目同时支持 多种语言 。 |
完成后,选择“ 创建”。 现在应会看到项目的 “入门” 登陆页面。
使用以下 URL、标头和 JSON 正文提交一个PATCH请求,以创建一个新项目。
请求的 URL
创建 API 请求时,请使用以下 URL。 将占位符中的值替换为您自己的值。
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}?api-version={API-VERSION}
| 占位符 |
价值 |
示例: |
{ENDPOINT} |
用于对 API 请求进行身份验证的终结点。 |
https://<your-custom-subdomain>.cognitiveservices.azure.cn |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
myProject |
{API-VERSION} |
要调用的 API 的版本。 |
2023-04-01 |
使用以下标头对请求进行身份验证。
| 密钥 |
价值 |
Ocp-Apim-Subscription-Key |
资源的键。 用于对 API 请求进行身份验证。 |
Content-Type |
application/merge-patch+json |
身体
使用以下示例 JSON 作为正文。
{
"projectName": "{PROJECT-NAME}",
"language": "{LANGUAGE-CODE}",
"projectKind": "Conversation",
"description": "Project description",
"multilingual": true
}
| 密钥 |
占位符 |
价值 |
示例: |
projectName |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
EmailApp |
language |
{LANGUAGE-CODE} |
一个字符串,用于指定项目中所用语句的语言代码。 如果你的项目是多语言项目,请选择大多数话语 的语言代码 。 |
en-us |
multilingual |
true |
一个布尔值,可用于在数据集中使用多种语言的文档。 部署模型后,可以使用任何受支持的语言查询模型(不一定包含在训练文档中)。 若要了解有关多语言支持的详细信息,请参阅 语言支持。 |
true |
导入项目
可以随时将 CLU 项目导出为 JSON 文件。 在对话项目页上,选择一个项目,然后在顶部菜单中选择“ 导出”。
可以将该项目重新导入为新项目。 如果导入完全同名的项目,将用新导入项目的数据替换项目的数据。
如果有现有的语言理解(LUIS)应用程序,可以直接将 LUIS 应用程序 JSON 导入 CLU。 它创建一个对话项目,其中包含当前可用的所有部分:意向、机器学习实体和言语。 有关详细信息,请参阅从语言理解(LUIS)迁移到对话语言理解(CLU)。
若要导入项目,请选择 “创建新项目 ”旁边的箭头按钮,然后选择“ 导入”。 然后选择 LUIS 或 CLU JSON 文件。
可以将 CLU JSON 导入服务。
使用以下 URL、标头和 JSON 正文提交 POST 请求,以导入项目。
请求的 URL
创建 API 请求时,请使用以下 URL。 将占位符中的值替换为您自己的值。
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:import?api-version={API-VERSION}
| 占位符 |
价值 |
示例: |
{ENDPOINT} |
用于对 API 请求进行身份验证的终结点。 |
https://<your-custom-subdomain>.cognitiveservices.azure.cn |
{PROJECT-NAME} |
项目名称。 此值区分大小写,必须与要导入的 JSON 文件中的项目名称匹配。 |
EmailAppDemo |
{API-VERSION} |
要调用的 API 的版本 。 |
2023-04-01 |
使用以下标头对请求进行身份验证。
| 密钥 |
价值 |
Ocp-Apim-Subscription-Key |
资源的键。 用于对 API 请求进行身份验证。 |
身体
所发送的 JSON 正文类似于以下示例。 有关 JSON 对象的详细信息,请参阅 参考文档。
{
"projectFileVersion": "{API-VERSION}",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "Conversation",
"settings": {
"confidenceThreshold": 0.7
},
"projectName": "{PROJECT-NAME}",
"multilingual": true,
"description": "Trying out CLU",
"language": "{LANGUAGE-CODE}"
},
"assets": {
"projectKind": "Conversation",
"intents": [
{
"category": "intent1"
},
{
"category": "intent2"
}
],
"entities": [
{
"category": "entity1"
}
],
"utterances": [
{
"text": "text1",
"dataset": "{DATASET}",
"intent": "intent1",
"entities": [
{
"category": "entity1",
"offset": 5,
"length": 5
}
]
},
{
"text": "text2",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"intent": "intent2",
"entities": []
}
]
}
}
| 密钥 |
占位符 |
价值 |
示例: |
{API-VERSION} |
要调用的 API 的版本 。 |
2023-04-01 |
|
projectName |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
EmailAppDemo |
language |
{LANGUAGE-CODE} |
一个字符串,用于指定项目中所用语句的语言代码。 如果你的项目是多语言项目,请选择大多数话语 的语言代码 。 |
en-us |
multilingual |
true |
一个布尔值,可用于在数据集中使用多种语言的文档。 部署模型后,可以使用任何 受支持的语言查询模型,包括训练文档中不包含的语言。 |
true |
dataset |
{DATASET} |
有关如何将数据分割成测试集和训练集的信息,请参阅 在 Foundry 中标记语句。 此字段的可能值为 Train 和 Test. |
Train |
成功请求后,API 响应包含 URL operation-location 标头,可用于检查导入作业的状态。 标头的格式如下例所示:
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}
导出项目
可以随时将 CLU 项目导出为 JSON 文件。 在对话项目页上,选择一个项目,然后选择“ 导出”。
可以随时将 CLU 项目导出为 JSON 文件。
请使用以下 URL、标头和 JSON 正文创建POST请求以导出项目。
请求的 URL
创建 API 请求时,请使用以下 URL。 将占位符中的值替换为您自己的值。
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:export?stringIndexType=Utf16CodeUnit&api-version={API-VERSION}
| 占位符 |
价值 |
示例: |
{ENDPOINT} |
用于对 API 请求进行身份验证的终结点。 |
https://<your-custom-subdomain>.cognitiveservices.azure.cn |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
EmailApp |
{API-VERSION} |
要调用的 API 的版本 。 |
2023-04-01 |
使用以下标头对请求进行身份验证。
| 密钥 |
价值 |
Ocp-Apim-Subscription-Key |
资源的键。 用于对 API 请求进行身份验证。 |
发送 API 请求后,会收到指示 202 成功的响应。 在响应头中,提取 operation-location 值。 值的格式如下例所示:
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}
JOB-ID 用于标识请求,因为此作是异步的。 使用此 URL 通过相同的身份验证方法获取导出的项目 JSON。
获取 CLU 项目详细信息
转到 Language Studio 中的“项目设置”页。
查看项目详细信息。
在此页上,可以更新项目说明,并在项目设置中启用或禁用 多语言数据集 。
还可以从此页面检索资源主键。
若要获取项目详细信息,请使用以下 URL 和标头提交 GET 请求。 将占位符中的值替换为您自己的值。
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}?api-version={API-VERSION}
| 占位符 |
价值 |
示例: |
{ENDPOINT} |
用于对 API 请求进行身份验证的终结点。 |
https://<your-custom-subdomain>.cognitiveservices.azure.cn |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
myProject |
{API-VERSION} |
要调用的 API 的版本 。 |
2023-04-01 |
使用以下标头对请求进行身份验证。
| 密钥 |
价值 |
Ocp-Apim-Subscription-Key |
资源的键。 用于对 API 请求进行身份验证。 |
响应体
发送请求后,会收到以下响应:
{
"createdDateTime": "2022-04-18T13:53:03Z",
"lastModifiedDateTime": "2022-04-18T13:53:03Z",
"lastTrainedDateTime": "2022-04-18T14:14:28Z",
"lastDeployedDateTime": "2022-04-18T14:49:01Z",
"projectKind": "Conversation",
"projectName": "{PROJECT-NAME}",
"multilingual": true,
"description": "This is a sample conversation project.",
"language": "{LANGUAGE-CODE}"
}
发送 API 请求后,您会收到一个表明成功的200响应,其中包含带有项目详细信息的 JSON 响应正文。
删除项目
删除项目可确保从系统永久删除它及其所有关联的数据。
不再需要项目时,可以使用 Language Studio 删除项目。 在左窗格中,选择“ 项目”,选择要删除的项目,然后从顶部菜单中选择“ 删除 ”。
如果不再需要项目,则可以使用 REST API 将其删除。 若要继续,请访问 REST API,并按照记录的步骤删除项目以完成此作。
使用以下 URL、标头和 JSON 正文创建 DELETE 请求,以删除对话语言理解项目。
请求的 URL
{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}?api-version={API-VERSION}
| 占位符 |
价值 |
示例: |
{ENDPOINT} |
用于对 API 请求进行身份验证的终结点。 |
https://<your-custom-subdomain>.cognitiveservices.azure.cn |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 |
myProject |
{API-VERSION} |
要调用的 API 的版本 。 |
2023-04-01 |
使用以下标头对请求进行身份验证。
| 密钥 |
价值 |
Ocp-Apim-Subscription-Key |
资源的键。 用于对 API 请求进行身份验证。 |
发送 API 请求后,会收到指示 202 成功(这意味着项目已删除)的响应。
后续步骤
创建微调工作区后,通过定义意向和实体并将其添加到架构来启动微调任务:
Ressources supplémentaires
-
Last updated on
2026-01-20