业务流程工作流接受的数据格式
当模型使用数据进行学习时,它需要数据采用特定格式。 在 Language Studio 中标记数据时,它将转换为本文中所述的 JSON 格式。 你还可以手动标记文件。
JSON 文件格式
如果上传标记文件,则该文件应遵循此格式。
{
"projectFileVersion": "{API-VERSION}",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "Orchestration",
"projectName": "{PROJECT-NAME}",
"multilingual": false,
"description": "This is a description",
"language": "{LANGUAGE-CODE}"
},
"assets": {
"projectKind": "Orchestration",
"intents": [
{
"category": "{INTENT1}",
"orchestration": {
"targetProjectKind": "Luis|Conversation|QuestionAnswering",
"luisOrchestration": {
"appId": "{APP-ID}",
"appVersion": "0.1",
"slotName": "production"
},
"conversationOrchestration": {
"projectName": "{PROJECT-NAME}",
"deploymentName": "{DEPLOYMENT-NAME}"
},
"questionAnsweringOrchestration": {
"projectName": "{PROJECT-NAME}"
}
}
}
],
"utterances": [
{
"text": "utterance 1",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"intent": "intent1"
}
]
}
}
密钥 | 占位符 | 值 | 示例 |
---|---|---|---|
api-version |
{API-VERSION} |
要调用的 API 版本。 此处引用的值适用于最新发布的模型版本。 | 2022-03-01-preview |
confidenceThreshold |
{CONFIDENCE-THRESHOLD} |
这是一个阈值分数,低于此分数的意向将被预测为无意向 | 0.7 |
projectName |
{PROJECT-NAME} |
项目名称。 此值区分大小写。 | EmailApp |
multilingual |
false |
业务流程不支持多语言功能 | false |
language |
{LANGUAGE-CODE} |
指定项目中所用语句的语言代码的字符串。 有关受支持的语言代码的详细信息,请参阅语言支持。 | en-us |
intents |
[] |
一个数组,其中包含项目中的所有意向类型。 这些意向在业务流程项目中使用。 | [] |
语句格式
[
{
"intent": "intent1",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
},
{
"intent": "intent2",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
}
]