业务流程工作流接受的数据格式

当模型使用数据进行学习时,它需要数据采用特定格式。 在 Language Studio 中标记数据时,它将转换为本文中所述的 JSON 格式。 你还可以手动标记文件。

JSON 文件格式

如果上传标记文件,则该文件应遵循此格式。

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "Orchestration",
    "projectName": "{PROJECT-NAME}",
    "multilingual": false,
    "description": "This is a description",
    "language": "{LANGUAGE-CODE}"
  },
  "assets": {
    "projectKind": "Orchestration",
    "intents": [
      {
        "category": "{INTENT1}",
        "orchestration": {
          "targetProjectKind": "Luis|Conversation|QuestionAnswering",
          "luisOrchestration": {
            "appId": "{APP-ID}",
            "appVersion": "0.1",
            "slotName": "production"
          },
          "conversationOrchestration": {
            "projectName": "{PROJECT-NAME}",
            "deploymentName": "{DEPLOYMENT-NAME}"
          },
          "questionAnsweringOrchestration": {
            "projectName": "{PROJECT-NAME}"
          }
        }
      }
    ],
    "utterances": [
      {
        "text": "utterance 1",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "intent1"
      }
    ]
  }
}
密钥 占位符 示例
api-version {API-VERSION} 要调用的 API 版本。 此处引用的值适用于最新发布的模型版本 2022-03-01-preview
confidenceThreshold {CONFIDENCE-THRESHOLD} 这是一个阈值分数,低于此分数的意向将被预测为无意向 0.7
projectName {PROJECT-NAME} 项目名称。 此值区分大小写。 EmailApp
multilingual false 业务流程不支持多语言功能 false
language {LANGUAGE-CODE} 指定项目中所用语句的语言代码的字符串。 有关受支持的语言代码的详细信息,请参阅语言支持 en-us
intents [] 一个数组,其中包含项目中的所有意向类型。 这些意向在业务流程项目中使用。 []

语句格式

[
    {
        "intent": "intent1",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    },
    {
        "intent": "intent2",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    }
]

后续步骤