项目限制和边界
下面提供的自定义问题解答限制是 Azure AI 搜索定价层限制和自定义问题解答限制的组合。 这两组限制会影响每个资源可以创建多少个项目以及每个项目可以增长多少。
项目
项目最大数量基于 Azure AI 搜索层限制。
为方案选择适当的 Azure 搜索 SKU。 通常,你会根据不同主题领域的数量来确定所需的项目数量。 一个主题域(用于单种语言)应位于一个项目中。
借助自定义问答,你可以选择使用一种或多种语言设置语言资源。 在 Language Studio 中创建第一个项目时,可以选择此选项。
重要
在特定层中,可以发布单种语言的 N-1 个项目或不同语言的 N/2 个项目,其中 N 是该层中允许的最大索引数。 还需要检查每个层允许的文档最大大小和数量。
例如,如果层允许 15 个索引,可以发布同一语言的 14 个项目(发布的每个项目有 1 个索引)。 第 15 个索引用于所有项目以进行创作和测试。 如果你选择拥有不同语言的项目,则只能发布 7 个项目。
提取限制
文件命名约束
文件名中不得包含下列字符:
请勿使用字符 |
---|
单引号 ' |
双引号 " |
文件大小上限
格式 | 最大文件大小 (MB) |
---|---|
.docx |
10 |
.pdf |
25 |
.tsv |
10 |
.txt |
10 |
.xlsx |
3 |
最大文件数
注意
目前,自定义问题解答对可以添加的源数量没有限制。 对于管理 API 和预测 API,目前的吞吐量上限为每秒 10 条文本记录。 使用 F0 层时,上传限制为 3 个文件。
URL 中的最大深层链接数
从 URL 页面提取问答对时可抓取的深层链接的最大数量为 20。
元数据限制
元数据表示为基于文本的 key:value
对,例如 product:windows 10
。 它以小写形式存储和比较。 元数据字段的最大数量基于 Azure AI 搜索层限制。
如果选择在单个语言资源中使用多种语言的项目,则每个项目有一个专用的测试索引。 因此,语言服务中的限制是按每个项目应用的。
Azure AI 搜索层 | 免费 | 基本 | S1 | S2 | S3 | S3 HD |
---|---|---|---|---|---|---|
每个语言服务的元数据字段的最大数量(每个项目) | 1,000 | 100* | 1,000 | 1,000 | 1,000 | 1,000 |
如果不选择使用多种不同语言的项目的选项,则限制将应用于语言服务中的所有项目。
Azure AI 搜索层 | 免费 | 基本 | S1 | S2 | S3 | S3 HD |
---|---|---|---|---|---|---|
每个语言服务的元数据字段的最大数量(在所有项目中) | 1,000 | 100* | 1,000 | 1,000 | 1,000 | 1,000 |
按名称和值
下表列出了元数据名称和值的长度和可接受的字符。
项 | 允许的字符 | Regex 模式匹配 | 最大字符 |
---|---|---|---|
名称(键) | 允许 字母数字(字母和数字) _ (下划线)不能含有空格。 |
^[a-zA-Z0-9_]+$ |
100 |
值 | 允许除以下字符外的所有字符: (冒号)| (竖线)只允许一个值。 |
^[^:|]+$ |
500 |
项目内容限制
项目中内容的总体限制:
- 答案文本的长度:25,000 个字符
- 问题文本的长度:1,000 个字符
- 元数据键文本的长度:100 个字符
- 元数据值文本的长度:500 个字符
- 支持的元数据名称字符:字母、数字和短划线 (
_
) - 支持的元数据值字符:除
:
和|
以外的所有字符 - 文件名长度:200
- 支持的文件格式::“.tsv”、“.pdf”、“.txt”、“.docx”、“.xlsx”。
- 备用问题的最大数量:300
- 问答对的最大数量:取决于所选的 Azure AI 搜索层。 问答对映射到 Azure AI 搜索索引上的文档。
- URL/HTML 页面:100 万个字符
创建项目调用限制:
下面是每个创建项目操作的限制;即,选择“创建新项目”或调用 REST API 以创建项目。
- 每个答案的备用问题的推荐最大数量:300
- 最大 URL 数:10
- 最大文件数:10
- 每个调用允许的 QnA 最大数量:1000
更新项目调用限制
表示每个更新操作的限制;即,选择“保存”或使用更新请求调用 REST API。
- 每个源名称的长度:300
- 添加或删除的备用问题的推荐最大数量:300
- 添加或删除的元数据字段的最大数量:10
- 可以刷新的 URL 的最大数量:5
- 每个调用允许的 QnA 最大数量:1000
添加非结构化文件限制
注意
- 如果需要使用的文档的大小超出允许的限制,可将文件拆分成多个较小的文件,然后再将其发送到 API。
下面是使用非结构化文件创建新项目或调用 REST API 以创建项目时的限制:
- 文件的长度:我们将提取前 32000 个字符
- 每个文件最多三个响应。
预生成的自定义问题解答限制
注意
- 如果需要使用的文档的大小超出允许的限制,可将文本拆分成较小的文本块,然后再将其发送到 API。
- 文档是由文本字符构成的单个字符串。
下面是使用 REST API 在无需创建项目的情况下回答问题的限制:
- 文档数:5
- 单个文档的最大大小:5,120 个字符
- 每个文档最多 3 个响应。