什么是文档智能工作室?
此内容适用于:v4.0(预览版) | 先前版本:v3.1 (GA)v3.0 (GA)
文档智能工作室是一种联机工具,用于直观地浏览、了解和训练文档智能服务的功能,并将其能集成到应用程序中。 工作室提供了一个用于试验不同文档智能模型的平台,并且能够以交互方式对返回的数据进行采样,而无需编写代码。 使用文档智能工作室可以:
- 详细了解文档智能中的不同功能。
- 使用文档智能资源测试示例文档的模型或上传自己的文档。
- 试验不同的加载项和预览功能,以根据需要调整输出。
- 训练自定义分类模型以对文档进行分类。
- 训练自定义提取模型以从文档中提取字段。
- 获取要集成到应用程序中的语言特定 SDK 的示例代码。
工作室支持文档智能 v3.0 及更高版本的 API 版本,以便进行模型分析和自定义模型训练。 支持以前训练的带有标记数据的 v2.1 模型,但不支持 v2.1 模型训练。 有关从 v2.1 迁移到 v3.0 的详细信息,请参阅 REST API 迁移指南。
开始使用文档智能工作室
要使用文档智能工作室,需要以下资产:
导航到“文档智能工作室”。 如果是首次登录,将显示一个弹出窗口,提示你配置服务资源。 可以使用两个选项:
a. 按资源访问(推荐)。
- 选择现有订阅。
- 选择订阅中的现有资源组或创建新资源组。
- 选择现有的文档智能或 Azure AI 服务资源。
b. 按 API 终结点和密钥访问。
- 从 Azure 门户检索终结点和密钥。
- 转到资源的概述页,从左侧导航栏中选择“密钥和终结点”。
- 在适当的字段中输入值。
完成资源配置后,将能够试用文档智能工作室提供的不同模型。 在首页中选择任何文档智能模型以尝试使用无代码方法。
要测试任何文档分析或预生成模型,请选择模型并使用一个示例文档或上传自己的文档进行分析。 分析结果显示在“内容”-“结果”-“代码”窗口的右侧。
需要在文档中训练自定义模型。 有关自定义模型的概述,请参阅自定义模型概述。
在文档智能工作室中验证方案之后,请使用 C#、Java、JavaScript 或 Python 客户端库或 REST API 开始将文档智能模型合并到自己的应用程序中。
若要详细了解每种模型,请参阅概念页面。
模型类型 | 模型名称 |
---|---|
文档分析模型 | ● 读取 OCR ● 布局分析 ● 通用文档(已弃用 2023-10-31-preview) |
预生成的模型 | ● 健康保险卡 ● W-2 表格 ● US 1098 税表 ● US 1098-E 税表 ● US 1098-T 税表 ● 发票 ● 收据 ● 身份证明 (ID) 文件 ● 名片(已弃用 2023-10-31-preview) ● 合同 |
自定义模式 | ● 自定义模型概述 ● 提取模型 ○ 自定义模板 ○ ● 分类器模型 ○ 自定义分类器 ● 组合模型 |
管理资源
要查看资源详细信息(如名称和定价层),请选择文档智能工作室主页右上角的“设置”图标,然后选择“资源”选项卡。如果有权访问其他资源,也可以切换资源。
使用文档智能,可以快速自动处理应用程序和工作流中的数据,轻松增强数据驱动的策略,并娴熟地扩充文档搜索功能。
后续步骤
访问文档智能工作室以开始使用服务提供的模型。
有关文档智能功能的详细信息,请参阅 Azure AI 文档智能概述。