什么是文档智能工作室?

此内容适用于:选中标记v4.0(预览版) | 先前版本:蓝色复选标记v3.1 (GA)蓝色复选标记v3.0 (GA)

文档智能工作室是一种联机工具,用于直观地浏览、了解和训练文档智能服务的功能,并将其能集成到应用程序中。 工作室提供了一个用于试验不同文档智能模型的平台,并且能够以交互方式对返回的数据进行采样,而无需编写代码。 使用文档智能工作室可以:

  • 详细了解文档智能中的不同功能。
  • 使用文档智能资源测试示例文档的模型或上传自己的文档。
  • 试验不同的加载项和预览功能,以根据需要调整输出。
  • 训练自定义分类模型以对文档进行分类。
  • 训练自定义提取模型以从文档中提取字段。
  • 获取要集成到应用程序中的语言特定 SDK 的示例代码。

工作室支持文档智能 v3.0 及更高版本的 API 版本,以便进行模型分析和自定义模型训练。 支持以前训练的带有标记数据的 v2.1 模型,但不支持 v2.1 模型训练。 有关从 v2.1 迁移到 v3.0 的详细信息,请参阅 REST API 迁移指南

开始使用文档智能工作室

  1. 要使用文档智能工作室,需要以下资产:

    • Azure 订阅 - 创建试用版订阅

    • Azure AI 服务或文档智能资源。 获得 Azure 订阅后,在 Azure 门户中创建单服务多服务资源以获取密钥和终结点。 使用免费定价层 (F0) 试用该服务,稍后升级到用于生产的付费层。

  2. 导航到“文档智能工作室”。 如果是首次登录,将显示一个弹出窗口,提示你配置服务资源。 可以使用两个选项:

    a. 按资源访问(推荐)

    • 选择现有订阅。
    • 选择订阅中的现有资源组或创建新资源组。
    • 选择现有的文档智能或 Azure AI 服务资源。

    b. 按 API 终结点和密钥访问

    • 从 Azure 门户检索终结点和密钥。
    • 转到资源的概述页,从左侧导航栏中选择“密钥和终结点”。
    • 在适当的字段中输入值。

    该屏幕截图显示了 Azure 门户中密钥和终结点的位置。

  3. 完成资源配置后,将能够试用文档智能工作室提供的不同模型。 在首页中选择任何文档智能模型以尝试使用无代码方法。

    文档智能工作室首页的屏幕截图。

  4. 要测试任何文档分析或预生成模型,请选择模型并使用一个示例文档或上传自己的文档进行分析。 分析结果显示在“内容”-“结果”-“代码”窗口的右侧。

  5. 需要在文档中训练自定义模型。 有关自定义模型的概述,请参阅自定义模型概述

  6. 在文档智能工作室中验证方案之后,请使用 C#JavaJavaScriptPython 客户端库或 REST API 开始将文档智能模型合并到自己的应用程序中。

若要详细了解每种模型,请参阅概念页面。

模型类型 模型名称
文档分析模型 读取 OCR
布局分析
通用文档(已弃用 2023-10-31-preview)
预生成的模型 健康保险卡
W-2 表格
US 1098 税表
US 1098-E 税表
US 1098-T 税表
发票
收据
身份证明 (ID) 文件
名片(已弃用 2023-10-31-preview)
合同
自定义模式 自定义模型概述

提取模型
自定义模板


分类器模型
自定义分类器

组合模型

管理资源

要查看资源详细信息(如名称和定价层),请选择文档智能工作室主页右上角的“设置”图标,然后选择“资源”选项卡。如果有权访问其他资源,也可以切换资源。

工作室设置页面资源选项卡的屏幕截图。

使用文档智能,可以快速自动处理应用程序和工作流中的数据,轻松增强数据驱动的策略,并娴熟地扩充文档搜索功能。

后续步骤