部署示例标记工具

此内容适用于:Document Intelligence v2.1 checkmarkv2.1

提示

注意

云托管标记工具可在 https://fott-2-1.azurewebsites.net/ 上找到。 仅当你想为自己部署示例标记工具时,才按照本文档中的步骤进行操作。

文档智能示例标记工具是一款应用程序,它提供一个简单的用户界面 (UI),可用来手动标记表单(文档)以便进行监督式学习。 在本文中,我们将提供链接和说明来指导你执行以下操作:

本地运行示例标记工具

开始标记数据的最快方法是在本地运行示例标记工具。 以下快速入门将文档智能 REST API 和示例标记工具结合使用,通过手动标记的数据来训练自定义模型。

使用 Azure 容器实例 (ACI) 部署

开始之前,请务必注意,可以通过两种方法将示例标记工具部署到 Azure 容器实例 (ACI)。 这两个选项旨在通过 ACI 运行示例标记工具:

Azure 门户

请按照下列步骤使用 Azure 门户创建新资源:

  1. 登录 Azure 门户

  2. 选择“创建资源”。

  3. 接下来,选择“Web 应用”。

    Select web app

  4. 首先,确保已选择“基本信息”选项卡。 接下来,需要提供一些信息:

    Select Basics

    • 订阅:选择现有的 Azure 订阅
    • 资源组 - 可以重复使用现有资源组,也可以为此项目创建一个新资源组。 建议创建新的资源组。
    • 名称 - 为 Web 应用提供一个名称。
    • 发布 - 选择“Docker 容器”
    • 操作系统 - 选择“Linux”
    • 区域 - 选择适合你的区域。
    • Linux 计划 - 为应用服务选择定价层/计划。

    Configure your web app

  5. 接下来,选择“Docker”选项卡。

    Select Docker

  6. 现在,让我们来配置 Docker 容器。 除非另有说明,否则所有字段都是必填字段:

  • 选项 - 选择“单个容器”
  • 图像源 - 选择“专用注册表”
  • 服务器 URL - 设置为 https://mcr.microsoft.com
  • 用户名(可选)- 创建用户名。
  • 密码(可选)- 创建你能够记住的安全密码。
  • 图像和标记 - 设置为 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool:latest-2.1
  • 持续部署 - 如果想要在开发团队对示例标记工具进行更改时接收自动更新,请设置为“启用”。
  • 启动命令 - 设置为 ./run.sh eula=accept

Configure Docker

  • 接下来,依次选择“查看 + 创建”,然后单击“创建”以部署 Web 应用。 完成后,你可以通过资源“概述”中提供的 URL 访问该 Web 应用。

连续部署

创建 Web 应用后,可以启用连续部署选项:

  • 在左侧窗格中,选择“容器设置”。
  • 在主窗口中,导航到“持续部署”,然后在“打开”和“关闭”按钮之间切换,以设置首选项:

Screenshot of enlargement of container settings for continuous deployment.

注意

创建 Web 应用时,还可以配置授权/身份验证。 这并不是必需的。

重要

可能需要为 Web 应用启用 TLS,才能通过其 https 地址查看它。 请按照 启用 TLS 终结点中的说明设置 Sidercar 容器,而不是为 Web 应用启用 TLS/SSL。

Azure CLI

除使用 Azure 门户之外,还可以使用 Azure CLI 创建资源。 继续之前,需要安装 Azure CLI。 如果已在使用 Azure CLI,则可以跳过此步骤。

有关此命令,需要了解以下几个事项:

  • DNS_NAME_LABEL=aci-demo-$RANDOM 会生成一个随机 DNS 名称。
  • 此示例假设您有一个可用于创建资源的资源组。 将 <resource_group_name> 替换为与订阅关联的有效资源组。
  • 你需要指定要在哪里创建资源。 将 <region name> 替换为所需的 Web 应用区域。
  • 此命令自动接受 EULA。

在 Azure CLI 中运行以下命令,可为示例标记工具创建 Web 应用资源:

DNS_NAME_LABEL=aci-demo-$RANDOM

az container create \
  --resource-group <resource_group_name> \
  --name <name> \
  --image mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool:latest-2.1 \
  --ports 3000 \
  --dns-name-label $DNS_NAME_LABEL \
  --location <region name> \
  --cpu 2 \
  --memory 8 \
  --command-line "./run.sh eula=accept"

连接到 Microsoft Entra ID 进行授权

建议将 Web 应用连接到 Microsoft Entra ID。 此连接可确保只有具有有效凭据的用户才能登录和使用你的 Web 应用。 请按照 配置应用服务应用中的说明,将其连接到 Microsoft Entra ID。

GitHub 上的开源

OCR 表单标记工具也可用作 GitHub 上的开源项目。 该工具是使用 React + Redux 生成并采用 TypeScript 编写的 web 应用程序。 若要了解详细信息或参与,请参阅 OCR 窗体标记工具

后续步骤

使用使用标签进行训练快速入门,了解如何使用该工具手动标记训练数据和执行监督式学习。