安装和运行容器

项目
2025/01/21

此内容适用于： v3.0 (GA) v3.1 (GA)

Azure AI 文档智能是一种 Azure AI 服务，可让用户使用机器学习技术构建自动化数据处理软件。使用文档智能，可以从文档中识别并提取文本、键值对、选择标记、表数据等内容。结果以结构化数据的形式提供，其中包含原始文件中的关系。容器仅处理提供给它们的数据，并仅利用它们有权访问的资源。容器无法处理来自其他区域的数据。

在本文中，你可以了解如何下载、安装和运行文档智能容器。使用容器，可以在自己的环境中运行文档智能服务。容器非常适合用于满足特定的安全性和数据管理要求。

文档智能 v3.1 容器支持“读取”、“布局”、“ID 文档”、“收据”和“发票”模型。
文档智能 v3.0 容器支持“读取”、“布局”、“常规文档”、“名片”和“自定义”模型。

版本支持

目前，文档智能版本 v3.0: 2022-08-31 (GA) 提供对所有模型的容器支持，文档智能版本 v3.1 2023-07-31 (GA) 提供对“读取”、“布局”、“ID 文档”、“收据”和“发票”模型的容器支持：

先决条件

若要开始，你需要一个有效的 Azure 帐户。如果没有，可以创建一个试用帐户。

你还需要以下资源才能使用文档智能容器：

必需	目的
熟悉 Docker	应对 Docker 概念有基本的了解，例如注册表、存储库、容器和容器映像，以及基本的 `docker` 术语和命令的知识。
已安装 Docker 引擎	需要在主计算机上安装 Docker 引擎。 Docker 提供用于在 macOS、Windows 和 Linux 上配置 Docker 环境的包。有关 Docker 和容器的基础知识，请参阅 Docker 概述。必须将 Docker 配置为允许容器连接 Azure 并向其发送账单数据。在 Windows 上，还必须将 Docker 配置为支持 Linux 容器。
文档智能资源	Azure 门户中的单服务 Azure AI 文档智能或多服务资源。若要使用这些容器，必须具有关联的密钥和终结点 URI。这两个值可以从 Azure 门户文档智能的“密钥和终结点”页获取： {FORM_RECOGNIZER_KEY}：两个可用资源密钥之一。 {FORM_RECOGNIZER_ENDPOINT_URI}：用于跟踪计费信息的资源的终结点。

可选	目的
Azure CLI（命令行接口）	Azure CLI 使你能够使用一组联机命令来创建和管理 Azure 资源。它可用于在 Windows、macOS 和 Linux 环境中安装，并且可在 Docker 容器和 Azure Cloud Shell 中运行。

主机计算机要求

主机是运行 Docker 容器且基于 x64 的计算机。它可以是本地计算机或 Azure 中的 Docker 托管服务，例如：

Azure Kubernetes 服务。
Azure 容器实例。
部署到 Azure Stack 的 Kubernetes 群集。有关详细信息，请参阅将 Kubernetes 部署到 Azure Stack。

备注

请注意，无法在 Azure Kubernetes 服务中部署和运行 Studio 容器。仅支持在本地计算机上运行工作室容器。

容器要求和建议

所需的配套容器

下表列出了每个下载的文档智能容器的一个或多个支持容器。有关详细信息，请参阅计费部分。

功能容器	支持容器
读取	不是必需
布局	不是必需
名片	读取
常规文档	布局
发票	布局
回执	读取或布局
ID 文档	读取
自定义模板	Layout

建议的 CPU 内核和内存

备注

最小值和建议值基于 Docker 限制，而不是基于主机资源。

文档智能容器

容器	最小值	建议
`Read`	`8` 个内核，10 GB 内存	`8` 个内核，24 GB 内存
`Layout`	`8` 个内核，16 GB 内存	`8` 个内核，24 GB 内存
`Business Card`	`8` 个内核，16 GB 内存	`8` 个内核，24 GB 内存
`General Document`	`8` 个内核，12 GB 内存	`8` 个内核，24 GB 内存
`ID Document`	`8` 个内核，8 GB 内存	`8` 个内核，24 GB 内存
`Invoice`	`8` 个内核，16 GB 内存	`8` 个内核，24 GB 内存
`Receipt`	`8` 个内核，11 GB 内存	`8` 个内核，24 GB 内存
`Custom Template`	`8` 个内核，16 GB 内存	`8` 个内核，24 GB 内存

每个核心必须至少为 2.6 千兆赫 (GHz) 或更快。
核心和内存对应于 --cpus 和 --memory 设置，用作 docker compose 或 docker run 命令的一部分。

提示

可以使用 docker images 命令列出下载的容器映像。例如，以下命令以表格列出每个下载的容器映像的 ID、存储库和标记：

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

通过 docker-compose up 命令运行容器

将 {ENDPOINT_URI} 和 {API_KEY} 值替换为“Azure 资源”页中的资源终结点 URI 和密钥。
确保 EULA 值设置为“接受”。
必须指定 EULA、Billing 和 ApiKey 值；否则容器将无法启动。

重要

密钥用于访问文档智能资源。不要共享你的密钥。以安全方式存储密钥（例如，使用 Azure Key Vault 来存储）。此外，我们建议定期重新生成这些密钥。发出 API 调用只需一个密钥。重新生成第一个密钥时，可以使用第二个密钥来持续访问服务。

以下代码示例是独立的docker compose示例，用于运行文档智能布局容器。利用 docker compose，可以使用 YAML 文件来配置应用程序服务。然后，通过 docker-compose up 命令基于配置创建并启动所有服务。为布局容器实例输入 {FORM_RECOGNIZER_ENDPOINT_URI} 和 {FORM_RECOGNIZER_KEY} 值。

version: "3.9"
services:
  azure-form-recognizer-read:
    container_name: azure-form-recognizer-read
    image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.1
    environment:
      - EULA=accept
      - billing={FORM_RECOGNIZER_ENDPOINT_URI}
      - apiKey={FORM_RECOGNIZER_KEY}
    ports:
      - "5000:5000"
    networks:
      - ocrvnet
networks:
  ocrvnet:
    driver: bridge