Azure Synapse Link for SQL Server 2022

本文介绍 Azure Synapse Link for SQL Server 2022 的功能。 可以使用 Azure Synapse Link for SQL 功能将操作数据从 SQL Server 2022 复制到 Azure Synapse Analytics 专用 SQL 池。

链接连接标识 SQL Server 2022 与 Azure Synapse Analytics 专用 SQL 池之间的映射关系。 可以在 Synapse 工作区中创建、管理、监视和删除链接连接。 创建链接连接时,可以同时选择源数据库和目标 Synapse 专用 SQL 池,以便将源数据库中的操作数据自动复制到指定的目标 Synapse 专用 SQL 池。 还可以从要复制的源数据库中添加或删除一个或多个表。

可以启动、停止、暂停或恢复链接连接。 启动后,链接连接首先会从源数据库执行完整的初始加载,然后通过 SQL Server 2022 中的更改源功能加载增量更改源。 停止链接连接后,对操作数据所做的更新将不会同步到 Synapse 专用 SQL 池。 如果再次启动链接连接,它将从源数据库执行完整的初始加载。 暂停链接连接后,对操作数据所做的更新将不会同步到 Synapse 专用 SQL 池。 恢复链接连接时,它会继续将更新从你暂停链接连接的位置同步到 Synapse 专用 SQL 池。 有关详细信息,请参阅 SQL Server 2022 和 Azure SQL 数据库的 Azure Synapse Link 更改源

需要为每个链接连接选择计算核心数以复制数据。 核心计数代表计算能力,它会影响数据复制延迟和成本。

还可以选择连续模式或批处理模式来复制数据,从而在成本和延迟之间进行权衡。 选择连续模式时,运行时将连续运行,以便应用到 SQL DB 或 SQL Server 的任何更改都将以低延迟复制到 Synapse。 选择具有指定间隔的批处理模式时,应用于 SQL DB 或 SQL Server 的更改将累积起来并在具有指定间隔的批处理模式下复制到 Synapse。 这样做可以节省成本,因为只需为需要运行时以复制数据的时间付费。 复制完每批数据后,运行时将自动关闭。

登陆区域

登陆区域是 Azure Synapse Link for SQL Server 2022 所需的临时暂存存储。 首先,将操作数据从 SQL Server 2022 加载到登陆区域。 接下来,将数据从登陆区域复制到 Synapse 专用 SQL 池。 需要提供自己的 Azure Data Lake Storage Gen2 帐户以用作登录区域。 不支持将此登陆区域用于除 Azure Synapse Link for SQL 之外的任何产品。

链接连接需要 Azure Data Lake Storage Gen2 帐户中的共享访问签名 (SAS) 令牌才能访问登录区域。 请注意,SAS 令牌有到期日期。 请确保在到期日期之前轮换 SAS 令牌以确保 SAS 令牌有效。 否则,Azure Synapse Link for SQL 将无法从 SQL Server 2022 复制数据。

自承载集成运行时

自承载集成运行时是一种软件代理,可在本地计算机或虚拟机上下载和安装。 Azure Synapse Link for SQL Server 2022 需要访问位于防火墙后面的本地 SQL Server 2022 上的数据。 目前,仅支持在 Windows 操作系统上运行自承载 IR。 有关详细信息,请参阅创建自承载集成运行时

监视

可以在链接和表级别监视 Azure Synapse Link for SQL。 对于每个链接连接,你将看到以下状态:

  • 初始:链接连接已创建但未启动。 初始状态下不会收取任何费用。
  • 启动:链接连接正在设置计算引擎以复制数据。
  • 正在运行:链接连接正在复制数据。
  • 正在停止:链接连接将停止。 将关闭计算引擎。
  • 已停止:链接连接已停止。 已停止状态下不会收取任何费用。
  • 正在暂停:链接连接将暂停。 将关闭计算引擎。
  • 已暂停:链接连接已暂停。 已暂停状态下不会收取任何费用。
  • 正在恢复:将通过设置计算引擎来继续复制更改,从而恢复链接连接。

对于每个表,你将看到以下状态:

  • 拍摄快照:源表最初通过完整快照加载到目标。
  • 复制:源表上的任何更新都将复制到目标。
  • 失败:源表上的数据无法复制到目标。 如果想在修复错误后重试,请从链接连接中删除并重新添加该表。
  • 已暂停:由于错误,此表的复制已暂停。 它将在错误解决后恢复。

还可获取以下指标来启用服务的高级监视:

  • 链接连接事件:链接连接事件(包括启动、停止或失败)的数量。
  • 链接表事件:链接表事件(包括快照、删除或失败)的数量。
  • 链接延迟(秒):数据处理延迟(秒)。
  • 链接数据处理的数据量(字节):适用于 SQL 的 Synapse Link 处理的数据量(以字节为单位)。
  • 链接处理的行:适用于 SQL 的 Synapse Link(更改)处理的行数。

有关详细信息,请参阅管理 Synapse Link for SQL 更改源

跨表的事务一致性

可以为每个链接连接启用跨表的事务一致性。 但是,它会限制总体复制吞吐量。

已知的限制

可在 Azure Synapse Link for SQL 的已知限制和问题中找到已知限制和问题的综合列表。

后续步骤