Compartir a través de

使用 Azure 数据工厂 或 Synapse Analytics 从 Vertica 复制数据

适用于: Azure 数据工厂 Azure Synapse Analytics

本文概述了如何使用 Azure 数据工厂 或 Synapse Analytics 管道中的复制活动从 Vertica 复制数据。 基于提供复制活动一般概述的复制活动概述一文。

重要

Vertica 连接器版本 1.0 处于 删除阶段。 建议将 Vertica 连接器 从版本 1.0 升级到 2.0。

支持的功能

此 Vertica 连接器支持以下功能:

支持的功能 IR
复制操作 (source/-) ①(仅适用于版本 1.0)②
查询活动 ①(仅适用于版本 1.0)②

(1) Azure集成运行时 (2) 自承载集成运行时

要获取复制活动支持的源/汇的数据存储列表,请参阅支持的数据存储表。

该服务提供内置的驱动程序用于启用连接,因此使用此连接器无需手动安装任何驱动程序。

对于版本 2.0,需要手动 安装 Vertica ODBC 驱动程序 。 对于版本 1.0,该服务提供用于启用连接的内置驱动程序,因此无需手动安装任何驱动程序。

先决条件

如果数据存储位于本地网络、Azure虚拟网络或 Amazon 虚拟私有云中,则需要配置自承载集成运行时以连接到它。 如果使用版本 2.0,则自承载集成运行时版本应为 5.44.8984.1 或更高版本。

要详细了解网络安全机制和数据工厂支持的选项,请参阅数据访问策略

针对版本 1.0

如果数据存储是托管的云数据服务,则可以使用Azure Integration Runtime。 如果访问仅限于防火墙规则中批准的 IP,则可以将 Azure Integration Runtime IP 添加到允许列表。

还可以在 Azure 数据工厂 中使用 托管虚拟网络集成运行时功能访问本地网络,而无需安装和配置自承载集成运行时。

安装版本 2.0 的 Vertica ODBC 驱动程序

若要将 Vertica 连接器与版本 2.0 配合使用,请按照以下步骤在运行自承载集成运行时的计算机上安装 Vertica ODBC 驱动程序:

  1. 客户端驱动程序 |OpenText™ Vertica™ 下载 ODBC 驱动程序的 Vertica 客户端设置。 以Windows系统设置为例:

    Windows 系统设置示例的截图。

  2. 打开下载的 .exe 开始安装过程。 

    安装过程的屏幕截图。

  3. 在 Vertica 组件列表下选择“ODBC 驱动程序”,然后选择“下一步”开始安装

    选择 ODBC 驱动程序的屏幕截图。

  4. 安装过程成功完成后,可以转到“开始”->“ODBC 数据源管理员”以确认安装成功。

    确认安装成功的屏幕截图。

入门

可以使用 .NET SDK、Python SDK、Azure PowerShell、REST API 或Azure 资源管理器模板创建包含复制活动的管道。 有关使用copy activity创建管道的分步说明,请参阅 复制活动 教程

使用 UI 创建一个到 Vertica 的链接服务

使用以下步骤在Azure门户 UI 中创建指向 Vertica 的链接服务。

  1. 浏览到Azure 数据工厂或 Synapse 工作区中的“管理”选项卡并选择“链接服务”,然后单击“新建”:

  2. 搜索 Vertica 并选择 Vertica 连接器。

    Vertica 连接器的屏幕截图。

  3. 配置服务详细信息、测试连接并创建新的链接服务。

    Vertica 的链接服务配置的屏幕截图。

连接器配置详细信息

对于特定于 Vertica 连接器的数据工厂实体,以下部分提供有关用于定义这些实体的属性的详细信息。

连接的服务属性

如果使用版本 2.0,Vertica 链接服务支持以下属性:

属性 描述 必需
类型 type 属性必须设置为:Vertica
服务器 要连接到的服务器的名称或 IP 地址。
移植 服务器侦听器的端口号。 否,默认值为 5433
数据库 Vertica 数据库的名称。
uid(唯一标识符) 用于连接到数据库的用户 ID。
pwd 应用程序用来连接到数据库的密码。
版本 选择版本 2.0 时的版本。 该值为 2.0
connectVia 连接到数据存储时要使用的Integration Runtime。 在先决条件部分了解更多信息。 只能使用自承载集成运行时,其版本应为 5.44.8984.1 或更高版本。

示例:

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": {
                "type": "SecureString",
                "value": "<password>"
             }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Example: 将密码存储在 Azure 密钥保管库 中

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

如果使用版本 1.0,则支持以下属性:

属性 描述 必需
类型 type 属性必须设置为:Vertica
connectionString 连接到 Vertica 的 ODBC 连接字符串。
还可以将密码放在Azure 密钥保管库中,并将 pwd 配置从连接字符串中拉出。 有关更多详细信息,请参阅以下示例和文章《在 Azure 密钥保管库 中存储凭据》。
connectVia 连接到数据存储时要使用的Integration Runtime。 在先决条件部分了解更多信息。 如果未指定,则使用默认Azure Integration Runtime。

示例:

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "typeProperties": {
            "connectionString": "Server=<server>;Port=<port>;Database=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

数据集属性

有关可用于定义数据集的各部分和属性的完整列表,请参阅数据集一文。 本部分提供 Vertica 数据集支持的属性列表。

要从 Vertica 复制数据,请将数据集的 type 属性设置为“VerticaTable”。 支持以下属性:

属性 描述 必需
类型 数据集的 type 属性必须设置为:VerticaTable
架构 架构的名称。 否(如果在活动源中指定了"query")
表的名称。 否(如果在活动源中指定了"query")

示例

{
    "name": "VerticaDataset",
    "properties": {
        "type": "VerticaTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Vertica linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

复制活动 属性

有关可用于定义活动的各部分和属性的完整列表,请参阅管道一文。 本部分提供 Vertica 源支持的属性列表。

以 Vertica 作为源

要从 Vertica 复制数据,请将复制活动中的源类型设置为“VerticaSource”。 复制活动source部分支持以下属性:

属性 描述 必需
类型 复制活动源的 type 属性必须设置为:VerticaSource
查询 使用自定义 SQL 查询读取数据。 例如:"SELECT * FROM MyTable" 否(如果指定了数据集中的“架构 + 表”)

示例:

"activities":[
    {
        "name": "CopyFromVertica",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Vertica input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "VerticaSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

查找活动属性

若要了解有关属性的详细信息,请查看 Lookup 活动

升级 Vertica 连接器

下面是帮助你升级 Vertica 版本的步骤:

  1. 按照先决条件中的步骤安装 Vertica ODBC 驱动程序。
  2. “编辑链接服务”页中,选择版本 2.0 并通过引用 链接服务属性配置链接服务
  3. 使用 5.44.8984.1 或更高版本的自承载集成运行时。 版本 2.0 不支持Azure集成运行时。

Vertica 版本 2.0 和版本 1.0 之间的差异

Vertica 连接器版本 2.0 提供新功能,并与版本 1.0 的大多数功能兼容。 下表显示了版本 2.0 和版本 1.0 之间的功能差异。

版本 2.0 版本 1.0
仅支持版本 5.44.8984.1 或更高版本的自承载集成运行时。 需要在运行自承载集成运行时的计算机上安装 Vertica ODBC 驱动程序 支持Azure集成运行时和自承载集成运行时。

为了获取复制活动支持的数据源和汇集列表,请参阅支持的数据存储