使用 Azure 数据工厂或 Synapse Analytics 在 data.world(预览版)中转换数据

适用于:Azure 数据工厂 Azure Synapse Analytics

本文概述了如何使用数据流在 data.world(预览版)中转换数据。 有关详细信息,请阅读 Azure 数据工厂Azure Synapse Analytics 的简介文章。

重要

此连接器目前提供预览版。 欢迎试用并提供反馈。 若要在解决方案中使用预览版连接器的依赖项,请联系 Azure 客户支持

支持的功能

此 data.world 连接器支持以下功能:

支持的功能 IR
映射数据流(源/-)

① Azure 集成运行时 ② 自承载集成运行时

如需可以用作源/接收器的数据存储的列表,请参阅支持的数据存储表。

使用 UI 创建 data.world 链接服务

使用以下步骤在 Azure 门户 UI 中创建 data.world 链接服务。

  1. 浏览到 Azure 数据工厂或 Synapse 工作区中的“管理”选项卡,并选择“链接服务”,然后单击“新建”:

  2. 搜索 data.world(预览版)并选择 data.world(预览版)连接器。

    显示选择 data.world 连接器的屏幕截图。

  3. 配置服务详细信息、测试连接并创建新的链接服务。

    data.world 链接服务的配置屏幕截图。

连接器配置详细信息

下面各部分介绍了用于定义 data.world 特定数据工厂和 Synapse 管道实体的属性的信息。

链接服务属性

data.world 链接服务支持以下属性:

属性 描述 必需
type type 属性必须设置为 Dataworld。
apiToken 为 data.world 指定 API 令牌。 将此字段标记为 SecureString 以安全存储它。 或者,可以引用 Azure Key Vault 中存储的机密

示例:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

映射数据流属性

转换映射数据流中的数据时,可以从 data.world 中读取表。 有关详细信息,请参阅映射数据流中的源转换。 只能使用内联数据集作为源类型。

源转换

下表列出了 data.world 源支持的属性。 可以在“源选项”选项卡中编辑这些属性。

名称 说明 必需 允许的值 数据流脚本属性
数据集名称 data.world 中数据集的 ID。 字符串 datasetId
表名称 data.world 中数据集内的表 ID。 否(如果指定了 query 字符串 tableId
查询 输入用于从 data.world 提取数据的 SQL 查询。 示例为 select * from MyTable 否(如果指定了 tableId 字符串 query
“所有者” data.world 中数据集的所有者。 字符串 owner

data.world 源脚本示例

使用 data.world 作为源类型时,关联的数据流脚本为:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

有关复制活动支持作为源和接收器的数据存储的列表,请参阅受支持的数据存储