使用 Azure 数据工厂或 Azure Synapse Analytics 从 SharePoint Online 列表复制数据

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

本文概述如何使用 Azure 数据工厂和 Azure Synapse Analytics 中的复制活动从 SharePoint Online 列表复制数据。 本文根据复制活动一文(其中大致介绍了复制活动)编写。

支持的功能

此 SharePoint Online 列表连接器支持以下功能:

支持的功能 IR
复制活动(源/-) ① ②
Lookup 活动 ① ②

① Azure 集成运行时 ② 自承载集成运行时

如需可以用作源或接收器的数据存储的列表,请参阅支持的数据存储表。

具体而言,此 SharePoint Online 列表连接器使用服务主体身份验证,并通过 OData 协议检索数据。

提示

此连接器支持从 SharePoint Online 列表而不是文件复制数据。 通过从 SharePoint Online 复制文件部分了解如何复制文件。

先决条件

SharePoint Online 列表连接器使用服务主体身份验证连接到 SharePoint。 请按照以下步骤进行设置:

  1. 将应用程序注册到 Microsoft 标识平台。 快速入门:通过 Microsoft 标识平台注册应用程序。 记下以下值,这些值用于定义链接服务:

    • 应用程序 ID
    • 应用程序密钥
    • 租户 ID
  2. 按照以下步骤,向你注册的应用程序授予 SharePoint Online 网站权限。 为此,需要具有站点管理员角色。

    1. 打开 SharePoint Online 网站链接,例如 https://[your_site_url]/_layouts/15/appinv.aspx(替换网站 URL)。

    2. 搜索已注册的应用程序 ID,填写空字段,然后单击“创建”。

      • 应用程序域:contoso.com

      • 重定向 URL:https://www.contoso.com

      • 权限请求 XML:

        <AppPermissionRequests AllowAppOnlyPolicy="true">
            <AppPermissionRequest Scope="http://sharepoint/content/sitecollection/web" Right="Read"/>
        </AppPermissionRequests>
        

        Grant SharePoint Online site permission to your registered application when you have site admin role.

      注意

      在配置 SharePoint 连接器的上下文中,“应用域”和“重定向 URL”指的是 Microsoft Entra ID 中注册的用于访问 SharePoint 数据的 SharePoint 应用。 “应用域”是托管 SharePoint 站点的域。 例如,如果 SharePoint 站点位于 https://contoso.sharepoint.com",则“应用域”为“contoso.sharepoint.com”。 “重定向 URL”是 SharePoint 应用在用户向该应用验证身份并获取其权限后重定向到的 URL。 此 URL 应是应用有权访问的 SharePoint 站点页面。 例如,你可以使用显示库中文件列表的页面的 URL,也可以使用显示文档内容的页面的 URL。

    3. 对此应用单击“信任它”。

入门

若要使用管道执行复制活动,可以使用以下工具或 SDK 之一:

使用 UI 创建到 SharePoint Online 列表的链接服务

使用以下步骤在 Azure 门户 UI 中创建一个到 SharePoint Online 列表的链接服务。

  1. 浏览到 Azure 数据工厂或 Synapse 工作区中的“管理”选项卡并选择“链接服务”,然后单击“新建”:

  2. 搜索 SharePoint 并选择 SharePoint Online 列表连接器。

    Screenshot of the SharePoint Online List connector.

  3. 配置服务详细信息、测试连接并创建新的链接服务。

    Screenshot of linked service configuration for a SharePoint Online List.

连接器配置详细信息

对于特定于 SharePoint Online 列表连接器的实体,以下部分提供了可用于定义这些实体的属性的详细信息。

链接服务属性

SharePoint Online 列表链接的服务支持以下属性:

属性 说明 必需
type type 属性必须设置为:SharePointOnlineList。
siteUrl SharePoint Online 网站 URL,例如 https://contoso.sharepoint.com/sites/siteName
servicePrincipalId 在 Microsoft Entra ID 中注册的应用程序的应用程序(客户端)ID。 有关包括权限设置在内的更多详细信息,请参阅先决条件
servicePrincipalKey 应用程序的密钥。 请将此字段标记为 SecureString 以安全地存储它,或引用存储在 Azure Key Vault 中的机密
tenantId 应用程序所在的租户 ID。
connectVia 用于连接到数据存储的 Integration Runtime。 如果未指定,则使用默认 Azure Integration Runtime。

示例:

{
    "name": "SharePointOnlineList",
    "properties": {
        "type": "SharePointOnlineList",
        "typeProperties": {
            "siteUrl": "<site URL>",
            "servicePrincipalId": "<service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<service principal key>"
            },
            "tenantId": "<tenant ID>"
        }
    }
}

数据集属性

有关可用于定义数据集的各部分和属性的完整列表,请参阅数据集和链接服务。 以下部分提供 SAP 表数据集支持的属性列表。

properties 描述 必需
type 数据集的 type 属性必须设置为 SharePointOnlineLResource。
listName SharePoint Online 列表的名称。 请注意,文件名中不允许使用撇号 (')。

示例

{
    "name": "SharePointOnlineListDataset",
    "properties":
    {
        "type": "SharePointOnlineListResource",
        "linkedServiceName": {
            "referenceName": "<SharePoint Online List linked service name>",
            "type": "LinkedServiceReference"
        },
        "typeProperties":
        {
            "listName": "<name of the list>"
        }
    }
}

复制活动属性

有关可用于定义活动的各个部分和属性的完整列表,请参阅管道。 以下部分提供 SharePoint Online 列表源支持的属性列表。

SharePoint Online 列表作为源

若要从 SharePoint Online 列表复制数据,复制活动“源”部分支持以下属性:

properties 描述 必需
type 复制活动源的 type 属性必须设置为 SharePointOnlineListSource。
query 用于筛选数据的自定义 OData 查询选项。 示例:"$top=10&$select=Title,Number"
httpRequestTimeout 用于获取响应的 HTTP 请求的超时(以秒为单位)。 默认值为 300(5 分钟)。

示例

"activities":[
    {
        "name": "CopyFromSharePointOnlineList",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<SharePoint Online List input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "SharePointOnlineListSource",
                "query": "<OData query e.g. $top=10&$select=Title,Number>"
            }, 
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

注意

无法为 SharePoint Online 列表源选择多选数据类型。

SharePoint Online 列表的数据类型映射

从 SharePoint Online 列表复制数据时,在 SharePoint Online 列表数据类型和此服务在内部使用的临时数据类型之间使用以下映射。

SharePoint Online 数据类型 OData 数据类型 临时数据类型
单个文本行 Edm.String 字符串
多行文本 Edm.String 字符串
选项(可供选择的菜单) Edm.String 字符串
数字(1、1.0、100) Edm.Double Double
货币($、¥、€) Edm.Double Double
日期和时间 Edm.DateTime DateTime
查阅项(此网站已有的信息) Edm.Int32 Int32
是/否(复选框) Edm.Boolean Boolean
个人或团体 Edm.Int32 Int32
超链接或图片 Edm.String 字符串
计算(基于其他列的计算) Edm.String/Edm.Double/Edm.DateTime/Edm.Boolean 字符串/Double/DateTime/Boolean
附件 不支持
任务结果 不支持
外部数据 不支持
托管元数据 不支持

从 SharePoint Online 复制文件

您可以使用以下方法从 SharePoint Online 复制文件:使用 Web 活动进行身份验证并从 SPO 中获取访问令牌,然后传递到后续的复制活动以使用 HTTP 连接器作为源复制数据。

sharepoint copy file flow

  1. 按照先决条件部分,创建 Microsoft Entra 应用程序并向 SharePoint Online 授予权限。

  2. 创建 Web 活动以从 SharePoint Online 获取访问令牌:

    • URL:https://accounts.accesscontrol.chinacloudapi.cn/[Tenant-ID]/tokens/OAuth/2 替换租户 ID。
    • 方法:POST
    • 标头:
      • 内容类型:application/x-www-form-urlencoded
    • 正文:grant_type=client_credentials&client_id=[Client-ID]@[Tenant-ID]&client_secret=[Client-Secret]&resource=00000003-0000-0ff1-ce00-000000000000/[Tenant-Name].sharepoint.com@[Tenant-ID]。 替换客户端 ID(应用程序 ID)、客户端密码(应用程序密钥)、租户 ID 和(SharePoint 租户的)租户名称。

    注意

    在 Web 活动中,将“安全输出”选项设置为 true,以防止令牌值以纯文本格式记录。 使用此值的任何其他活动都应将其“安全输入”选项设置为 true。

  3. 与 HTTP 连接器作为源的复制活动链接以复制 SharePoint Online 文件内容:

    • HTTP 链接服务:
      • 基 URL:https://[site-url]/_api/web/GetFileByServerRelativeUrl('[relative-path-to-file]')/$value 替换网站 URL 和文件的相对路径。 请确保包含 SharePoint 站点 URL 以及域名,例如 https://[sharepoint-domain-name].sharepoint.com/sites/[sharepoint-site]/_api/web/GetFileByServerRelativeUrl('/sites/[sharepoint-site]/[relative-path-to-file]')/$value
      • 身份验证类型:匿名(稍后使用复制活动源中配置的持有者令牌)
    • 数据集:选择所需的格式。 若要按原样复制文件,请选择“二进制”类型。
    • 复制活动源:
      • 请求方法:GET
      • 其他标头:使用以下表达式@{concat('Authorization: Bearer ', activity('<Web-activity-name>').output.access_token)},该表达式将上游 Web 活动生成的持有者令牌用作授权标头。 替换 Web 活动名称。
    • 照常配置复制活动接收器。

注意

即使 Microsoft Entra 应用程序具有对 SharePoint Online 的 FullControl 权限,也不能从启用了 IRM 的文档库中复制文件。

查找活动属性

若要了解有关属性的详细信息,请查看 Lookup 活动

有关复制活动支持作为源和接收器的数据存储的列表,请参阅支持的数据存储和格式