Azure 数据工厂和 Synapse Analytics 管道中的验证活动

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

可以在管道中使用 Validation,以确保管道仅在验证附加数据集引用存在并满足指定条件或已达到超时后才继续执行。

使用 UI 创建 Validation 活动

若要在管道中使用 Validation 活动,请完成以下步骤:

  1. 在管道“活动”窗格中搜索 Validation,然后将 Validation 活动拖动到管道画布上。
  2. 如果尚未选择画布上的新 Validation 活动,请选择它及其“设置”选项卡,以编辑其详细信息。 Screenshot shows the UI for a Validation activity.
  3. 选择数据集,或者通过选择“新建”按钮定义新数据集。 对于基于文件的数据集(如上面的带分隔符的文本示例),可以选择特定文件或文件夹。 选择文件夹时,Validation 活动允许忽略对文件夹中是否存在子项的验证,或允许要求子项是否存在。
  4. Validation 活动的输出可以用作任何其他活动的输入,并使用动态表达式在这些活动内引用其任何属性。

语法


{
"name": "Validation_Activity",
"type": "Validation",
"typeProperties": {
"dataset": {
"referenceName": "Storage_File",
"type": "DatasetReference"
},
"timeout": "0.12:00:00",
"sleep": 10,
"minimumSize": 20
}
},
{
"name": "Validation_Activity_Folder",
"type": "Validation",
"typeProperties": {
"dataset": {
"referenceName": "Storage_Folder",
"type": "DatasetReference"
},
"timeout": "0.12:00:00",
"sleep": 10,
"childItems": true
}
}

Type 属性

属性 说明 允许的值 必需
name “Validation”活动的名称 String
type 必须设置为“验证”。 字符串
dataset 活动将阻止执行,直到它验证此数据集引用存在并满足指定的条件,或者达到超时为止。 提供的数据集应支持“MinimumSize”或“ChildItems”属性。 数据集引用
timeout 指定活动运行的超时。 如果未指定值,则默认值为 12 小时(“0.12:00:00”)。 格式为 d.hh:mm:ss String
sleep 验证尝试之间的延迟(以秒为单位)。 如果未指定值,则默认值为 10 秒。 Integer
childItems 检查文件夹是否包含子项目。 可以设置为 -true:验证文件夹是否存在以及它是否包含项目。 一直阻止,直到文件夹中至少存在一个项目或达到超时值为止。-false:验证文件夹是否存在以及它是否为空。 一直阻止,直到文件夹为空或达到超时值为止。 如果未指定值,则活动将一直阻止,直到文件夹存在或达到超时为止。 布尔
minimumSize 文件的最小大小(以字节为单位)。 如果未指定值,则默认值为 0 字节 Integer

参阅支持的其他控制流活动: