“导出数据”组件

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件将结果、中间数据和工作数据从管道保存到云存储目标中。

此组件支持将数据导出到以下云数据服务:

  • Azure Blob 容器
  • Azure 文件共享
  • Azure Data Lake Storage Gen1
  • Azure Data Lake Storage Gen2
  • Azure SQL 数据库

导出数据之前,首先需要在 Azure 机器学习工作区中注册数据存储。 有关详细信息,请参阅访问 Azure 存储服务中的数据

如何配置“导出数据”

  1. 在设计器中将“导出数据”组件添加到管道。 可以在“输入和输出”类别中找到此组件。

  2. 将“导出数据”连接到包含要导出的数据的组件。

  3. 选择“导出数据”,打开“属性”窗格 。

  4. 对于“数据存储”,请从下拉列表中选择现有数据存储。 还可以创建新的数据存储。 通过访问访问 Azure 存储服务中的数据来查看方法。

    注意

    不支持将某种数据类型的数据导出到指定为另一种数据类型的 SQL 数据库列。 目标表不需要先存在。

  5. “重新生成输出”复选框决定是否在运行时执行组件以重新生成输出。

    它默认处于未选中状态,这意味着,如果先前已使用相同的参数执行了该组件,系统会重复使用上次运行的输出以缩短运行时间。

    如果选择它,系统会再次执行组件以重新生成输出。

  6. 在数据存储中定义数据所在的路径。 该路径是相对路径。以 data/testoutput 为例,它表示“导出数据”的输入数据将导出到你在该组件的“输出设置”中设定的数据存储的 data/testoutput 中。

    注意

    不允许使用空路径或 URL 路径。

  7. 对于“文件格式”,请选择数据的存储格式。

  8. 提交管道。

限制

由于存在数据存储访问限制,如果你的推理管道包含“导出数据”组件,它将在部署到实时终结点时被自动删除。

后续步骤

请参阅 Azure 机器学习可用的组件集