“转换为 CSV”组件

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件可将数据集转换为 CSV 格式,该格式可以下载、导出或者与 R 或 Python 脚本组件共享。

有关 CSV 格式的详细信息

CSV 格式(代表“逗号分隔值”)是许多外部机器学习工具使用的一种文件格式。 CSV 是使用开源语言(例如 R 或 Python)时常用的一种交换格式。

虽然你可以在 Azure 机器学习中执行大部分工作,但有时你可能会发现将数据集转换为 CSV 以在外部工具中使用非常方便。 例如:

  • 下载 CSV 文件以使用 Excel 打开它,或将其导入到关系数据库中。
  • 将 CSV 文件保存到云存储,并从 Power BI 连接到它以创建可视化效果。
  • 使用 CSV 格式准备要在 R 和 Python 中使用的数据。

将数据集转换为 CSV 时,该 csv 保存在 Azure 机器学习工作区中。 可以使用 Azure 存储实用程序直接打开并使用该文件。 还可以在设计器中通过选择“转换为 CSV”组件来访问 CSV,然后在右侧面板的“输出”选项卡下选择直方图图标来查看输出。 可以将 CSV 从 Results 文件夹下载到本地目录。

如何配置“转换为 CSV”

  1. 向管道添加“转换为 CSV”组件。 可以在设计器的“数据转换”组中找到该组件。

  2. 将它连接到会输出数据集的任何组件。

  3. 提交管道。

结果

选择“转换为 CSV” 的右面板中的“输出” 选项卡,然后在“端口输出” 下的其中一个图标上进行选择。

  • 注册数据集:选择图标,将 CSV 文件作为单独的数据集保存回 Azure 机器学习工作区。 可以在“我的数据集”部分的组件树中查找作为组件的数据集。

  • 查看输出:选择眼睛图标,然后按照说明浏览 Results_dataset 文件夹,并下载 data.csv 文件。

后续步骤

请参阅 Azure 机器学习可用的组件集