“转换为 CSV”模块Convert to CSV module

本文介绍了 Azure 机器学习设计器(预览版)中的一个模块。This article describes a module in Azure Machine Learning designer (preview).

使用此模块,可以将数据集转换为可下载、导出或与 R 或 Python 脚本模块共享的 CSV 格式。Use this module to convert a dataset into a CSV format that can be downloaded, exported, or shared with R or Python script modules.

有关 CSV 格式的详细信息More about the CSV format

CSV 格式(代表“逗号分隔值”)是许多外部机器学习工具使用的一种文件格式。The CSV format, which stands for "comma-separated values", is a file format used by many external machine learning tools. CSV 是使用开源语言(例如 R 或 Python)时常用的一种交换格式。CSV is a common interchange format when working with open-source languages such as R or Python.

虽然你可以在 Azure 机器学习中执行大部分工作,但有时你可能会发现将数据集转换为 CSV 以在外部工具中使用非常方便。Even if you do most of your work in Azure Machine Learning, there are times when you might find it handy to convert your dataset to CSV to use in external tools. 例如:For example:

  • 下载 CSV 文件以使用 Excel 打开它,或将其导入到关系数据库中。Download the CSV file to open it with Excel, or import it into a relational database.
  • 将 CSV 文件保存到云存储,并从 Power BI 连接到它以创建可视化效果。Save the CSV file to cloud storage and connect to it from Power BI to create visualizations.
  • 使用 CSV 格式准备要在 R 和 Python 中使用的数据。Use the CSV format to prepare data for use in R and Python.

将数据集转换为 CSV 时,该 csv 保存在 Azure ML 工作区中。When you convert a dataset to CSV, the csv is saved in your Azure ML workspace. 可以使用 Azure 存储实用程序直接打开并使用该文件。You can use an Azure storage utility to open and use the file directly. 还可以选择“转换为 CSV” 模块来访问设计器中的 CSV,然后在右侧面板中的“输出” 选项卡下选择直方图图标来查看输出。You can also access the CSV in the designer by selecting the Convert to CSV module, then select the histogram icon under the Outputs tab in the right panel to view the output. 可以将 CSV 从 Results 文件夹下载到本地目录。You can download the CSV from the Results folder to a local directory.

如何配置“转换为 CSV”How to configure Convert to CSV

  1. 将“转换为 CSV”模块添加到管道。Add the Convert to CSV module to your pipeline. 可以在设计器的“数据转换” 组中找到此模块。You can find this module in the Data Transformation group in the designer.

  2. 将它连接到可以输出数据集的任何模块。Connect it to any module that outputs a dataset.

  3. 提交管道。Submit the pipeline.

结果Results

选择“转换为 CSV” 的右面板中的“输出” 选项卡,然后在“端口输出” 下的其中一个图标上进行选择。Select the Outputs tab in the right panel of Convert to CSV, and select on one of these icons under the Port outputs.

  • 注册数据集:选择图标,将 CSV 文件作为单独的数据集保存回 Azure ML 工作区。Register dataset: Select the icon and save the CSV file back to the Azure ML workspace as a separate dataset. 可以在“我的数据集”部分下的模块树中找到作为模块的数据集。 You can find the dataset as a module in the module tree under the My Datasets section.

  • 查看输出:选择眼睛图标,然后按照说明浏览 Results_dataset 文件夹,并下载 data.csv 文件。View output: Select the eye icon, and follow the instruction to browse the Results_dataset folder, and download the data.csv file.

后续步骤Next steps

请参阅 Azure 机器学习的可用模块集See the set of modules available to Azure Machine Learning.