教程:在 Jupyter Notebook 中开始使用 Azure 机器学习

在本教程中,你将通过使用托管的基于云的工作站(计算实例)上的 Jupyter Notebook 来完成 Azure 机器学习的入门步骤。 本教程是所有其他 Jupyter Notebook 教程的前提。

本教程介绍以下操作:

  • 创建要在其他 Jupyter Notebook 教程中使用的 Azure 机器学习工作区
  • 将教程笔记本克隆到工作区中的文件夹。
  • 创建一个基于云的计算实例,其中已安装并预配置了 Azure 机器学习 Python SDK。

如果没有 Azure 订阅,请在开始前创建一个试用帐户。 立即试用 Azure 机器学习的试用版

创建工作区

Azure 机器学习工作区是云中的基础资源,用于试验、训练和部署机器学习模型。 它将 Azure 订阅和资源组关联到服务中一个易于使用的对象。

如果你已有 Azure 机器学习工作区,请跳转到克隆笔记本文件夹

可以通过许多方法来创建工作区。 本教程将通过 Azure 门户创建工作区,该门户是用于管理 Azure 资源的基于 Web 的控制台。

  1. 使用 Azure 订阅的凭据登录到 Azure 门户

  2. 在 Azure 门户的左上角,选择“+ 创建资源” 。

    创建新资源

  3. 使用搜索栏查找“机器学习” 。

  4. 选择“机器学习” 。

  5. 在“机器学习”窗格中,选择“创建”以开始 。

  6. 提供以下信息来配置新工作区:

    字段 说明
    工作区名称 输入用于标识工作区的唯一名称。 本示例使用 docs-ws 。 名称在整个资源组中必须唯一。 使用易于记忆且区别于其他人所创建工作区的名称。
    订阅 选择要使用的 Azure 订阅。
    资源组 使用订阅中的现有资源组,或者输入一个名称以创建新的资源组。 资源组保存 Azure 解决方案的相关资源。 本示例使用 docs-aml 。
    位置 选择离你的用户和数据资源最近的位置来创建工作区。
    工作区版本 选择“基本” 作为本教程的工作区类型。 工作区类型(基本和企业)确定要访问的功能和定价。 本教程中的所有内容均可使用基本或企业工作区来执行。
  7. 完成工作区配置后,选择“查看 + 创建” 。

    警告

    在云中创建工作区可能需要几分钟时间。

    完成创建后,会显示部署成功消息。

  8. 若要查看新工作区,请选择“转到资源” 。

重要

记下你的工作区和订阅 。 你将需要此信息以确保在正确的位置创建试验。

在工作区中运行笔记本

Azure 机器学习在你的工作区中提供了一个云笔记本服务器,实现了免安装的预配置体验。 如果你希望控制环境、包和依赖项,请使用自己的环境

克隆笔记本文件夹

在 Azure 机器学习工作室中完成以下试验设置并运行步骤。 此合并接口包括机器学习工具,所有技能级别的数据科学专业人员均可利用这些工具实现数据科学方案。

  1. 登录到 Azure 机器学习工作室

  2. 选择创建的订阅和工作区。

  3. 在左侧选择“笔记本”。

  4. 在顶部选择“示例”选项卡。

  5. 打开“Python”文件夹。

  6. 打开包含版本号的文件夹。 此数字表示 Python SDK 的当前版本。

  7. 选择“教程”文件夹右侧的“…”按钮,然后选择“克隆” 。

    显示“克隆”教程文件夹的屏幕截图。

  8. 文件夹列表显示访问该工作区的每个用户。 选择要将“tutorials”文件夹克隆到其中的文件夹。

打开克隆的笔记本

  1. 打开“用户文件”部分中关闭的“教程”文件夹 。

    重要

    可以查看“示例”文件夹中的笔记本,但无法从此文件夹运行笔记本。 若要运行笔记本,请确保在“用户文件”部分打开笔记本的克隆版本。

  2. 选择 tutorials/image-classification-mnist-data 文件夹中的 img-classification-part1-training.ipynb 文件。

    显示“打开”教程文件夹的屏幕截图。

  3. 在顶部栏上,选择用来运行笔记本的计算实例。 这些虚拟机 (VM) 中已预先配置了运行 Azure 机器学习所需的一切设置

  4. 如果未找到任何 VM,请选择“+ 添加”来创建计算实例 VM。

    1. 创建 VM 时,请遵循以下规则:

      • 名称是必填项,该字段不能为空。
      • 此名称在工作区或计算实例的 Azure 区域中的所有现有计算实例中必须唯一(不区分大小写)。 如果选择的名称不是唯一的,会收到警报。
      • 有效字符包括大小写字母、数字 0 到 9 和短划线字符 (-)。
      • 名称的长度必须介于 3 到 24 个字符之间。
      • 名称应以字母(而非数字或短划线字符)开头。
      • 如果使用短划线字符,短划线后需要跟至少一个字母。 例如,“Test-”、“test-0”、“test-01”无效,而“test-a0”、“test-0a”为有效实例。
    2. 从可用选项中选择 VM 大小。 对于本教程,默认 VM 是不错的选择。

    3. 然后选择“创建”。 设置 VM 可能需要大约五分钟时间。

  5. 当 VM 可用时,它将显示在顶部工具栏中。 现在,可以使用工具栏中的“全部运行”,或者在笔记本的代码单元中按 Shift+Enter 来运行笔记本 。

如果你有自定义小组件或喜欢使用 Jupyter 或 JupyterLab,请在最右侧选择“Jupyter”下拉列表。 然后选择“Jupyter”或“JupyterLab” 。 此时将打开一个新的浏览器窗口。

后续步骤

现在,你已设置了一个开发环境,请继续在 Jupyter Notebook 中训练模型。

如果你现在不打算继续学习任何其他教程,请在不使用云笔记本服务器 VM 时停止它,以降低成本。

如果使用了计算实例或笔记本 VM,请停止未使用的 VM,以降低成本。

  1. 在工作区中选择“计算”。

  2. 从列表中选择 VM。

  3. 选择“停止” 。

  4. 准备好再次使用服务器时,选择“启动” 。