连接到 Labelbox

Labelbox 是一个训练数据平台,用于从图像、视频、音频、文本和平铺图像创建训练数据。 使用 Labelbox,AI 团队可以自定义工作流程,以在单个统一平台中操作、管理和改进数据标记、数据编目和模型调试。 Labelbox 旨在帮助 AI 团队构建和操作生产级机器学习系统。

可以将具有 Databricks 运行时的机器学习版本的 Azure Databricks 群集连接到 Labelbox。

手动连接到 Labelbox

本部分中的步骤描述了如何将 Labelbox 连接到 Azure Databricks 群集。

要求

必须拥有一个运行用于机器学习的 Databricks Runtime 的可用群集。 要检查现有的群集,请在工作区中显示群集时在运行时列中查找 ML。 如果没有可用的 Databricks Runtime ML 群集,请创建一个群集,对于“Databricks Runtime 版本”,从“ML”列表中选择一个版本。

连接步骤

若要手动连接到 Labelbox,请执行以下操作:

  1. 转到 Labelbox 页面以注册一个新的 Labelbox 帐户或登录到你现有的 Labelbox 帐户。
  2. 为你的 Labelbox 帐户创建 Labelbox API 密钥(如果还没有执行操作)。 复制 API 密钥并将其保存在安全位置,因为该密钥最终会被隐藏,稍后你将需要此密钥。
  3. 在你的工作区中检查 Labelbox 入门笔记本:
    1. 在边栏中,单击“工作区”>“已共享”。
    2. 如果名为 labelbox_demo 的文件夹尚不存在,请创建此文件夹:i. 单击“已共享”旁边的向下箭头。 ii. 单击“创建”>“文件夹”。 iii. 输入 labelbox_demo,iv. 单击“创建文件夹”。
    3. 单击 labelbox_demo 文件夹。 如果文件夹中不存在名为 labelbox_databricks_example.ipynb 的入门笔记本,请导入此笔记本:i. 单击“labelbox_demo”旁边的向下箭头。 ii. 单击“导入” 。 iii. 单击“URL”。 iv. 输入 https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb,然后单击“导入”。
  4. 继续设置 ML 群集和 Labelbox 入门笔记本。

设置 ML 群集和 Labelbox 入门笔记本

  1. 检查所需的 Labelbox 库是否已安装在你的 ML 群集中:
    1. 在边栏中,单击“计算”。

    2. 单击你的 ML 群集。 如有必要,请使用“筛选”框查找它。

    3. 单击“库”选项卡。

    4. 如果未列出 labelbox 包,请安装此包: i. 单击“新安装”。 ii. 单击“PyPI”。 iii. 对于“包”,输入 labelbox。 iv. 单击“安装” 。

    5. 如果未列出 labelspark 包,请安装此包: i. 单击“新安装”。 ii. 单击“PyPI”。 iii. 对于“包”,输入 labelspark。 iv. 单击“安装” 。

  2. 将 ML 群集附加到初学者笔记本:
    1. 在边栏中,单击“工作区”>“共享”>“labelbox_demo”>“labelbox_databricks_example.ipynb”。
    2. 将 ML 群集连接到笔记比。
  3. 浏览笔记本以了解如何自动化 Labelbox。

其他资源