什么是 AutoML?

Databricks AutoML 可帮助你自动将机器学习应用于数据集。 你提供数据集并确定预测目标,而 AutoML 则为模型训练准备数据集。 然后,AutoML 执行并记录一组试验,用于创建、调整和评估多个模型。 在进行模型评估后,AutoML 会显示结果,并提供一个 Python 笔记本,里面有每个试验运行的源代码,使你可查看、重现和修改代码。 AutoML 还会计算数据集的汇总统计信息,并将此信息保存在稍后可查看的笔记本中。

可以使用 Databricks AutoML 解决回归、分类和预测问题。 详细了解 Azure Databricks AutoML 工作原理

要求

  • Databricks Runtime 9.1 ML 或更高版本。 正式版 (GA) Databricks Runtime 10.4 LTS ML 或更高版本。
    • 对于时序预测,需要 Databricks Runtime 10.0 ML 或以上版本。
    • 对于 Databricks Runtime 9.1 LTS ML 及以上版本,AutoML 依赖于 databricks-automl-runtime 包,该包包含 AutoML 之外有用的组件,还有助于简化 AutoML 训练生成的笔记本。 可在 PyPI 中获取 databricks-automl-runtime
  • 除了在用于机器学习的 Databricks Runtime 中预安装的库以外,群集上不应安装其他库。
    • 对现有库版本的任何修改(删除、升级或降级)都会由于不兼容而导致运行失败。
  • AutoML 与共享访问模式群集不兼容。
  • 若要将 Unity Catalog 与 AutoML 配合使用,群集访问模式必须是“单用户”,并且你需是为该群集指定的单一用户。

后续步骤