AI 和机器学习集成

Azure Databricks 验证了与多种第三方解决方案的集成效果,这些解决方案支持常见的机器学习应用场景。

Ray 集成

Ray 是用于缩放 Python 应用程序的开源框架。 它包括特定于 AI 工作负载的库,使其特别适用于开发 AI 应用程序。 在 Azure Databricks 上运行 Ray 可以充分利用 Azure Databricks 生态系统的广度,通过开放源代码 Ray 中不可用的服务和集成来增强数据处理和机器学习工作流。

有关详细信息,请参阅 Azure Databricks 上的 Ray 是什么?

GraphFrames 集成

GraphFrames 是 Apache Spark 的一个包,提供基于 DataFrame 的图形。 它在 Java、Python 和 Scala 中提供高级 API。 其旨在提供 GraphX 的功能和扩展功能,从而利用 Spark DataFrames。 此扩展功能包括主题查找、基于 DataFrame 的序列化和表现性强的图形查询。

数据标记

标记附加训练数据是许多机器学习工作流(例如,分类或计算机视觉应用程序)的重要步骤。 Azure Databricks 不直接支持数数据标签;但是,Databricks 与 Labelbox 的合作伙伴关系可简化该过程。

请参阅 Labelbox 的 Partner Connect 文档