如何在 Azure Databricks 上使用 GraphFrames

本文包含示例笔记本,可帮助你开始在 Azure Databricks 上使用 GraphFrames。 GraphFrames 是 Apache Spark 的一个包,提供基于 DataFrame 的图形。 它在 Java、Python 和 Scala 中提供高级 API。 它旨在利用 Spark 数据帧提供 GraphX 的功能和扩展功能。 此扩展功能包括主题查找、基于 DataFrame 的序列化和表现性强的图形查询。

本文包含三个示例笔记本:Python 和 Scala 介绍性笔记本以及 Python 用户指南。 有关将 GraphFrames 与 Scala 配合使用的其他示例,请参阅 GraphFrames 用户指南 - Scala

针对 GraphFrames 的 Databricks Runtime 建议

Databricks 建议使用运行用于机器学习的 Databricks Runtime 的群集,因为它包括 GraphFrames 的优化安装。

如果不使用运行 Databricks Runtime ML 的群集,请从 GraphFrames 库下载 JAR 文件,将 JAR 文件加载到卷,并将其安装到群集

GraphFrames 入门

以下笔记本介绍如何使用 GraphFrames 执行图形分析。

使用 GraphFrames 进行图形分析 (Python)

获取笔记本

使用 GraphFrames (Scala) 执行图形分析

获取笔记本

GraphFrames 用户指南 (Python)

以下笔记本采用 Python 代码示例的形式介绍了如何使用 GraphFrame。

GraphFrames Python 笔记本

获取笔记本