本文包含示例笔记本,可帮助你开始在 Azure Databricks 上使用 GraphFrames。 GraphFrames 是 Apache Spark 的一个包,提供基于 DataFrame 的图形。 它在 Java、Python 和 Scala 中提供高级 API。 它旨在利用 Spark 数据帧提供 GraphX 的功能和扩展功能。 此扩展功能包括主题查找、基于 DataFrame 的序列化和表现性强的图形查询。
本文包含三个示例笔记本:Python 和 Scala 介绍性笔记本以及 Python 用户指南。 有关将 GraphFrames 与 Scala 配合使用的其他示例,请参阅 GraphFrames 用户指南 - Scala。
Databricks 建议使用运行用于机器学习的 Databricks Runtime 的群集,因为它包括 GraphFrames 的优化安装。
如果您没有使用 Databricks Runtime ML 群集,请从 GraphFrames 库下载 JAR 文件,将其加载到存储卷,然后安装到您的群集中。
以下笔记本介绍如何使用 GraphFrames 执行图形分析。
以下笔记本采用 Python 代码示例的形式介绍了如何使用 GraphFrame。