使用 GraphFrames 执行图分析的教程

本教程笔记本介绍如何使用 GraphFrames 执行图分析。 Databricks 建议使用运行用于机器学习的 Databricks Runtime 的群集,因为它包括 GraphFrames 的优化安装。

运行笔记本:

  1. 如果未使用运行 Databricks Runtime ML 的群集,请使用这些方法中的一种安装 GraphFrames 库

  2. 从 Kaggle 下载旧金山湾区共享单车数据,并将其解压。 必须使用第三方身份验证登录 Kaggle,或创建 Kaggle 帐户并登录。

  3. 使用添加数据 UI 上传 station.csvtrip.csv

    这些表名为 station_csvtrip_csv

使用 GraphFrames 笔记本执行图分析

获取笔记本