使用 GraphFrames 执行图分析的教程
本教程笔记本介绍如何使用 GraphFrames 执行图分析。 Databricks 建议使用运行用于机器学习的 Databricks Runtime 的群集,因为它包括 GraphFrames 的优化安装。
运行笔记本:
如果未使用运行 Databricks Runtime ML 的群集,请使用这些方法中的一种安装 GraphFrames 库。
从 Kaggle 下载旧金山湾区共享单车数据,并将其解压。 必须使用第三方身份验证登录 Kaggle,或创建 Kaggle 帐户并登录。
使用添加数据 UI 上传
station.csv
和trip.csv
。这些表名为
station_csv
和trip_csv
。