Databricks 笔记本中的可视化效果

项目
10/18/2023

Azure Databricks 在 Databricks SQL 和笔记本中内置了对图表和可视化效果的支持。本页介绍如何使用 Databricks 笔记本中的可视化效果。若要了解如何在 Databricks SQL 中使用可视化效果，请参阅 Databricks SQL 中的可视化效果。

若要查看可视化效果的类型，请参阅可视化效果类型。

新建可视化效果

若要重新创建本部分中的示例，请使用以下代码：

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

若要创建可视化效果，请单击结果上方的 + 并选择“可视化效果”。这会显示可视化效果编辑器。

在“可视化效果类型”下拉菜单中，选择一种类型。
选择要在可视化效果中显示的数据。可用的字段取决于所选的类型。
单击“保存” 。

可视化工具

如果将鼠标悬停在可视化效果编辑器中图表的右上方，则会显示一个 Plotly 工具栏，可在其中执行“选择”、“缩放”和“平移”等操作。

Notebook visualization editor toolbar

如果将鼠标悬停在可视化效果编辑器外部的图表右上角，则会出现一个较小的工具子集：

Notebook chart toolbar

创建新的数据配置文件

备注

在 Databricks Runtime 9.1 LTS 及更高版本中可用。

数据配置文件以表格和图形格式显示 Apache Spark DataFrame、pandas DataFrame 或 SQL 表的摘要统计信息。若要基于结果单元格创建数据配置文件，请单击 +，并选择“数据配置文件”。

Azure Databricks 计算并显示摘要统计信息。

数值特征和分类特征显示在单独的表中。
在选项卡的顶部，可对特征进行排序或搜索。
在图表列的顶部，可选择显示直方图（标准）或分位数。
选中“展开”可放大图表。
选中“日志”可按对数刻度显示图表。
可将光标悬停在图表上以获得更多详细信息，如直方图列的边界和其中的行数，或分位数值。

你也可以通过编程方式生成数据配置文件；请参阅汇总命令 (dbutils.data.summarize)。

使用可视化效果和数据配置文件

注意

数据配置文件在 Databricks Runtime 9.1 LTS 及更高版本中可用。

重命名、复制或删除可视化效果或数据配置文件

若要重命名、复制或删除可视化效果或数据配置文件，请单击选项卡名称右侧的向下箭头。

还可以通过直接单击名称并就地编辑名称来更改名称。

编辑可视化效果

单击可视化效果下方的，打开可视化效果编辑器。完成更改后，单击“保存”。

编辑颜色

可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。

创建或编辑可视化效果。
单击“颜色”。
若要修改颜色，请单击该方块，并执行下列操作之一来选择新颜色：
- 在颜色选择器中单击颜色。
- 输入一个十六进制值。
单击颜色选择器外部的任意位置以将其关闭并保存更改。

暂时隐藏或显示一个系列

若要在可视化效果中隐藏系列，请单击图例中的系列。若要再次显示该系列，请在图例中再次单击该系列。

若要仅显示单个系列，请双击图例中的系列。若要显示其他系列，请单击各个系列。

下载可视化效果

要下载 .png 格式的可视化效果，请在笔记本单元格或可视化效果编辑器中单击相机图标。

在结果单元格中，将光标移到单元格上方时，相机图标将显示在右上角。
在可视化效果编辑器中，将光标移到图表上时，将显示相机图标。请参阅可视化效果工具。

向仪表板添加可视化效果或数据配置文件

单击选项卡名称右侧的向下箭头。
选择“添加到仪表板”。此时会显示可用仪表板视图的列表，以及“添加到新仪表板”菜单选项。
选择仪表板或选择“添加到新仪表板”。此时会显示仪表板，包括新添加的可视化效果或数据配置文件。