Databricks 笔记本中的可视化效果

Azure Databricks 在 Databricks SQL 和笔记本中内置了对图表和可视化效果的支持。 本页介绍如何使用 Databricks 笔记本中的可视化效果。 若要了解如何在 Databricks SQL 中使用可视化效果,请参阅 Databricks SQL 中的可视化效果

若要查看可视化效果的类型,请参阅可视化效果类型

新建可视化效果

若要重新创建本部分中的示例,请使用以下代码:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

若要创建可视化效果,请单击结果上方的 + 并选择“可视化效果”。 这会显示可视化效果编辑器。

New visualization menu

  1. 在“可视化效果类型”下拉菜单中,选择一种类型。

    Visualization editor

  2. 选择要在可视化效果中显示的数据。 可用的字段取决于所选的类型。

  3. 单击“保存” 。

可视化工具

如果将鼠标悬停在可视化效果编辑器中图表的右上方,则会显示一个 Plotly 工具栏,可在其中执行“选择”、“缩放”和“平移”等操作。

Notebook visualization editor toolbar

如果将鼠标悬停在可视化效果编辑器外部的图表右上角,则会出现一个较小的工具子集:

Notebook chart toolbar

创建新的数据配置文件

备注

在 Databricks Runtime 9.1 LTS 及更高版本中可用。

数据配置文件以表格和图形格式显示 Apache Spark DataFrame、pandas DataFrame 或 SQL 表的摘要统计信息。 若要基于结果单元格创建数据配置文件,请单击 +,并选择“数据配置文件”。

Azure Databricks 计算并显示摘要统计信息。

Data Profile

  • 数值特征和分类特征显示在单独的表中。
  • 在选项卡的顶部,可对特征进行排序或搜索。
  • 在图表列的顶部,可选择显示直方图(标准)或分位数。
  • 选中“展开”可放大图表。
  • 选中“日志”可按对数刻度显示图表。
  • 可将光标悬停在图表上以获得更多详细信息,如直方图列的边界和其中的行数,或分位数值。

你也可以通过编程方式生成数据配置文件;请参阅汇总命令 (dbutils.data.summarize)

使用可视化效果和数据配置文件

注意

数据配置文件在 Databricks Runtime 9.1 LTS 及更高版本中可用。

重命名、复制或删除可视化效果或数据配置文件

若要重命名、复制或删除可视化效果或数据配置文件,请单击选项卡名称右侧的向下箭头。

Notebook visualization drop down menu

还可以通过直接单击名称并就地编辑名称来更改名称。

编辑可视化效果

单击可视化效果下方的 Edit visualization button,打开可视化效果编辑器。 完成更改后,单击“保存”。

编辑颜色

可以在创建可视化效果或对其进行编辑时自定义可视化效果的颜色。

  1. 创建或编辑可视化效果。
  2. 单击“颜色”。
  3. 若要修改颜色,请单击该方块,并执行下列操作之一来选择新颜色:
    • 在颜色选择器中单击颜色。
    • 输入一个十六进制值。
  4. 单击颜色选择器外部的任意位置以将其关闭并保存更改。

暂时隐藏或显示一个系列

若要在可视化效果中隐藏系列,请单击图例中的系列。 若要再次显示该系列,请在图例中再次单击该系列。

若要仅显示单个系列,请双击图例中的系列。 若要显示其他系列,请单击各个系列。

下载可视化效果

要下载 .png 格式的可视化效果,请在笔记本单元格或可视化效果编辑器中单击相机图标 camera icon

  • 在结果单元格中,将光标移到单元格上方时,相机图标将显示在右上角。

    camera in notebook cell

  • 在可视化效果编辑器中,将光标移到图表上时,将显示相机图标。 请参阅可视化效果工具

向仪表板添加可视化效果或数据配置文件

  1. 单击选项卡名称右侧的向下箭头。
  2. 选择“添加到仪表板”。 此时会显示可用仪表板视图的列表,以及“添加到新仪表板”菜单选项。
  3. 选择仪表板或选择“添加到新仪表板”。 此时会显示仪表板,包括新添加的可视化效果或数据配置文件。