在笔记本中开发和调试增量实时表管道

重要

用于增量实时表开发的笔记本体验处于公共预览版状态。

本文介绍 Azure Databricks 笔记本中有助于开发和调试增量实时表代码的功能。

功能概述

在使用用作现有增量实时表管道的源代码的 Python 或 SQL 笔记本时,可以将笔记本直接连接到管道。 将笔记本连接到管道后,可以使用以下功能:

  • 从笔记本启动并验证管道。
  • 查看管道的数据流图和事件日志以了解笔记本中的最新更新。
  • 在笔记本编辑器中查看管道诊断。
  • 在笔记本中查看管道群集的状态。
  • 从笔记本访问增量实时表 UI。

先决条件

  • 必须有一个现有的增量实时表管道,并使用 Python 或 SQL 笔记本作为源代码。
  • 你必须是管道的所有者或拥有 CAN_MANAGE 权限。

限制

  • 本文介绍的功能仅在 Azure Databricks 笔记本中可用。 不支持工作区文件。
  • 附加到管道后,Web 终端不可用。 因此,它不会显示为底部面板中的选项卡。

将笔记本连接到增量实时表管道

在笔记本中,单击用于选择计算的下拉菜单。 下拉菜单会显示使用此笔记本作为源代码的所有增量实时表管道。 若要将笔记本连接到管道,请从列表中选择它。

查看管道的群集状态

为了方便用户了解管道群集的状态,该状态会显示在计算下拉菜单中,绿色表示群集正在运行。

验证管道代码

可以验证管道以检查源代码中的语法错误,而无需处理任何数据。

若要验证管道,请执行以下操作之一:

  • 在笔记本的右上角,单击“验证”
  • 在任一笔记本单元格中按 Shift+Enter
  • 在单元格的下拉菜单中,单击“验证管道”

注意

如果你在现有更新已运行时尝试验证管道,则会显示一个对话框,询问你是否要终止现有更新。

启动管道

管道更新将执行以下操作:启动群集,发现并验证所有已定义的表和视图,并使用最新可用数据创建或更新表和视图。

若要开始更新管道,请单击笔记本右上角的“开始”按钮

如果单击“是”,则现有更新将会停止,并自动开始验证更新

查看更新状态

笔记本中的顶部面板会显示管道更新的状态:

  • 正在启动
  • 正在验证
  • 正在停止

查看错误和诊断

启动或验证管道后,任何错误将会显示出来并以红色下划线予以标识。 将鼠标悬停在错误上可查看详细信息。

查看管道事件

附加到管道后,笔记本底部会显示增量实时表事件日志选项卡。

事件日志

查看管道数据流图形

若要查看管道的数据流图,请使用笔记本底部的增量实时表图选项卡。 选择图形中的节点会在右侧面板中显示其架构。

数据流图形

如何从笔记本访问增量实时表 UI

若要轻松跳转到增量实时表 UI,请使用笔记本右上角的菜单。

通过笔记本在 DLT UI 中打开

从笔记本访问驱动程序日志和 Spark UI

可以从笔记本的“视图”菜单轻松访问与正在开发的管道关联的驱动程序日志和 Spark UI

访问驱动程序日志和 Spark UI