使用 describe detail 查看 Delta Lake 表详细信息

可以使用 DESCRIBE DETAIL 检索有关 Delta 表的详细信息(例如文件数、数据大小)。

DESCRIBE DETAIL '/data/events/'

DESCRIBE DETAIL eventsTable

有关 Spark SQL 语法的详细信息,请参阅 DESCRIBE DETAIL

请参阅 Delta Lake API 文档,了解 Scala/Java/Python 语法详细信息。

详细信息架构

此操作的输出只有一行具有以下架构。

注意

看到的列取决于所使用的 Databricks Runtime 版本以及已启用的表功能。

类型​​ 说明
format 字符串 表的格式,即 delta
id 字符串 表的唯一 ID。
name 字符串 在元存储中定义的表名称。
description 字符串 表的说明。
location 字符串 表的位置。
createdAt timestamp 表创建时间。
lastModified timestamp 表的上次修改时间。
partitionColumns 字符串数组 如果表已分区,则为分区列的名称。
numFiles long 表最新版本中的文件数。
sizeInBytes int 表的最新快照的大小(以字节为单位)。
properties string-string 映射 此表的所有属性集。
minReaderVersion int 可读取表的读取器最低版本(由日志协议而定)。
minWriterVersion int 可写入表的写入器最低版本(由日志协议而定)。
statistics 使用字符串键映射 其他表级统计信息。
tableFeatures 字符串数组 表支持的表功能列表。 请参阅 Azure Databricks 如何管理 Delta Lake 功能兼容性?
clusteringColumns 字符串数组 用于 Liquid 聚类分析的列。 请参阅将 liquid 聚类分析用于 Delta 表

输出如以下示例所示:

+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format|                  id|              name|description|            location|           createdAt|       lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable|       null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20|              []|      10|      12345|        []|               1|               2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+