使用 describe detail 查看 Delta Lake 表详细信息

可以使用 DESCRIBE DETAIL检索有关 Delta 表的详细信息(例如文件数、数据大小)。

DESCRIBE DETAIL '/data/events/'

DESCRIBE DETAIL eventsTable

有关 Spark SQL 语法详细信息,请参阅 DESCRIBE DETAIL

有关 Scala/Java/Python 语法详细信息,请参阅 Delta Lake API 文档

细节架构

此操作的输出只有一行,并具有以下模式。

注意

看到的列取决于所使用的 Databricks Runtime 版本以及已启用的表功能。

类型 DESCRIPTION
格式 字符串 表的格式,即 delta
身份证 字符串 表的唯一 ID。
姓名 字符串 在元存储中定义的表名称。
描述 字符串 表的说明。
位置 字符串 表的位置。
createdAt 时间戳 表创建时间。
上次修改 时间戳 表格最后修改的时间。
分区列 字符串数组 如果表已分区,则为分区列的名称。
numFiles 长整型 表最新版本中的文件数。
sizeInBytes 整数 (int) 表的最新快照的大小(以字节为单位)。
属性 string-string 映射 为此表设置的所有属性。
minReaderVersion 整数 (int) 可读取表的读取器的最低版本(根据日志协议)。
最低编写器版本 整数 (int) 可写入表的编写器(根据日志协议)的最低版本。
统计学 使用字符串键映射 其他表级统计信息。
表格特性 字符串数组 表支持的表功能列表。 请参阅 Delta Lake 功能兼容性和协议
聚簇列 字符串数组 用于 Liquid 聚类分析的列。 请参阅将 liquid 聚类分析用于 Delta 表

下面是输出外观的示例:

+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format|                  id|              name|description|            location|           createdAt|       lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable|       null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20|              []|      10|      12345|        []|               1|               2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+