使用 describe detail 查看 Delta Lake 表详细信息
可以使用 DESCRIBE DETAIL
检索有关 Delta 表的详细信息(例如文件数、数据大小)。
DESCRIBE DETAIL '/data/events/'
DESCRIBE DETAIL eventsTable
有关 Spark SQL 语法的详细信息,请参阅 DESCRIBE DETAIL。
请参阅 Delta Lake API 文档,了解 Scala/Java/Python 语法详细信息。
详细信息架构
此操作的输出只有一行具有以下架构。
注意
看到的列取决于所使用的 Databricks Runtime 版本以及已启用的表功能。
列 | 类型 | 说明 |
---|---|---|
format | 字符串 | 表的格式,即 delta 。 |
id | 字符串 | 表的唯一 ID。 |
name | 字符串 | 在元存储中定义的表名称。 |
description | 字符串 | 表的说明。 |
location | 字符串 | 表的位置。 |
createdAt | timestamp | 表创建时间。 |
lastModified | timestamp | 表的上次修改时间。 |
partitionColumns | 字符串数组 | 如果表已分区,则为分区列的名称。 |
numFiles | long | 表最新版本中的文件数。 |
sizeInBytes | int | 表的最新快照的大小(以字节为单位)。 |
properties | string-string 映射 | 此表的所有属性集。 |
minReaderVersion | int | 可读取表的读取器最低版本(由日志协议而定)。 |
minWriterVersion | int | 可写入表的写入器最低版本(由日志协议而定)。 |
statistics | 使用字符串键映射 | 其他表级统计信息。 |
tableFeatures | 字符串数组 | 表支持的表功能列表。 请参阅 Azure Databricks 如何管理 Delta Lake 功能兼容性?。 |
clusteringColumns | 字符串数组 | 用于 Liquid 聚类分析的列。 请参阅将 liquid 聚类分析用于 Delta 表 |
输出如以下示例所示:
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format| id| name|description| location| createdAt| lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable| null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20| []| 10| 12345| []| 1| 2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+