可以使用 DESCRIBE DETAIL检索有关 Delta 表的详细信息(例如文件数、数据大小)。
DESCRIBE DETAIL '/data/events/'
DESCRIBE DETAIL eventsTable
有关 Spark SQL 语法详细信息,请参阅 DESCRIBE DETAIL。
有关 Scala/Java/Python 语法详细信息,请参阅 Delta Lake API 文档。
细节架构
此操作的输出只有一行,并具有以下模式。
注释
看到的列取决于所使用的 Databricks Runtime 版本以及已启用的表功能。
| 列 | 类型 | DESCRIPTION | 
|---|---|---|
| 格式 | 字符串 | 表的格式,即 delta。 | 
| 身份证 | 字符串 | 表的唯一 ID。 | 
| 姓名 | 字符串 | 在元存储中定义的表名称。 | 
| 描述 | 字符串 | 表的说明。 | 
| 位置 | 字符串 | 表的位置。 | 
| createdAt | 时间戳 | 表创建时间。 | 
| 上次修改 | 时间戳 | 表格最后修改的时间。 | 
| 分区列 | 字符串数组 | 如果表已分区,则为分区列的名称。 | 
| numFiles | 长整型 | 表最新版本中的文件数。 | 
| 字节大小 (sizeInBytes) | 整数 (int) | 表的最新快照的大小(以字节为单位)。 | 
| 属性 | string-string 映射 | 为此表设置的所有属性。 | 
| minReaderVersion | 整数 (int) | 可读取表的读取器的最低版本(根据日志协议)。 | 
| 最低编写器版本 | 整数 (int) | 可写入表的编写器(根据日志协议)的最低版本。 | 
| 统计学 | 使用字符串键映射 | 其他表级统计信息。 | 
| 表格特性 | 字符串数组 | 表支持的表功能列表。 请参阅 Delta Lake 功能兼容性和协议。 | 
| 聚簇列 | 字符串数组 | 用于 Liquid 聚类分析的列。 请参阅 对表使用液体聚类分析 | 
下面是输出外观的示例:
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
|format|                  id|              name|description|            location|           createdAt|       lastModified|partitionColumns|numFiles|sizeInBytes|properties|minReaderVersion|minWriterVersion|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+
| delta|d31f82d2-a69f-42e...|default.deltatable|       null|file:/Users/tuor/...|2020-06-05 12:20:...|2020-06-05 12:20:20|              []|      10|      12345|        []|               1|               2|
+------+--------------------+------------------+-----------+--------------------+--------------------+-------------------+----------------+--------+-----------+----------+----------------+----------------+