CACHE SELECT

项目
11/18/2023

适用于： check marked yes Databricks SQL Databricks Runtime

在磁盘缓存中缓存由指定的简单 SELECT 查询访问的数据。可以通过提供列名称列表来选择要缓存的列的子集，并通过提供谓词来选择行的子集。这使得后续查询可以尽可能避免扫描原始文件。此构造仅适用于 Delta 表和 Parquet 表。如上所述，还支持视图，但扩展的查询仅限于简单查询。

语法

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

有关磁盘缓存与 Apache Spark 缓存之间的差别，请参阅自动和手动缓存。

参数

table_name

标识现有表。名称不得包含时态规范。

示例

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3