CACHE SELECT

适用于:check marked yes Databricks SQL check marked yes Databricks Runtime

磁盘缓存中缓存由指定的简单 SELECT 查询访问的数据。 可以通过提供列名称列表来选择要缓存的列的子集,并通过提供谓词来选择行的子集。 这使得后续查询可以尽可能避免扫描原始文件。 此构造仅适用于 Delta 表和 Parquet 表。 如上所述,还支持视图,但扩展的查询仅限于简单查询。

语法

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

有关磁盘缓存与 Apache Spark 缓存之间的差别,请参阅自动和手动缓存

参数

示例

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3