CACHE SELECT
适用于: Databricks SQL Databricks Runtime
在磁盘缓存中缓存由指定的简单 SELECT
查询访问的数据。
可以通过提供列名称列表来选择要缓存的列的子集,并通过提供谓词来选择行的子集。
这使得后续查询可以尽可能避免扫描原始文件。
此构造仅适用于 Delta 表和 Parquet 表。
如上所述,还支持视图,但扩展的查询仅限于简单查询。
语法
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
有关磁盘缓存与 Apache Spark 缓存之间的差别,请参阅自动和手动缓存。
参数
-
标识现有表。 名称不得包含时态规范。
示例
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3