CACHE SELECT
适用于: Databricks Runtime
注意
在 SQL 仓库上或 Databricks Runtime 14.2 及更高版本中,函数 CACHE SELECT
被忽略。
在磁盘缓存中缓存由指定的简单 SELECT
查询访问的数据。
可以通过提供列名称列表来选择要缓存的列的子集,并通过提供谓词来选择行的子集。
这使得后续查询可以尽可能避免扫描原始文件。
此构造仅适用于 Delta 表和 Parquet 表。
如上所述,还支持视图,但扩展的查询仅限于简单查询。
语法
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
请参阅磁盘缓存与Spark 缓存,了解磁盘缓存和 Apache Spark 缓存之间的差异。
参数
-
标识现有表。 名称不得包含时态规范或选项规范。
示例
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3