本页概述了标准计算。
什么是标准计算?
标准计算是使用标准访问模式配置的计算。 任何给定权限的用户都可以使用标准计算资源。
建议对大多数工作负荷使用标准计算。 标准计算允许任意数量的用户在同一计算资源上附加和并发执行工作负荷,从而节省成本并简化计算管理。 标准计算以完全隔离方式运行用户代码,无法访问较低级别的资源。
访问模式选择
创建通用或作业计算资源时配置访问模式。 访问模式设置位于计算 UI 中的 “高级 ”部分下,由 data_security_mode
API 表示。
默认情况下,在 UI 中,访问模式设置为 “自动”,这意味着根据所选的 Databricks Runtime 自动选择访问模式。 除非选择了低于 14.3 的机器学习运行时或 Databricks Runtime,否则自动默认为 “标准 ”,在这种情况下使用 Dedicated 。
何时使用标准计算
建议对大多数工作负荷使用标准计算,包括:
- 常规数据工程和 ETL 管道:大多数数据处理工作负载
- 协作数据科学项目:Teams 共同研究分析和模型开发
- 交互式数据探索:即席分析和基于笔记本的开发
- 成本优化:想要跨多个用户共享计算资源
仅针对需要特权计算机访问、RDD API、分布式 ML、GPU 或 R 的专用工作负荷选择专用计算。有关标准计算限制的列表,请参阅 标准计算要求和限制。
语言和运行时支持
标准计算支持以下编程语言:
- Python:对所有 Databricks Runtime 版本完全支持
- SQL:完全支持所有 Databricks Runtime 版本
- Scala:通过 Unity 目录支持 Databricks Runtime 13.3 LTS 及更高版本
- R:标准计算不支持
用于用户隔离的 Lakeguard
标准计算使用 Azure Databricks Lakeguard 提供安全的用户隔离和数据治理。 Lakeguard 采用高级代码隔离技术,将用户代码与底层 Spark 基础结构分开。
有关详细信息,请参阅 Databricks 如何强制实施用户隔离?。