Spark Submit （旧版、已弃用，将于 2026 年年中删除）

Spark Submit 任务类型是将 JAR 配置为任务的旧模式。

警告

Spark 提交任务当前已被弃用，并计划于 2026 年年中移除。对于新用例，不允许使用此任务类型，强烈建议不要对现有客户使用。 Databricks 建议改为将 JAR 任务用于 JVM 工作负荷。请参阅用于作业的 JAR 任务。

局限性

只能在新群集上运行 spark-submit 任务。
必须将 JAR 文件上传到与计算配置兼容的位置或 Maven 存储库。请参阅 Java 和 Scala 库支持。
无法访问存储在卷中的 JAR 文件。
Spark-submit 不支持群集自动缩放。若要详细了解自动缩放，请参阅群集自动缩放。
Spark-submit 不支持群集自动终止。使用 Spark-submit 启动的 Spark 应用程序应在完成时显式调用 System.exit 。
Spark-submit 不支持 Databricks Utilities （dbutils）引用。若要使用 Databricks 实用程序，请改用 JAR 任务。
如果使用启用了 Unity 目录的群集，则仅当群集使用专用访问模式时，才支持 spark-submit。不支持标准访问模式。请参阅访问模式。
结构化流式处理作业的最大并发运行数不得设置为大于 1。流式处理作业应设置为（每分钟）使用 cron 表达式 "* * * * * ?" 运行。由于流式处理任务持续运行，因此它应始终是作业中的最终任务。

通过执行以下操作，从作业 UI 中的“任务”选项卡添加 Spark Submit 任务：