基因组学指南

若要了解如何开始在 Azure Databricks 上使用基因组学,请参阅:

用于基因组学的 Databricks Runtime(已启用)提供与 Apache Spark 并行的二级分析管道。

注意

用于基因组学的 Databricks Runtime 现已弃用。 Databricks 不再开发新版本的用于基因组学的 Databricks Runtime,并将在 2022年 9 月 24 日删除对用于基因组学的 Databricks Runtime 的支持,届时用于基因组学的 Databricks Runtime 7.3 LTS 支持将终止。 到那时,创建群集时将无法选择用于基因组学的 Databricks Runtime。 有关 Databricks Runtime 弃用策略和计划的详细信息,请参阅支持的 Databricks 运行时版本和支持计划。 属于运行时一部分的生物信息学库已作为 Docker 容器发布,可在 ProjectGlow Dockerhub 页上找到。

作为 Databricks-Regeneron 项目 Glow的一部分,用于基因组学的 Databricks Runtime 的功能已开放源代码。 有关 Glow 的信息,请参阅 Glow 文档