用于机器学习的 Databricks Runtime 15.4 LTS

用于机器学习的 Databricks Runtime 15.4 LTS 基于 Databricks Runtime 15.4 LTS,为机器学习和数据科学提供了随时可用的环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 TorchDistributor 进行分布式深度学习训练。

注意

LTS 表示此版本受长期支持。 请参阅 Databricks Runtime LTS 版本生命周期

提示

若要查看已终止支持 (EoS) 的 Databricks Runtime 版本的发行说明,请参阅终止支持 Databricks Runtime 发行说明。 EoS Databricks Runtime 版本已停用,可能不会更新。

新增功能和改进

Databricks Runtime 15.4 LTS ML 是基于 Databricks Runtime 15.4 LTS 构建的。 若要了解 Databricks Runtime 15.4 LTS 中的新增功能,包括 Apache Spark MLlib 和 SparkR,请参阅 Databricks Runtime 15.4 LTS 发行说明。

用于分类的 AutoML 样本权重

AutoML 现在支持分类的样本权重,让你可以在分类模型训练期间调整每个类的重要性。 有关详细信息,请参阅 AutoML Python API 的分类参数

Databricks 特征工程客户端的更改

Databricks Runtime 15.4 LTS ML 随附的版本 databricks-feature-engineering 为 0.6.0。 对于在 2025 年 3 月 31 日或之后创建且未启用 Photon 的计算,安装的 databricks-feature-engineering 版本为 0.8.0。

有关 Databricks 特征工程 Python API 中的新增功能的信息,请参阅功能工程客户端发行说明

其他更改

Petastorm 现已弃用

此 Petastorm 包现已弃用。 15.4 LTS ML 之后的版本不会预安装此包。 建议改为使用 Mosaic 流式处理从云存储加载大型数据集。

Spark Tensorflow 分发服务器现已弃用

spark-tensorflow-distributor 包现已弃用。 15.4 LTS ML 之后的版本不会预安装此包。 Ray on Databricks分布式训练 Tensorflow 或 Keras 模型的推荐替代品

系统环境

Databricks Runtime 15.4 LTS ML 中的系统环境与 Databricks Runtime 15.4 LTS 不同,如下所示:

  • 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
    • CUDA 12.1
    • cusolver 11.4.5.107-1
    • cupti 12.1
    • cuDNN 8.9.0.131-1
    • NCCL 2.17.1
    • TensorRT 8.6.1.6-1

图书馆

以下部分列出了 Databricks Runtime 15.4 LTS ML 中包含的库,这些库与 Databricks Runtime 15.4 LTS 中包含的不同。

本节内容:

顶层库

Databricks Runtime 15.4 LTS ML 包含以下顶层

Python 库

Databricks Runtime 15.4 LTS ML 使用 virtualenv 进行 Python 包管理,并且包含许多常用的 ML 包。

除了在以下部分中指定的包,Databricks Runtime 15.4 LTS ML 还包含以下包:

  • hyperopt 0.2.7+db3
  • sparkdl 3.0.0_db1
  • automl 1.28.0

若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请执行以下步骤:

  1. 下载 requirements-15.4.txt 文件。

  2. 在 Ubuntu 系统上,运行 sudo apt-get install libpq-dev libcairo2-dev libdbus-1-dev libgirepository1.0-dev libsnappy-dev 以安装系统库。

  3. 运行 pip install -r requirements-15.4.txt --extra-index-url https://download.pytorch.org/whl/cpu。 此命令安装 Databricks Runtime ML 使用的所有开放源代码库,但不安装 Databricks 开发的库,例如 databricks-automl 或者 hyperopthorovod 的 Databricks 分支。

CPU 群集上的 Python 库

版本 版本 版本
absl-py 1.0.0 加速 0.31.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 异步-超时 4.0.2
属性 22.1.0 audioread 3.0.1 azure-core 1.30.2
azure-cosmos 4.3.1 Azure 身份识别 1.17.1 azure-storage-blob 12.19.1
azure-storage-file-datalake 12.14.0 回调 0.2.0 bcrypt 3.2.0
beautifulsoup4 4.12.2 黑色 23.3.0 漂白剂 4.1.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 Brotli 1.0.9 cachetools (缓存工具) 5.4.0
目录 2.0.10 类别编码器 2.6.3 certifi 2023.7.22
cffi 1.15.1 chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4
断路器 1.4.0 单击 8.0.4 cloudpathlib 0.16.0
cloudpickle 2.2.1 cmdstanpy 1.2.2 五彩缤纷 0.5.6
通讯 0.1.2 糖果 0.1.4 configparser 5.2.0
contourpy 1.0.5 密码系统 41.0.3 骑行者 0.11.0
cymem 2.0.8 Cython 0.29.32 英安岩 1.8.1
databricks-automl-runtime 0.2.21 Databricks-特征工程 0.6.0 Databricks软件开发工具包 (databricks-sdk) 0.20.0
dataclasses-json 0.6.7 数据集 2.19.1 dbl-tempo 0.1.26
dbu-python 1.2.18 debugpy 1.6.7 装饰师 5.1.1
deepspeed 0.14.4 defusedxml 0.7.1 已放弃 1.2.14
莳萝 0.3.6 磁盘缓存 5.6.3 distlib 0.3.8
dm-tree 0.1.8 入口点 0.4 评估 0.4.2
正在执行 0.8.3 各个方面概述 1.1.1 Farama-通知 0.0.4
fastjsonschema 2.20.0 fasttext 0.9.2 文件锁 (filelock) 3.13.4
烧瓶 2.2.5 FlatBuffers 24.3.25 fonttools(字体工具) 4.25.0
frozenlist 1.3.3 fsspec 2023.5.0 未来 0.18.3
加斯特 0.4.0 gitdb (Git数据库) 4.0.11 GitPython 3.1.27
google-api-core 2.18.0 google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0
google-cloud-core (Google云核心) 2.4.1 谷歌云存储 (Google Cloud Storage) 2.10.0 google-crc32c 1.5.0
google-pasta 0.2.0 google-resumable-media 2.7.1 googleapis-common-protos 1.63.0
greenlet 2.0.1 grpcio 1.60.0 grpcio-status 1.60.0
gunicorn 20.1.0 gviz-api 1.10.0 体育馆 0.28.1
h11 0.14.0 h5py 3.10.0 hjson 3.1.0
假期 0.45 horovod 0.28.1+db1 htmlmin 0.1.12
httpcore 1.0.5 httplib2 0.20.2 httpx 0.27.0
huggingface-hub(哈根脸社区平台) 0.23.4 idna 3.4 ImageHash 4.3.1
ImageIO 2.31.1 imbalanced-learn 0.11.0 importlib-metadata 6.0.0
importlib_resources 6.4.0 ipyflow-core 0.0.198 ipykernel 6.25.1
ipython 8.15.0 ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 7.7.2
isodate 0.6.1 它很危险 2.0.1 Jax-Jumpy 1.0.0
jedi 0.18.1 吉普尼 0.7.1 Jinja2 3.1.2
jmespath 0.10.0 joblib 1.2.0 joblibspark 0.5.1
JSON补丁 1.33 jsonpointer 3.0.0 jsonschema 4.17.3
Jupyter 服务器 1.23.4 jupyter_client(Jupyter 客户端) 7.4.9 jupyter_core(Jupyter核心) 5.3.0
jupyterlab-pygments 0.1.2 keras 3.2.1 钥匙圈 23.5.0
kiwisolver 1.4.4 langchain 0.1.20 Langchain社区 0.0.38
langchain-core 0.1.52 langchain-文本分割器 0.0.2 语言代码 3.4.0
langsmith 0.1.63 语言数据 1.2.0 launchpadlib 1.10.16
lazr.restfulclient 0.14.4 lazr.uri 1.0.6 lazy_loader 0.2
libclang 15.0.6.1 librosa 0.10.1 lightgbm 4.3.0
linkify -it-py 2.0.0 llvmlite 0.40.0 lxml 4.9.2
lz4 4.3.2 Mako 1.2.0 marisa-trie 1.1.1
Markdown 3.4.1 markdown-it-py 2.2.0 MarkupSafe 2.1.1
棉花糖 3.21.2 matplotlib 3.7.2 matplotlib-inline 0.1.6
mdit-py-plugins 0.3.0 mdurl 0.1.0 memray 1.13.3
mistune 0.8.4 ml-dtypes 0.3.2 mlflow-skinny* 2.13.1
more-itertools 8.10.0 mosaicml-streaming 0.7.4 mpmath 1.3.0
MSAL 1.29.0 msal-extensions 1.2.0 msgpack 1.0.8
multidict 6.0.2 多方法 1.12 多进程 0.70.14
murmurhash 1.0.10 mypy-extensions 0.4.3 namex 0.0.8
nbclassic 0.5.5 nbclient 0.5.13 nbconvert 6.5.4
nbformat 5.7.0 nest-asyncio 1.5.6 NetworkX 3.1
忍者 1.11.1.1 nltk 3.8.1 笔记本 6.5.4
notebook_shim 0.2.2 numba 0.57.1 numpy 1.23.5
nvidia-ml-py 12.555.43 oauthlib 3.2.0 oci 2.126.4
openai 1.35.3 opencensus 0.11.4 opencensus-context 0.1.3
opentelemetry-api 1.25.0 opentelemetry-sdk 1.25.0 OpenTelemetry语义约定 0.46b0
opt-einsum 3.3.0 optree 0.12.1 orjson 3.10.6
打包 23.2 熊猫 1.5.3 pandocfilters 1.5.0
paramiko 3.4.0 帕尔索 0.8.3 pathspec 0.10.3
替罪羊 0.5.3 petastorm 0.12.1 pexpect 4.8.0
phik 0.12.4 pickleshare 0.7.5 枕头 9.4.0
果仁 23.2.1 platformdirs 3.10.0 plotly 5.9.0
pmdarima 2.0.4 狗狗 1.8.1 portalocker 2.10.1
preshed 3.0.9 prometheus-client 0.14.1 prompt-toolkit 3.0.36
先知 1.1.5 proto-plus 1.24.0 protobuf 4.24.1
psutil 5.9.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 py-cpuinfo 8.0.0 py-spy 0.3.14
pyarrow 14.0.1 pyarrow-hotfix 0.6 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.13.1 pyccolo 0.0.52
Python代码解析器 2.21 pydantic 1.10.6 Pygments 2.15.1
PyGObject 3.42.1 PyJWT 2.3.0 PyNaCl 1.5.0
pyodbc 4.0.38 pyOpenSSL 23.2.0 pyparsing 3.0.9
pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0 pytesseract 0.3.10 python-dateutil 2.8.2
Python代码编辑器 1.0.4 python-lsp-jsonrpc 1.1.1 python-snappy 0.6.1
Python时区库pytz 2022年7月 PyWavelets 1.4.1 PyYAML 6.0
pyzmq 23.2.0 射线 2.20.0 正则表达式 2022.7.9
请求 2.31.0 requests-oauthlib 1.3.1 13.7.1
rsa 4.9 s3transfer 0.10.2 safetensors 0.4.2
scikit-image 0.20.0 scikit-learn 1.3.0 scipy 1.11.1
seaborn 0.12.2 SecretStorage 3.3.1 Send2Trash 1.8.0
sentence-transformers (句子转换器) 2.7.0 sentencepiece 0.1.99 setuptools 68.0.0
沙普 0.44.0 simplejson 3.17.6 6 1.16.0
切片机 0.0.7 smart-open 5.2.1 smmap 5.0.0
思尼菲欧 1.2.0 音频文件 0.12.1 滤汤器 2.4
soxr 0.3.7 spacy 3.7.2 spacy-legacy 3.0.12
spacy-loggers 1.0.5 spark-tensorflow-distributor 1.0.0 SQLAlchemy 1.4.39
sqlparse 0.4.2 srsly 2.4.8 ssh-import-id 5.11
堆栈数据 0.2.0 斯塔尼奥 0.5.1 statsmodels 0.14.0
sympy 1.11.1 tangled -up-in-unicode 0.2.0 毅力 8.2.2
tensorboard 2.16.2 TensorBoard数据服务器 0.7.2 tensorboard_plugin_profile 2.15.1
tensorboardX 2.6.2.2 TensorFlow 2.16.1 tensorflow-estimator 2.15.0
tensorflow-io-gcs-filesystem 0.37.1 termcolor 2.4.0 完成 0.17.1
文本 0.63.3 tf_keras 2.16.0 thinc 8.2.3
threadpoolctl 2.2.0 tifffile 2021年7月2日 tiktoken 0.5.2
tinycss2 1.2.1 tokenize-rt 4.2.1 分词器 0.19.0
火炬 2.3.1+cpu torcheval 0.0.7 torchvision 0.18.1+cpu
龙卷风 6.3.2 tqdm 4.65.0 Traitlets 5.7.1
变压器 4.41.2 类型守卫 2.13.3 打字员 0.9.4
输入检查 0.9.0 typing_extensions 4.10.0 tzdata 2022年1月
uc-micro-py 1.0.1 ujson 5.4.0 无人值守升级 0.1
urllib3 1.26.16 virtualenv 20.24.2 愿景 0.7.5
wadllib 1.3.6 山葵 1.1.2 wcwidth 0.2.5
黄鼠狼 0.3.4 Web编码 0.5.1 WebSocket客户端 0.58.0
Werkzeug 2.2.3 轮子 0.38.4 wordcloud 1.9.3
裹住 1.14.1 xgboost 2.0.3 xxhash 3.4.1
yarl 1.8.1 ydata-profiling 4.5.1 齐普 3.11.0
zstd 1.5.5.1

* 对于在 2025 年 2 月 12 日或之后创建的且未为 Photon 启用的计算, mlflow-skinny 已升级到 2.19.0。

GPU 群集上的 Python 库

版本 版本 版本
absl-py 1.0.0 加速 0.31.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 异步-超时 4.0.2
属性 22.1.0 audioread 3.0.1 azure-core 1.30.2
azure-cosmos 4.3.1 Azure 身份识别 1.17.1 azure-storage-blob 12.19.1
azure-storage-file-datalake 12.14.0 回调 0.2.0 bcrypt 3.2.0
beautifulsoup4 4.12.2 黑色 23.3.0 漂白剂 4.1.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 Brotli 1.0.9 cachetools (缓存工具) 5.4.0
目录 2.0.10 类别编码器 2.6.3 certifi 2023.7.22
cffi 1.15.1 chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4
断路器 1.4.0 单击 8.0.4 cloudpathlib 0.16.0
cloudpickle 2.2.1 cmdstanpy 1.2.2 五彩缤纷 0.5.6
通讯 0.1.2 糖果 0.1.4 configparser 5.2.0
contourpy 1.0.5 密码系统 41.0.3 骑行者 0.11.0
cymem 2.0.8 Cython 0.29.32 英安岩 1.8.1
databricks-automl-runtime 0.2.21 Databricks-特征工程 0.6.0 Databricks软件开发工具包 (databricks-sdk) 0.20.0
dataclasses-json 0.6.7 数据集 2.19.1 dbl-tempo 0.1.26
dbu-python 1.2.18 debugpy 1.6.7 装饰师 5.1.1
deepspeed 0.14.4 defusedxml 0.7.1 已放弃 1.2.14
莳萝 0.3.6 磁盘缓存 5.6.3 distlib 0.3.8
dm-tree 0.1.8 einops 0.8.0 入口点 0.4
评估 0.4.2 正在执行 0.8.3 各个方面概述 1.1.1
Farama-通知 0.0.4 fastjsonschema 2.20.0 fasttext 0.9.2
文件锁 (filelock) 3.13.4 flash-attn 2.5.9.post1 烧瓶 2.2.5
FlatBuffers 24.3.25 fonttools(字体工具) 4.25.0 frozenlist 1.3.3
fsspec 2023.5.0 未来 0.18.3 加斯特 0.4.0
gitdb (Git数据库) 4.0.11 GitPython 3.1.27 google-api-core 2.18.0
google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0 google-cloud-core (Google云核心) 2.4.1
谷歌云存储 (Google Cloud Storage) 2.10.0 google-crc32c 1.5.0 google-pasta 0.2.0
google-resumable-media 2.7.1 googleapis-common-protos 1.63.0 greenlet 2.0.1
grpcio 1.60.0 grpcio-status 1.60.0 gunicorn 20.1.0
gviz-api 1.10.0 体育馆 0.28.1 h11 0.14.0
h5py 3.10.0 hjson 3.1.0 假期 0.45
horovod 0.28.1+db1 htmlmin 0.1.12 httpcore 1.0.5
httplib2 0.20.2 httpx 0.27.0 huggingface-hub(哈根脸社区平台) 0.23.4
idna 3.4 ImageHash 4.3.1 ImageIO 2.31.1
imbalanced-learn 0.11.0 importlib-metadata 6.0.0 importlib_resources 6.4.0
ipyflow-core 0.0.198 ipykernel 6.25.1 ipython 8.15.0
ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 7.7.2 isodate 0.6.1
它很危险 2.0.1 Jax-Jumpy 1.0.0 jedi 0.18.1
吉普尼 0.7.1 Jinja2 3.1.2 jmespath 0.10.0
joblib 1.2.0 joblibspark 0.5.1 JSON补丁 1.33
jsonpointer 3.0.0 jsonschema 4.17.3 Jupyter 服务器 1.23.4
jupyter_client(Jupyter 客户端) 7.4.9 jupyter_core(Jupyter核心) 5.3.0 jupyterlab-pygments 0.1.2
keras 3.2.1 钥匙圈 23.5.0 kiwisolver 1.4.4
langchain 0.1.20 Langchain社区 0.0.38 langchain-core 0.1.52
langchain-文本分割器 0.0.2 语言代码 3.4.0 langsmith 0.1.63
语言数据 1.2.0 launchpadlib 1.10.16 lazr.restfulclient 0.14.4
lazr.uri 1.0.6 lazy_loader 0.2 libclang 15.0.6.1
librosa 0.10.1 lightgbm 4.3.0 linkify -it-py 2.0.0
llvmlite 0.40.0 lxml 4.9.2 lz4 4.3.2
Mako 1.2.0 marisa-trie 1.1.1 Markdown 3.4.1
markdown-it-py 2.2.0 MarkupSafe 2.1.1 棉花糖 3.21.2
matplotlib 3.7.2 matplotlib-inline 0.1.6 mdit-py-plugins 0.3.0
mdurl 0.1.0 memray 1.13.4 mistune 0.8.4
ml-dtypes 0.3.2 mlflow-skinny* 2.13.1 more-itertools 8.10.0
mosaicml-streaming 0.7.4 mpmath 1.3.0 MSAL 1.30.0
msal-extensions 1.2.0 msgpack 1.0.8 multidict 6.0.2
多方法 1.12 多进程 0.70.14 murmurhash 1.0.10
mypy-extensions 0.4.3 namex 0.0.8 nbclassic 0.5.5
nbclient 0.5.13 nbconvert 6.5.4 nbformat 5.7.0
nest-asyncio 1.5.6 NetworkX 3.1 忍者 1.11.1.1
nltk 3.8.1 笔记本 6.5.4 notebook_shim 0.2.2
numba 0.57.1 numpy 1.23.5 nvidia-cublas-cu12 12.1.3.1
nvidia-cuda-cupti-cu12 12.1.105 nvidia-cuda-nvrtc-cu12 12.1.105 nvidia-cuda-runtime-cu12 12.1.105
nvidia-cudnn-cu12 8.9.2.26 nvidia-cufft-cu12 11.0.2.54 nvidia-curand-cu12 10.3.2.106
nvidia-cusolver-cu12 11.4.5.107 nvidia-cusparse-cu12 12.1.0.106 nvidia-ml-py 12.555.43
nvidia-nccl-cu12 2.20.5 nvidia-nvjitlink-cu12 12.5.82 nvidia-nvtx-cu12 12.1.105
oauthlib 3.2.0 oci 2.126.4 openai 1.35.3
opencensus 0.11.4 opencensus-context 0.1.3 opentelemetry-api 1.25.0
opentelemetry-sdk 1.25.0 OpenTelemetry语义约定 0.46b0 opt-einsum 3.3.0
optree 0.12.1 orjson 3.10.6 打包 23.2
熊猫 1.5.3 pandocfilters 1.5.0 paramiko 3.4.0
帕尔索 0.8.3 pathspec 0.10.3 替罪羊 0.5.3
petastorm 0.12.1 pexpect 4.8.0 phik 0.12.4
pickleshare 0.7.5 枕头 9.4.0 果仁 23.2.1
platformdirs 3.10.0 plotly 5.9.0 pmdarima 2.0.4
狗狗 1.8.1 portalocker 2.10.1 preshed 3.0.9
prometheus-client 0.14.1 prompt-toolkit 3.0.36 先知 1.1.5
proto-plus 1.24.0 protobuf 4.24.1 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo 8.0.0 py-spy 0.3.14 pyarrow 14.0.1
pyarrow-hotfix 0.6 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.13.1 pyccolo 0.0.52 Python代码解析器 2.21
pydantic 1.10.6 Pygments 2.15.1 PyGObject 3.42.1
PyJWT 2.3.0 PyNaCl 1.5.0 pyodbc 4.0.38
pyOpenSSL 23.2.0 pyparsing 3.0.9 pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0
pytesseract 0.3.10 python-dateutil 2.8.2 Python代码编辑器 1.0.4
python-lsp-jsonrpc 1.1.1 python-snappy 0.6.1 Python时区库pytz 2022年7月
PyWavelets 1.4.1 PyYAML 6.0 pyzmq 23.2.0
射线 2.20.0 正则表达式 2022.7.9 请求 2.31.0
requests-oauthlib 1.3.1 13.7.1 rsa 4.9
s3transfer 0.10.2 safetensors 0.4.2 scikit-image 0.20.0
scikit-learn 1.3.0 scipy 1.11.1 seaborn 0.12.2
SecretStorage 3.3.1 Send2Trash 1.8.0 sentence-transformers (句子转换器) 2.7.0
sentencepiece 0.1.99 setuptools 68.0.0 沙普 0.44.0
simplejson 3.17.6 6 1.16.0 切片机 0.0.7
smart-open 5.2.1 smmap 5.0.0 思尼菲欧 1.2.0
音频文件 0.12.1 滤汤器 2.4 soxr 0.3.7
spacy 3.7.2 spacy-legacy 3.0.12 spacy-loggers 1.0.5
spark-tensorflow-distributor 1.0.0 SQLAlchemy 1.4.39 sqlparse 0.4.2
srsly 2.4.8 ssh-import-id 5.11 堆栈数据 0.2.0
斯塔尼奥 0.5.1 statsmodels 0.14.0 sympy 1.11.1
tangled -up-in-unicode 0.2.0 毅力 8.2.2 tensorboard 2.16.2
TensorBoard数据服务器 0.7.2 tensorboard_plugin_profile 2.15.1 tensorboardX 2.6.2.2
TensorFlow 2.16.1 tensorflow-estimator 2.15.0 tensorflow-io-gcs-filesystem 0.37.1
termcolor 2.4.0 完成 0.17.1 文本 0.63.3
tf_keras 2.16.0 thinc 8.2.3 threadpoolctl 2.2.0
tifffile 2021年7月2日 tiktoken 0.5.2 tinycss2 1.2.1
tokenize-rt 4.2.1 分词器 0.19.0 火炬 2.3.1+cu121
torcheval 0.0.7 torchvision 0.18.1+cu121 龙卷风 6.3.2
tqdm 4.65.0 Traitlets 5.7.1 变压器 4.41.2
氚核 2.3.1 类型守卫 2.13.3 打字员 0.9.4
输入检查 0.9.0 typing_extensions 4.10.0 tzdata 2022年1月
uc-micro-py 1.0.1 ujson 5.4.0 无人值守升级 0.1
urllib3 1.26.16 virtualenv 20.24.2 愿景 0.7.5
wadllib 1.3.6 山葵 1.1.2 wcwidth 0.2.5
黄鼠狼 0.3.4 Web编码 0.5.1 WebSocket客户端 0.58.0
Werkzeug 2.2.3 轮子 0.38.4 wordcloud 1.9.3
裹住 1.14.1 xgboost 2.0.3 xxhash 3.4.1
yarl 1.8.1 ydata-profiling 4.5.1 齐普 3.11.0
zstd 1.5.5.1

* 对于在 2025 年 2 月 12 日或之后创建的且未为 Photon 启用的计算, mlflow-skinny 已升级到 2.19.0。

R 库

R 库与 Databricks Runtime 15.4 LTS 中的R 库完全相同。

Java 库和 Scala 库(Scala 2.12 群集)

除了 Databricks Runtime 15.4 LTS 中的 Java 库和 Scala 库之外,Databricks Runtime 15.4 LTS ML 还包含以下 JAR:

CPU 群集

组 ID 项目 ID 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.4-db1-spark3.5
org.mlflow mlflow-client 2.11.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0

GPU 群集

组 ID 项目 ID 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.4-db1-spark3.5
org.mlflow mlflow-client 2.11.1
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0