Databricks Runtime 15.0 for Machine Learning(EoS)

注释

对此 Databricks Runtime 版本的支持已结束。 有关终止支持日期,请参阅 终止支持和生命周期结束历史记录。 有关所有受支持的 Databricks Runtime 版本,请参阅 Databricks Runtime 发行说明版本和兼容性

用于机器学习的 Databricks Runtime 15.0 基于 Databricks Runtime 15.0 (EoS),提供一个用于机器学习和数据科学的开箱即用的环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 Horovod 进行分布式深度学习训练。

新功能和改进

Databricks Runtime 15.0 ML 基于 Databricks Runtime 15.0 构建。 若要了解 Databricks Runtime 15.0 中的新增功能,包括 Apache Spark MLlib 和 SparkR,请参阅 Databricks Runtime 15.0 (EoS) 发行说明。

破坏性变更

默认情况下不再安装旧版 Databricks CLI

在 Databricks Runtime 14.3 LTS ML 及更低版本中,由于 MLflow 的预安装版本需要旧版 Databricks CLI (databricks/databricks-cli),因此它会自动安装在 $PATH 中。 Databricks Runtime 15.0 ML 包括 MLflow 版本 2.10.2,它不需要旧版 CLI。

从 Databricks Runtime 15.0 ML 开始,旧版 Databricks CLI 不再自动安装在 $PATH 中。 对于依赖在运行时安装的旧版 CLI 的用户来说,这是一个重大变更。 像 %sh databricks ... 这样的命令在 Databricks Runtime 15.0 ML 及更高版本中不再起作用。

若要继续从笔记本使用旧版 Databricks CLI,请将其安装为群集或笔记本库。 新的 Databricks CLI (databricks/cli) 可从 Web 终端获取。 有关详细信息,请参阅使用 Web 终端和 Databricks CLI

从 Databricks Runtime 15.0 ML 开始,MLeap 不再可用

MLeap 在 Databricks Runtime 15.0 ML 及更高版本中不再可用。 若要打包模型以方便部署到基于 JVM 的框架上,Databricks 建议使用 ONNX 格式

弃用 Horovod 和 HorovodRunner

Horovod 和 HorovodRunner 现已弃用。 对于分布式深度学习,Databricks 建议使用 TorchDistributor 配合 PyTorch 进行分布式训练,或使用 tf.distribute.Strategy API 配合 TensorFlow 进行分布式训练。 Horovod 和 HorovodRunner 预装在 Databricks Runtime 15.0 ML 中,但会在下一个主要的 Databricks Runtime ML 版本中删除。

注释

horovod.spark不支持 pyarrow 版本 11.0 及更高版本(请参阅相关的 GitHub 问题)。 Databricks Runtime 15.0 ML 包括 pyarrow 版本 14.0.1。 若要将 horovod.spark 与 Databricks Runtime 15.0 ML 或更高版本配合使用,必须手动安装 pyarrow,并指定一个低于 11.0 的版本。

系统环境

Databricks Runtime 15.0 ML 中的系统环境在以下方面不同于 Databricks Runtime 15.0:

  • 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
    • CUDA 12.1
    • cuDNN 8.9.0.131-1
    • NCCL 2.17.1
    • TensorRT 8.6.1.6-1

图书馆

以下部分列出了 Databricks Runtime 15.0 ML 中包含的库,这些库不同于 Databricks Runtime 15.0 中包含的库。

本节内容:

顶层库

Databricks Runtime 15.0 ML 包含以下顶层

Python库

Databricks Runtime 15.0 ML 使用 virtualenv 进行Python包管理,并包括许多常用的 ML 包。

除了以下部分指定的包,Databricks Runtime 15.0 ML 还包含以下包:

  • hyperopt 0.2.7+db4
  • sparkdl 3.0.0_db1
  • automl 1.25.0

若要在本地Python虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-15.0.txt 文件并运行 pip install -r requirements-15.0.txt。 此命令安装 Databricks Runtime ML 使用的所有open source库,但不安装 Databricks 开发的库,例如 databricks-automldatabricks-feature-storehyperopt 的 Databricks 分支。

Python 在 CPU 群集上的库

图书馆 版本 图书馆 版本 图书馆 版本
absl-py 1.0.0 加速 0.25.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 async-timeout 4.0.2
属性 22.1.0 audioread(音频读取) 3.0.1 azure-core 1.30.1
azure-cosmos 4.3.1 azure-storage-blob 12.19.0 azure-storage-file-datalake (Azure 存储文件数据湖) 12.14.0
backcall 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.12.2
黑色 23.3.0 漂白剂 4.1.0 祝福 1.20.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 cachetools (缓存工具) 5.3.3 目录 2.0.10
类别编码器 (category-encoders) 2.6.3 certifi 2023.7.22 cffi 1.15.1
chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4 click 8.0.4
cloudpathlib 0.16.0 cloudpickle 2.2.1 cmdstanpy 1.2.1
五彩缤纷 0.5.6 通讯 0.1.2 甜点 0.1.4
configparser 5.2.0 contourpy 1.0.5 加密 41.0.3
骑行者 0.11.0 cymem 2.0.8 Cython 0.29.32
英安岩 1.8.1 databricks-automl-runtime 0.2.21 databricks-feature-engineering 0.3.0
Databricks软件开发工具包 (databricks-sdk) 0.20.0 dataclasses-json 0.6.4 数据集 2.16.1
dbl-tempo 0.1.26 dbus-python 1.2.18 debugpy 1.6.7
修饰器 5.1.1 DeepSpeed 0.13.1 defusedxml 0.7.1
莳萝 0.3.6 磁盘缓存 (diskcache) 5.6.3 distlib 0.3.8
dm-tree 0.1.8 入口点 0.4 evaluate 0.4.1
执行中 0.8.3 各个方面概述 1.1.1 Farama-通知 0.0.4
fastjsonschema 2.19.1 fasttext(快速文本工具) 0.9.2 文件锁 (filelock) 3.9.0
Flask 2.2.5 FlatBuffers 23年5月26日 fonttools(字体工具) 4.25.0
frozenlist 1.3.3 fsspec 2023.5.0 未来 0.18.3
加斯特 0.4.0 gitdb (Git数据库) 4.0.11 GitPython 3.1.27
google-api-core (谷歌 API 核心库) 2.17.1 google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0
google-cloud-core (Google云核心) 2.4.1 Google 云存储 (Google Cloud Storage) 2.11.0 google-crc32c 1.5.0
google-pasta 0.2.0 google-resumable-media (谷歌可恢复媒体) 2.7.0 googleapis-common-protos 1.62.0
gpustat 1.1.1 greenlet 2.0.1 grpcio 1.60.0
grpcio-status 1.60.0 gunicorn 20.1.0 gviz-api 1.10.0
体育馆 0.28.1 h11 0.14.0 h5py 3.9.0
hjson 3.1.0 假期 0.38 霍罗沃德 0.28.1+db1
htmlmin 0.1.12 httpcore 1.0.4 httplib2 0.20.2
httpx 0.27.0 huggingface-hub(哈根脸社区平台) 0.20.2 idna 3.4
ImageHash 4.3.1 ImageIO 2.31.1 imbalanced-learn(不平衡学习库) 0.11.0
importlib-metadata 6.0.0 importlib_resources 6.1.2 ipyflow-core 0.0.198
ipykernel 6.25.1 ipython 8.15.0 ipython-genutils(IPython通用工具) 0.2.0
ipywidgets 8.0.4 isodate (ISO标准日期) 0.6.1 它很危险 2.0.1
jax-jumpy 1.0.0 jedi 0.18.1 吉普尼 0.7.1
Jinja2 3.1.2 jmespath 0.10.0 joblib 1.2.0
joblibspark 0.5.1 JSON补丁 1.33 jsonpointer 2.4
jsonschema 4.17.3 Jupyter 服务器 1.23.4 jupyter_client(Jupyter 客户端) 7.4.9
jupyter_core(Jupyter核心) 5.3.0 jupyterlab-pygments 0.1.2 jupyterlab-widgets 3.0.5
keras 2.15.0 keyring 23.5.0 kiwisolver 1.4.4
langchain 0.1.3 Langchain社区 0.0.20 langchain-core 0.1.23
语言代码 3.3.0 langsmith 0.0.87 launchpadlib 1.10.16
lazr.restfulclient 0.14.4 lazr.uri 1.0.6 lazy_loader 0.2
libclang 16.0.6 librosa 0.10.1 lightgbm 4.2.0
llvmlite 0.40.0 lxml 4.9.2 lz4 4.3.2
Mako 1.2.0 Markdown 3.4.1 markdown-it-py 2.2.0
MarkupSafe 2.1.1 棉花糖 3.21.1 matplotlib 3.7.2
matplotlib-inline 0.1.6 mdurl 0.1.0 mistune(一个用于Markdown解析的Python库) 0.8.4
ml-dtypes 0.2.0 mlflow-skinny 2.10.2 more-itertools 8.10.0
mpmath 1.3.0 msgpack 1.0.8 multidict 6.0.2
多方法 1.11.2 多进程 0.70.14 murmurhash 1.0.10
mypy-extensions 0.4.3 nbclassic 0.5.5 nbclient 0.5.13
nbconvert 6.5.4 nbformat 5.7.0 nest-asyncio 1.5.6
NetworkX 3.1 忍者 1.11.1.1 nltk 3.8.1
笔记本 6.5.4 notebook_shim 0.2.2 numba 0.57.1
numpy 1.23.5 nvidia-ml-py 12.535.133 oauthlib 3.2.0
openai 1.9.0 opencensus 0.11.4 opencensus-context 0.1.3
opt-einsum 3.3.0 封装 23.2 熊猫 2.0.3
pandocfilters 1.5.0 paramiko 2.9.2 帕尔索 0.8.3
pathspec 0.10.3 替罪羊 0.5.3 petastorm 0.12.1
pexpect 4.8.0 Φ系数 0.12.4 pickleshare 0.7.5
枕头 9.4.0 pip 23.2.1 platformdirs 3.10.0
plotly 5.9.0 pmdarima 2.0.4 狗狗 1.8.1
preshed 3.0.9 prometheus-client 0.14.1 prompt-toolkit(提示工具包) 3.0.36
预言者 1.1.5 protobuf 4.24.1 psutil 5.9.0
psycopg2 2.9.3 ptyprocess 0.7.0 pure-eval 0.2.2
py-cpuinfo (Python CPU信息) 8.0.0 py-spy 0.3.14 pyarrow 14.0.1
PyArrow修复补丁 0.6 pyasn1 0.4.8 pyasn1-modules 0.2.8
pybind11 2.11.1 pyccolo 0.0.52 Python代码解析器 2.21
pydantic 1.10.6 Pygments 2.15.1 PyGObject 3.42.1
PyJWT 2.3.0 PyNaCl 1.5.0 pynvml 11.5.0
pyodbc 4.0.38 pyparsing Python解析库 3.0.9 pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0
pytesseract 0.3.10 python-dateutil 2.8.2 Python代码编辑器 1.0.4
python-lsp-jsonrpc 1.1.1 pytz 2022年7月 PyWavelets 1.4.1
PyYAML 6.0 pyzmq 23.2.0 射线 2.9.3
regex 2022.7.9 请求 2.31.0 requests-oauthlib 1.3.1
回应 0.13.3 rich 13.7.1 RSA加密算法 4.9
s3transfer 0.10.0 safetensors 0.3.2 scikit-image 0.20.0
scikit-learn(机器学习库) 1.3.0 scipy 1.11.1 seaborn 0.12.2
SecretStorage 3.3.1 Send2Trash 1.8.0 sentence-transformers (句子转换器) 2.2.2
sentencepiece 0.1.99 setuptools 68.0.0 沙普 0.44.0
simplejson 3.17.6 6 1.16.0 切片器 0.0.7
smart-open 5.2.1 smmap 5.0.0 sniffio 1.2.0
音频文件 0.12.1 soupsieve 2.4 soxr 0.3.7
spacy 3.7.2 spacy-legacy 3.0.12 spacy-loggers 1.0.5
spark-tensorflow-distributor(Spark TensorFlow 分布器) 1.0.0 SQLAlchemy 1.4.39 sqlparse 0.4.2
srsly 2.4.8 ssh-import-id(用于根据提供的标识符导入SSH密钥的命令行工具) 5.11 栈数据 (stack-data) 0.2.0
斯塔尼奥 0.3.0 statsmodels 0.14.0 sympy 1.11.1
tangled -up-in-unicode 0.2.0 毅力 8.2.2 TensorBoard 2.15.1
TensorBoard数据服务器 0.7.2 tensorboard-plugin-profile 2.15.0 tensorboardX(一个用于TensorFlow的可视化工具) 2.6.2.2
tensorflow-中央处理器 2.15.0 tensorflow-estimator 2.15.0 tensorflow-io-gcs-filesystem 0.36.0
termcolor 2.4.0 terminado 0.17.1 thinc 8.2.3
threadpoolctl 2.2.0 tifffile 2021年7月2日 tiktoken 0.5.2
tinycss2 1.2.1 tokenize-rt 4.2.1 分词器 0.15.0
火炬 2.1.2+cpu torcheval 0.0.7 torchvision 0.16.2+cpu
龙卷风 6.3.2 tqdm 4.65.0 Traitlets 5.7.1
转换器 4.36.2 typeguard 2.13.3 打字员 0.9.0
输入检查 0.9.0 输入扩展 (typing_extensions) 4.7.1 tzdata 2022年1月
ujson 5.4.0 无需人工干预的升级 0.1 urllib3 1.26.16
virtualenv 20.21.0 愿景 0.7.5 wadllib 1.3.6
山葵 1.1.2 wcwidth 0.2.5 鼬鼠 0.3.4
Web编码 0.5.1 WebSocket客户端 0.58.0 Werkzeug 2.2.3
wheel 0.38.4 widgetsnbextension 4.0.5 wordcloud 1.9.3
封装 1.14.1 xgboost 2.0.3 xxhash 3.4.1
yarl 1.8.1 ydata-profiling 4.5.1 齐普 3.11.0

在 GPU 群集上的 Python 库

图书馆 版本 图书馆 版本 图书馆 版本
absl-py 1.0.0 加速 0.25.0 aiohttp 3.8.5
aiohttp-cors 0.7.0 aiosignal 1.2.0 anyio 3.5.0
argon2-cffi 21.3.0 argon2-cffi-bindings 21.2.0 阿斯托尔 0.8.1
asttokens 2.0.5 astunparse 1.6.3 async-timeout 4.0.2
属性 22.1.0 audioread(音频读取) 3.0.1 azure-core 1.30.1
azure-cosmos 4.3.1 azure-storage-blob 12.19.0 azure-storage-file-datalake (Azure 存储文件数据湖) 12.14.0
backcall 0.2.0 bcrypt 3.2.0 beautifulsoup4 4.12.2
黑色 23.3.0 漂白剂 4.1.0 祝福 1.20.0
闪烁器 1.4 布利斯 0.7.11 boto3 1.34.39
botocore 1.34.39 cachetools (缓存工具) 5.3.3 目录 2.0.10
类别编码器 (category-encoders) 2.6.3 certifi 2023.7.22 cffi 1.15.1
chardet 4.0.0 charset-normalizer (字符集正常化工具) 2.0.4 click 8.0.4
cloudpathlib 0.16.0 cloudpickle 2.2.1 cmdstanpy 1.2.1
五彩缤纷 0.5.6 通讯 0.1.2 甜点 0.1.4
configparser 5.2.0 contourpy 1.0.5 加密 41.0.3
骑行者 0.11.0 cymem 2.0.8 Cython 0.29.32
英安岩 1.8.1 databricks-automl-runtime 0.2.21 databricks-feature-engineering 0.3.0
Databricks软件开发工具包 (databricks-sdk) 0.20.0 dataclasses-json 0.6.4 数据集 2.16.1
dbl-tempo 0.1.26 dbus-python 1.2.18 debugpy 1.6.7
修饰器 5.1.1 DeepSpeed 0.13.1 defusedxml 0.7.1
莳萝 0.3.6 磁盘缓存 (diskcache) 5.6.3 distlib 0.3.8
dm-tree 0.1.8 einops 0.7.0 入口点 0.4
evaluate 0.4.1 执行中 0.8.3 各个方面概述 1.1.1
Farama-通知 0.0.4 fastjsonschema 2.19.1 fasttext(快速文本工具) 0.9.2
文件锁 (filelock) 3.9.0 flash-attn 2.5.0 Flask 2.2.5
FlatBuffers 23年5月26日 fonttools(字体工具) 4.25.0 frozenlist 1.3.3
fsspec 2023.5.0 未来 0.18.3 加斯特 0.4.0
gitdb (Git数据库) 4.0.11 GitPython 3.1.27 google-api-core (谷歌 API 核心库) 2.17.1
google-auth (谷歌身份验证) 2.21.0 google-auth-oauthlib 1.0.0 google-cloud-core (Google云核心) 2.4.1
Google 云存储 (Google Cloud Storage) 2.11.0 google-crc32c 1.5.0 google-pasta 0.2.0
google-resumable-media (谷歌可恢复媒体) 2.7.0 googleapis-common-protos 1.62.0 gpustat 1.1.1
greenlet 2.0.1 grpcio 1.60.0 grpcio-status 1.60.0
gunicorn 20.1.0 gviz-api 1.10.0 体育馆 0.28.1
h11 0.14.0 h5py 3.9.0 hjson 3.1.0
假期 0.38 霍罗沃德 0.28.1+db1 htmlmin 0.1.12
httpcore 1.0.4 httplib2 0.20.2 httpx 0.27.0
huggingface-hub(哈根脸社区平台) 0.20.2 idna 3.4 ImageHash 4.3.1
ImageIO 2.31.1 imbalanced-learn(不平衡学习库) 0.11.0 importlib-metadata 6.0.0
importlib_resources 6.1.2 ipyflow-core 0.0.198 ipykernel 6.25.1
ipython 8.15.0 ipython-genutils(IPython通用工具) 0.2.0 ipywidgets 8.0.4
isodate (ISO标准日期) 0.6.1 它很危险 2.0.1 jax-jumpy 1.0.0
jedi 0.18.1 吉普尼 0.7.1 Jinja2 3.1.2
jmespath 0.10.0 joblib 1.2.0 joblibspark 0.5.1
JSON补丁 1.33 jsonpointer 2.4 jsonschema 4.17.3
Jupyter 服务器 1.23.4 jupyter_client(Jupyter 客户端) 7.4.9 jupyter_core(Jupyter核心) 5.3.0
jupyterlab-pygments 0.1.2 jupyterlab-widgets 3.0.5 keras 2.15.0
keyring 23.5.0 kiwisolver 1.4.4 langchain 0.1.3
Langchain社区 0.0.20 langchain-core 0.1.23 语言代码 3.3.0
langsmith 0.0.87 launchpadlib 1.10.16 lazr.restfulclient 0.14.4
lazr.uri 1.0.6 lazy_loader 0.2 libclang 16.0.6
librosa 0.10.1 lightgbm 4.2.0 llvmlite 0.40.0
lxml 4.9.2 lz4 4.3.2 Mako 1.2.0
Markdown 3.4.1 markdown-it-py 2.2.0 MarkupSafe 2.1.1
棉花糖 3.21.1 matplotlib 3.7.2 matplotlib-inline 0.1.6
mdurl 0.1.0 mistune(一个用于Markdown解析的Python库) 0.8.4 ml-dtypes 0.2.0
mlflow-skinny 2.10.2 more-itertools 8.10.0 mpmath 1.3.0
msgpack 1.0.8 multidict 6.0.2 多方法 1.11.2
多进程 0.70.14 murmurhash 1.0.10 mypy-extensions 0.4.3
nbclassic 0.5.5 nbclient 0.5.13 nbconvert 6.5.4
nbformat 5.7.0 nest-asyncio 1.5.6 NetworkX 3.1
忍者 1.11.1.1 nltk 3.8.1 笔记本 6.5.4
notebook_shim 0.2.2 numba 0.57.1 numpy 1.23.5
nvidia-ml-py 12.535.133 oauthlib 3.2.0 openai 1.9.0
opencensus 0.11.4 opencensus-context 0.1.3 opt-einsum 3.3.0
封装 23.2 熊猫 2.0.3 pandocfilters 1.5.0
paramiko 2.9.2 帕尔索 0.8.3 pathspec 0.10.3
替罪羊 0.5.3 petastorm 0.12.1 pexpect 4.8.0
Φ系数 0.12.4 pickleshare 0.7.5 枕头 9.4.0
pip 23.2.1 platformdirs 3.10.0 plotly 5.9.0
pmdarima 2.0.4 狗狗 1.8.1 preshed 3.0.9
prompt-toolkit(提示工具包) 3.0.36 预言者 1.1.5 protobuf 4.24.1
psutil 5.9.0 psycopg2 2.9.3 ptyprocess 0.7.0
pure-eval 0.2.2 py-cpuinfo (Python CPU信息) 8.0.0 py-spy 0.3.14
pyarrow 14.0.1 PyArrow修复补丁 0.6 pyasn1 0.4.8
pyasn1-modules 0.2.8 pybind11 2.11.1 pyccolo 0.0.52
Python代码解析器 2.21 pydantic 1.10.6 Pygments 2.15.1
PyGObject 3.42.1 PyJWT 2.3.0 PyNaCl 1.5.0
pynvml 11.5.0 pyodbc 4.0.38 pyparsing Python解析库 3.0.9
pyrsistent(持久性,类似于 persistent 的 Python 包) 0.18.0 pytesseract 0.3.10 python-dateutil 2.8.2
Python代码编辑器 1.0.4 python-lsp-jsonrpc 1.1.1 pytz 2022年7月
PyWavelets 1.4.1 PyYAML 6.0 pyzmq 23.2.0
射线 2.9.3 regex 2022.7.9 请求 2.31.0
requests-oauthlib 1.3.1 回应 0.13.3 rich 13.7.1
RSA加密算法 4.9 s3transfer 0.10.0 safetensors 0.3.2
scikit-image 0.20.0 scikit-learn(机器学习库) 1.3.0 scipy 1.11.1
seaborn 0.12.2 SecretStorage 3.3.1 Send2Trash 1.8.0
sentence-transformers (句子转换器) 2.2.2 sentencepiece 0.1.99 setuptools 68.0.0
沙普 0.44.0 simplejson 3.17.6 6 1.16.0
切片器 0.0.7 smart-open 5.2.1 smmap 5.0.0
sniffio 1.2.0 音频文件 0.12.1 soupsieve 2.4
soxr 0.3.7 spacy 3.7.2 spacy-legacy 3.0.12
spacy-loggers 1.0.5 spark-tensorflow-distributor(Spark TensorFlow 分布器) 1.0.0 SQLAlchemy 1.4.39
sqlparse 0.4.2 srsly 2.4.8 ssh-import-id(用于根据提供的标识符导入SSH密钥的命令行工具) 5.11
栈数据 (stack-data) 0.2.0 斯塔尼奥 0.3.0 statsmodels 0.14.0
sympy 1.11.1 tangled -up-in-unicode 0.2.0 毅力 8.2.2
TensorBoard 2.15.1 TensorBoard数据服务器 0.7.2 tensorboard-plugin-profile 2.15.0
tensorboardX(一个用于TensorFlow的可视化工具) 2.6.2.2 tensorflow(TensorFlow 是一个开源机器学习框架) 2.15.0 tensorflow-estimator 2.15.0
tensorflow-io-gcs-filesystem 0.36.0 termcolor 2.4.0 terminado 0.17.1
thinc 8.2.3 threadpoolctl 2.2.0 tifffile 2021年7月2日
tiktoken 0.5.2 tinycss2 1.2.1 tokenize-rt 4.2.1
分词器 0.15.0 火炬 2.1.2+cu121 torcheval 0.0.7
torchvision 0.16.2+cu121 龙卷风 6.3.2 tqdm 4.65.0
Traitlets 5.7.1 转换器 4.36.2 triton 2.1.0
typeguard 2.13.3 打字员 0.9.0 输入检查 0.9.0
输入扩展 (typing_extensions) 4.7.1 tzdata 2022年1月 ujson 5.4.0
无需人工干预的升级 0.1 urllib3 1.26.16 virtualenv 20.21.0
愿景 0.7.5 wadllib 1.3.6 山葵 1.1.2
wcwidth 0.2.5 鼬鼠 0.3.4 Web编码 0.5.1
WebSocket客户端 0.58.0 Werkzeug 2.2.3 wheel 0.38.4
widgetsnbextension 4.0.5 wordcloud 1.9.3 封装 1.14.1
xgboost 2.0.3 xxhash 3.4.1 yarl 1.8.1
ydata-profiling 4.5.1 齐普 3.11.0

R 软件库

R 库与 Databricks Runtime 15.0 中的 R 库完全相同。

Java和 Scala 库(Scala 2.12 群集)

除了 Databricks Runtime 15.0 中的Java库和 Scala 库,Databricks Runtime 15.0 ML 还包含以下 JAR:

CPU 群集

群组标识符 工件编号 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-spark_2.12 1.7.3
ml.dmlc xgboost4j_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.10.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0

GPU 群集

群组标识符 工件编号 版本
com.typesafe.akka akka-actor_2.12 2.5.23
ml.dmlc xgboost4j-gpu_2.12 1.7.3
ml.dmlc xgboost4j-spark-gpu_2.12 1.7.3
org.graphframes graphframes_2.12 0.8.2-db2-spark3.4
org.mlflow mlflow-client 2.10.2
org.scala-lang.modules scala-java8-compat_2.12 0.8.0
org.tensorflow spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) 1.15.0