Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
注释
对此 Databricks Runtime 版本的支持已结束。 有关终止支持日期,请参阅终止支持历史记录。 有关所有受支持的 Databricks Runtime 版本,请参阅 Databricks Runtime 发行说明版本和兼容性。
用于机器学习的 Databricks Runtime 15.2 提供了基于 Databricks Runtime 15.2 (EoS) 的机器学习和数据科学的就绪to-go 环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 Horovod 进行分布式深度学习训练。
新功能和改进
Databricks Runtime 15.2 ML 基于 Databricks Runtime 15.2 构建。 有关 Databricks Runtime 15.2 中的新增功能(包括 Apache Spark MLlib 和 SparkR)的信息,请参阅 Databricks Runtime 15.2 (EoS) 发行说明。
添加 StreamingDataset
云存储中的大型数据集的训练可以通过 StreamingDataset 来实现,其目的是做到尽可能的快速、廉价和可扩展。 它预安装在 Databricks Runtime 15.2 ML 中。
Databricks Runtime ML 的 CPU 群集上的 Photon 支持功能
从 Databricks Runtime 15.2 ML 开始,可以通过在 CPU 群集上启用 Photon 来加速 Spark SQL 和 Spark 数据帧工作负荷。
对于机器学习应用程序,Photon 为用例提供更快的性能,例如:
- 使用 SQL 或数据帧 API 进行数据准备。
- 使用时间点查找进行特征工程。
- 使用 GraphFrames 进行图形分析。
Photon 不会增强 Python 库的性能,例如 TensorFlow、PyTorch 和 XGBoost。
Spark RDD API 和 Spark MLlib 与 Photon 的兼容性有限。 使用 Spark RDD 或 Spark MLlib 处理大型数据集时,可能会遇到 Spark 内存问题。 请参阅 Spark 内存问题。
系统环境
Databricks Runtime 15.2 ML 中的系统环境不同于 Databricks Runtime 15.2,如下所示:
- 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
- CUDA 12.1
- cusolver 11.4.5.107-1
- cupti 12.1
- cuDNN 8.9.0.131-1
- NCCL 2.17.1
- TensorRT 8.6.1.6-1
图书馆
以下部分列出了 Databricks Runtime 15.2 ML 中包含的库,这些库不同于 Databricks Runtime 15.2 中包含的库。
本节内容:
顶级图书馆
Databricks Runtime 15.2 ML 包含以下顶级 库:
Python 库
Databricks Runtime 15.2 ML 用于 virtualenv Python 包管理,并包括许多常用的 ML 包。
除了以下部分中指定的包外,Databricks Runtime 15.2 ML 还包括以下包:
- hyperopt 0.2.7+db3
- sparkdl 3.0.0_db1
- automl 1.26.0
若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-15.2.txt 文件并运行 pip install -r requirements-15.2.txt。 此命令安装 Databricks Runtime ML 使用的所有开源库,但不安装 Databricks 开发的库,例如 databricks-automl、databricks-feature-engineering 或 hyperopt 的 Databricks 分支。
CPU 群集上的 Python 库
| 图书馆 | 版本 | 图书馆 | 版本 | 图书馆 | 版本 |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | accelerate | 0.28.0 | aiohttp | 3.8.5 |
| aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | anyio | 3.5.0 |
| argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 | 阿斯托尔 | 0.8.1 |
| asttokens | 2.0.5 | astunparse | 1.6.3 | 异步-超时 | 4.0.2 |
| 属性 | 22.1.0 | audioread | 3.0.1 | azure-core | 1.30.1 |
| azure-cosmos | 4.3.1 | Azure 身份识别 | 1.16.0 | azure-storage-blob | 12.19.1 |
| azure-storage-file-datalake | 12.14.0 | backcall | 0.2.0 | bcrypt | 3.2.0 |
| beautifulsoup4 | 4.12.2 | 黑色 | 23.3.0 | 漂白剂 | 4.1.0 |
| 闪烁器 | 1.4 | 布利斯 | 0.7.11 | boto3 | 1.34.39 |
| botocore | 1.34.39 | Brotli | 1.0.9 | cachetools (缓存工具) | 5.3.3 |
| catalogue | 2.0.10 | 类别编码器 | 2.6.3 | certifi | 2023.7.22 |
| cffi | 1.15.1 | chardet | 4.0.0 | charset-normalizer (字符集正常化工具) | 2.0.4 |
| 断路器 | 1.4.0 | click | 8.0.4 | cloudpathlib | 0.16.0 |
| cloudpickle | 2.2.1 | cmdstanpy | 1.2.2 | colorful | 0.5.6 |
| 通讯 | 0.1.2 | 糖果 | 0.1.4 | configparser | 5.2.0 |
| contourpy | 1.0.5 | 加密 | 41.0.3 | 骑行者 | 0.11.0 |
| cymem | 2.0.8 | Cython | 0.29.32 | 英安岩 | 1.8.1 |
| databricks-automl-runtime | 0.2.21 | databricks-feature-engineering | 0.4.0 | Databricks软件开发工具包 (databricks-sdk) | 0.20.0 |
| dataclasses-json | 0.6.4 | 数据集 | 2.18.0 | dbl-tempo | 0.1.26 |
| dbus-python | 1.2.18 | debugpy | 1.6.7 | 修饰器 | 5.1.1 |
| DeepSpeed | 0.14.0 | defusedxml | 0.7.1 | 莳萝 | 0.3.6 |
| 磁盘缓存 | 5.6.3 | distlib | 0.3.8 | dm-tree | 0.1.8 |
| 入口点 | 0.4 | 评价 | 0.4.1 | 正在执行 | 0.8.3 |
| 各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 | fastjsonschema | 2.19.1 |
| fasttext | 0.9.2 | 文件锁 (filelock) | 3.9.0 | Flask | 2.2.5 |
| FlatBuffers | 24.3.25 | fonttools(字体工具) | 4.25.0 | frozenlist | 1.3.3 |
| fsspec | 2023.5.0 | 未来 | 0.18.3 | 加斯特 | 0.4.0 |
| gitdb (Git数据库) | 4.0.11 | GitPython | 3.1.27 | google-api-core (谷歌 API 核心库) | 2.18.0 |
| google-auth (谷歌身份验证) | 2.21.0 | google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 |
| 谷歌云存储 (Google Cloud Storage) | 2.10.0 | google-crc32c | 1.5.0 | google-pasta | 0.2.0 |
| google-resumable-media (谷歌可恢复媒体) | 2.7.0 | googleapis-common-protos | 1.63.0 | greenlet | 2.0.1 |
| grpcio | 1.60.0 | grpcio-status | 1.60.0 | gunicorn | 20.1.0 |
| gviz-api | 1.10.0 | 体育馆 | 0.28.1 | h11 | 0.14.0 |
| h5py | 3.10.0 | hjson | 3.1.0 | 假期 | 0.45 |
| horovod | 0.28.1+db1 | htmlmin | 0.1.12 | httpcore | 1.0.5 |
| httplib2 | 0.20.2 | httpx | 0.27.0 | huggingface-hub | 0.20.2 |
| IDNA | 3.4 | ImageHash | 4.3.1 | ImageIO | 2.31.1 |
| imbalanced-learn | 0.11.0 | importlib-metadata | 6.0.0 | importlib_resources | 6.4.0 |
| ipyflow-core | 0.0.198 | ipykernel | 6.25.1 | ipython | 8.15.0 |
| ipython-genutils(IPython通用工具) | 0.2.0 | ipywidgets | 8.0.4 | isodate | 0.6.1 |
| 它很危险 | 2.0.1 | jax-jumpy | 1.0.0 | jedi | 0.18.1 |
| 吉普尼 | 0.7.1 | Jinja2 | 3.1.2 | jmespath | 0.10.0 |
| joblib | 1.2.0 | joblibspark | 0.5.1 | JSON补丁 | 1.33 |
| jsonpointer | 2.4 | jsonschema | 4.17.3 | Jupyter 服务器 | 1.23.4 |
| jupyter_client(Jupyter 客户端) | 7.4.9 | jupyter_core(Jupyter核心) | 5.3.0 | jupyterlab-pygments | 0.1.2 |
| jupyterlab-widgets | 3.0.5 | keras | 3.1.1 | 钥匙圈 | 23.5.0 |
| kiwisolver | 1.4.4 | langchain | 0.1.13 | Langchain社区 | 0.0.32 |
| langchain-core | 0.1.41 | langchain-text-splitters | 0.0.1 | 语言代码 | 3.3.0 |
| langsmith | 0.1.45 | launchpadlib | 1.10.16 | lazr.restfulclient | 0.14.4 |
| lazr.uri | 1.0.6 | lazy_loader | 0.2 | libclang | 15.0.6.1 |
| librosa | 0.10.1 | lightgbm | 4.3.0 | llvmlite | 0.40.0 |
| lxml | 4.9.2 | lz4 | 4.3.2 | Mako | 1.2.0 |
| Markdown | 3.4.1 | markdown-it-py | 2.2.0 | MarkupSafe | 2.1.1 |
| 棉花糖 | 3.21.1 | matplotlib | 3.7.2 | matplotlib-inline | 0.1.6 |
| mdurl | 0.1.0 | mistune | 0.8.4 | ml-dtypes | 0.3.2 |
| mlflow-skinny | 2.11.3 | more-itertools | 8.10.0 | mosaicml-streaming | 0.7.4 |
| mpmath | 1.3.0 | MSAL | 1.28.0 | msal-extensions | 1.1.0 |
| msgpack | 1.0.8 | multidict | 6.0.2 | 多方法 | 1.11.2 |
| 多进程 | 0.70.14 | murmurhash | 1.0.10 | mypy-extensions | 0.4.3 |
| namex | 0.0.7 | nbclassic | 0.5.5 | nbclient | 0.5.13 |
| nbconvert | 6.5.4 | nbformat | 5.7.0 | nest-asyncio | 1.5.6 |
| NetworkX | 3.1 | 忍者 | 1.11.1.1 | nltk | 3.8.1 |
| 笔记本 | 6.5.4 | notebook_shim | 0.2.2 | numba | 0.57.1 |
| numpy | 1.23.5 | oauthlib | 3.2.0 | oci | 2.125.2 |
| openai | 1.14.3 | opencensus | 0.11.4 | opencensus-context | 0.1.3 |
| opt-einsum | 3.3.0 | optree | 0.11.0 | orjson | 3.10.0 |
| 包装 | 23.2 | 熊猫 | 1.5.3 | pandocfilters | 1.5.0 |
| paramiko | 3.4.0 | 帕尔索 | 0.8.3 | pathspec | 0.10.3 |
| 替罪羊 | 0.5.3 | petastorm | 0.12.1 | pexpect | 4.8.0 |
| Φ系数 | 0.12.4 | pickleshare | 0.7.5 | 枕头 | 9.4.0 |
| pip | 23.2.1 | platformdirs | 3.10.0 | plotly | 5.9.0 |
| pmdarima | 2.0.4 | 狗狗 | 1.8.1 | portalocker | 2.8.2 |
| preshed | 3.0.9 | prometheus-client | 0.14.1 | 提示工具包 (prompt-toolkit) | 3.0.36 |
| 先知 | 1.1.5 | proto-plus | 1.23.0 | protobuf | 4.24.1 |
| psutil | 5.9.0 | psycopg2 | 2.9.3 | ptyprocess | 0.7.0 |
| pure-eval | 0.2.2 | py-cpuinfo (Python CPU信息) | 8.0.0 | py-spy | 0.3.14 |
| pyarrow | 14.0.1 | pyarrow-hotfix | 0.6 | pyasn1 | 0.4.8 |
| pyasn1-modules | 0.2.8 | pybind11 | 2.12.0 | pyccolo | 0.0.52 |
| Python代码解析器 | 2.21 | pydantic (Python 数据验证库) | 1.10.6 | Pygments | 2.15.1 |
| PyGObject | 3.42.1 | PyJWT | 2.3.0 | PyNaCl | 1.5.0 |
| pynvml | 11.5.0 | pyodbc | 4.0.38 | pyOpenSSL | 23.2.0 |
| pyparsing | 3.0.9 | pyrsistent(持久性,类似于 persistent 的 Python 包) | 0.18.0 | pytesseract | 0.3.10 |
| python-dateutil | 2.8.2 | Python代码编辑器 | 1.0.4 | python-lsp-jsonrpc | 1.1.1 |
| python-snappy | 0.6.1 | pytz | 2022年7月 | PyWavelets | 1.4.1 |
| PyYAML | 6.0 | pyzmq | 23.2.0 | 射线 | 2.10.0 |
| regex | 2022.7.9 | requests | 2.31.0 | requests-oauthlib | 1.3.1 |
| 回应 | 0.13.3 | rich | 13.7.1 | rsa | 4.9 |
| s3transfer | 0.10.1 | safetensors | 0.4.2 | scikit-image | 0.20.0 |
| scikit-learn | 1.3.0 | scipy | 1.11.1 | seaborn | 0.12.2 |
| SecretStorage | 3.3.1 | Send2Trash | 1.8.0 | sentence-transformers (句子转换器) | 2.6.1 |
| sentencepiece | 0.1.99 | setuptools | 68.0.0 | 沙普 | 0.44.0 |
| simplejson | 3.17.6 | 6 | 1.16.0 | 切片器 | 0.0.7 |
| smart-open | 5.2.1 | smmap | 5.0.0 | sniffio | 1.2.0 |
| 音频文件 | 0.12.1 | soupsieve | 2.4 | soxr | 0.3.7 |
| spacy | 3.7.2 | spacy-legacy | 3.0.12 | spacy-loggers | 1.0.5 |
| spark-tensorflow-distributor | 1.0.0 | SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 |
| srsly | 2.4.8 | ssh-import-id | 5.11 | 堆栈数据 | 0.2.0 |
| 斯塔尼奥 | 0.5.0 | statsmodels | 0.14.0 | sympy | 1.11.1 |
| tangled -up-in-unicode | 0.2.0 | 毅力 | 8.2.2 | tensorboard | 2.16.2 |
| TensorBoard数据服务器 | 0.7.2 | tensorboard_plugin_profile | 2.15.1 | tensorboardX | 2.6.2.2 |
| tensorflow-cpu | 2.16.1 | tensorflow-estimator | 2.15.0 | tensorflow-io-gcs-filesystem | 0.36.0 |
| termcolor | 2.4.0 | terminado | 0.17.1 | thinc | 8.2.3 |
| threadpoolctl | 2.2.0 | tifffile | 2021.7.2 | tiktoken | 0.5.2 |
| tinycss2 | 1.2.1 | tokenize-rt | 4.2.1 | 分词器 | 0.15.0 |
| 火炬 | 2.2.2+cpu | torcheval | 0.0.7 | torchvision | 0.17.2+cpu |
| 龙卷风 | 6.3.2 | tqdm | 4.65.0 | Traitlets | 5.7.1 |
| 变压器 | 4.39.2 | typeguard | 2.13.3 | 打字员 | 0.9.4 |
| 输入检查 | 0.9.0 | 输入扩展 (typing_extensions) | 4.10.0 | tzdata | 2022年1月 |
| ujson | 5.4.0 | unattended-upgrades | 0.1 | urllib3 | 1.26.16 |
| virtualenv | 20.21.0 | visions | 0.7.5 | wadllib | 1.3.6 |
| 山葵 | 1.1.2 | wcwidth | 0.2.5 | weasel | 0.3.4 |
| Web编码 | 0.5.1 | WebSocket客户端 | 0.58.0 | Werkzeug | 2.2.3 |
| wheel | 0.38.4 | widgetsnbextension | 4.0.5 | wordcloud | 1.9.3 |
| 裹住 | 1.14.1 | xgboost | 2.0.3 | xxhash | 3.4.1 |
| yarl | 1.8.1 | ydata-profiling | 4.5.1 | 齐普 | 3.11.0 |
GPU 群集上的 Python 库
| 图书馆 | 版本 | 图书馆 | 版本 | 图书馆 | 版本 |
|---|---|---|---|---|---|
| absl-py | 1.0.0 | accelerate | 0.28.0 | aiohttp | 3.8.5 |
| aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | anyio | 3.5.0 |
| argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 | 阿斯托尔 | 0.8.1 |
| asttokens | 2.0.5 | astunparse | 1.6.3 | 异步-超时 | 4.0.2 |
| 属性 | 22.1.0 | audioread | 3.0.1 | azure-core | 1.30.1 |
| azure-cosmos | 4.3.1 | Azure 身份识别 | 1.16.0 | azure-storage-blob | 12.19.1 |
| azure-storage-file-datalake | 12.14.0 | backcall | 0.2.0 | bcrypt | 3.2.0 |
| beautifulsoup4 | 4.12.2 | 黑色 | 23.3.0 | 漂白剂 | 4.1.0 |
| 闪烁器 | 1.4 | 布利斯 | 0.7.11 | boto3 | 1.34.39 |
| botocore | 1.34.39 | Brotli | 1.0.9 | cachetools (缓存工具) | 5.3.3 |
| catalogue | 2.0.10 | 类别编码器 | 2.6.3 | certifi | 2023.7.22 |
| cffi | 1.15.1 | chardet | 4.0.0 | charset-normalizer (字符集正常化工具) | 2.0.4 |
| 断路器 | 1.4.0 | click | 8.0.4 | cloudpathlib | 0.16.0 |
| cloudpickle | 2.2.1 | cmdstanpy | 1.2.2 | colorful | 0.5.6 |
| 通讯 | 0.1.2 | 糖果 | 0.1.4 | configparser | 5.2.0 |
| contourpy | 1.0.5 | 加密 | 41.0.3 | 骑行者 | 0.11.0 |
| cymem | 2.0.8 | Cython | 0.29.32 | 英安岩 | 1.8.1 |
| databricks-automl-runtime | 0.2.21 | databricks-feature-engineering | 0.4.0 | Databricks软件开发工具包 (databricks-sdk) | 0.20.0 |
| dataclasses-json | 0.6.4 | 数据集 | 2.18.0 | dbl-tempo | 0.1.26 |
| dbus-python | 1.2.18 | debugpy | 1.6.7 | 修饰器 | 5.1.1 |
| DeepSpeed | 0.14.0 | defusedxml | 0.7.1 | 莳萝 | 0.3.6 |
| 磁盘缓存 | 5.6.3 | distlib | 0.3.8 | dm-tree | 0.1.8 |
| einops | 0.7.0 | 入口点 | 0.4 | 评价 | 0.4.1 |
| 正在执行 | 0.8.3 | 各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 |
| fastjsonschema | 2.19.1 | fasttext | 0.9.2 | 文件锁 (filelock) | 3.9.0 |
| flash-attn | 2.5.6 | Flask | 2.2.5 | FlatBuffers | 24.3.25 |
| fonttools(字体工具) | 4.25.0 | frozenlist | 1.3.3 | fsspec | 2023.5.0 |
| 未来 | 0.18.3 | 加斯特 | 0.4.0 | gitdb (Git数据库) | 4.0.11 |
| GitPython | 3.1.27 | google-api-core (谷歌 API 核心库) | 2.18.0 | google-auth (谷歌身份验证) | 2.21.0 |
| google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 | 谷歌云存储 (Google Cloud Storage) | 2.10.0 |
| google-crc32c | 1.5.0 | google-pasta | 0.2.0 | google-resumable-media (谷歌可恢复媒体) | 2.7.0 |
| googleapis-common-protos | 1.63.0 | greenlet | 2.0.1 | grpcio | 1.60.0 |
| grpcio-status | 1.60.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
| 体育馆 | 0.28.1 | h11 | 0.14.0 | h5py | 3.10.0 |
| hjson | 3.1.0 | 假期 | 0.45 | horovod | 0.28.1+db1 |
| htmlmin | 0.1.12 | httpcore | 1.0.5 | httplib2 | 0.20.2 |
| httpx | 0.27.0 | huggingface-hub | 0.20.2 | IDNA | 3.4 |
| ImageHash | 4.3.1 | ImageIO | 2.31.1 | imbalanced-learn | 0.11.0 |
| importlib-metadata | 6.0.0 | importlib_resources | 6.4.0 | ipyflow-core | 0.0.198 |
| ipykernel | 6.25.1 | ipython | 8.15.0 | ipython-genutils(IPython通用工具) | 0.2.0 |
| ipywidgets | 8.0.4 | isodate | 0.6.1 | 它很危险 | 2.0.1 |
| jax-jumpy | 1.0.0 | jedi | 0.18.1 | 吉普尼 | 0.7.1 |
| Jinja2 | 3.1.2 | jmespath | 0.10.0 | joblib | 1.2.0 |
| joblibspark | 0.5.1 | JSON补丁 | 1.33 | jsonpointer | 2.4 |
| jsonschema | 4.17.3 | Jupyter 服务器 | 1.23.4 | jupyter_client(Jupyter 客户端) | 7.4.9 |
| jupyter_core(Jupyter核心) | 5.3.0 | jupyterlab-pygments | 0.1.2 | jupyterlab-widgets | 3.0.5 |
| keras | 3.1.1 | 钥匙圈 | 23.5.0 | kiwisolver | 1.4.4 |
| langchain | 0.1.13 | Langchain社区 | 0.0.32 | langchain-core | 0.1.41 |
| langchain-text-splitters | 0.0.1 | 语言代码 | 3.3.0 | langsmith | 0.1.45 |
| launchpadlib | 1.10.16 | lazr.restfulclient | 0.14.4 | lazr.uri | 1.0.6 |
| lazy_loader | 0.2 | libclang | 15.0.6.1 | librosa | 0.10.1 |
| lightgbm | 4.3.0 | llvmlite | 0.40.0 | lxml | 4.9.2 |
| lz4 | 4.3.2 | Mako | 1.2.0 | Markdown | 3.4.1 |
| markdown-it-py | 2.2.0 | MarkupSafe | 2.1.1 | 棉花糖 | 3.21.1 |
| matplotlib | 3.7.2 | matplotlib-inline | 0.1.6 | mdurl | 0.1.0 |
| mistune | 0.8.4 | ml-dtypes | 0.3.2 | mlflow-skinny | 2.11.3 |
| more-itertools | 8.10.0 | mosaicml-streaming | 0.7.4 | mpmath | 1.3.0 |
| MSAL | 1.28.0 | msal-extensions | 1.1.0 | msgpack | 1.0.8 |
| multidict | 6.0.2 | 多方法 | 1.11.2 | 多进程 | 0.70.14 |
| murmurhash | 1.0.10 | mypy-extensions | 0.4.3 | namex | 0.0.7 |
| nbclassic | 0.5.5 | nbclient | 0.5.13 | nbconvert | 6.5.4 |
| nbformat | 5.7.0 | nest-asyncio | 1.5.6 | NetworkX | 3.1 |
| 忍者 | 1.11.1.1 | nltk | 3.8.1 | 笔记本 | 6.5.4 |
| notebook_shim | 0.2.2 | numba | 0.57.1 | numpy | 1.23.5 |
| nvidia-cublas-cu12 | 12.1.3.1 | nvidia-cuda-cupti-cu12 | 12.1.105 | nvidia-cuda-nvrtc-cu12 | 12.1.105 |
| nvidia-cuda-runtime-cu12 | 12.1.105 | nvidia-cudnn-cu12 | 8.9.2.26 | nvidia-cufft-cu12 | 11.0.2.54 |
| nvidia-curand-cu12 | 10.3.2.106 | nvidia-cusolver-cu12 | 11.4.5.107 | nvidia-cusparse-cu12 | 12.1.0.106 |
| nvidia-nccl-cu12 | 2.19.3 | nvidia-nvjitlink-cu12 | 12.4.127 | nvidia-nvtx-cu12 | 12.1.105 |
| oauthlib | 3.2.0 | oci | 2.125.2 | openai | 1.14.3 |
| opencensus | 0.11.4 | opencensus-context | 0.1.3 | opt-einsum | 3.3.0 |
| optree | 0.11.0 | orjson | 3.10.0 | 包装 | 23.2 |
| 熊猫 | 1.5.3 | pandocfilters | 1.5.0 | paramiko | 3.4.0 |
| 帕尔索 | 0.8.3 | pathspec | 0.10.3 | 替罪羊 | 0.5.3 |
| petastorm | 0.12.1 | pexpect | 4.8.0 | Φ系数 | 0.12.4 |
| pickleshare | 0.7.5 | 枕头 | 9.4.0 | pip | 23.2.1 |
| platformdirs | 3.10.0 | plotly | 5.9.0 | pmdarima | 2.0.4 |
| 狗狗 | 1.8.1 | portalocker | 2.8.2 | preshed | 3.0.9 |
| prometheus-client | 0.14.1 | 提示工具包 (prompt-toolkit) | 3.0.36 | 先知 | 1.1.5 |
| proto-plus | 1.23.0 | protobuf | 4.24.1 | psutil | 5.9.0 |
| psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pure-eval | 0.2.2 |
| py-cpuinfo (Python CPU信息) | 8.0.0 | py-spy | 0.3.14 | pyarrow | 14.0.1 |
| pyarrow-hotfix | 0.6 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
| pybind11 | 2.12.0 | pyccolo | 0.0.52 | Python代码解析器 | 2.21 |
| pydantic (Python 数据验证库) | 1.10.6 | Pygments | 2.15.1 | PyGObject | 3.42.1 |
| PyJWT | 2.3.0 | PyNaCl | 1.5.0 | pynvml | 11.5.0 |
| pyodbc | 4.0.38 | pyOpenSSL | 23.2.0 | pyparsing | 3.0.9 |
| pyrsistent(持久性,类似于 persistent 的 Python 包) | 0.18.0 | pytesseract | 0.3.10 | python-dateutil | 2.8.2 |
| Python代码编辑器 | 1.0.4 | python-lsp-jsonrpc | 1.1.1 | python-snappy | 0.6.1 |
| pytz | 2022年7月 | PyWavelets | 1.4.1 | PyYAML | 6.0 |
| pyzmq | 23.2.0 | 射线 | 2.10.0 | regex | 2022.7.9 |
| requests | 2.31.0 | requests-oauthlib | 1.3.1 | 回应 | 0.13.3 |
| rich | 13.7.1 | rsa | 4.9 | s3transfer | 0.10.1 |
| safetensors | 0.4.2 | scikit-image | 0.20.0 | scikit-learn | 1.3.0 |
| scipy | 1.11.1 | seaborn | 0.12.2 | SecretStorage | 3.3.1 |
| Send2Trash | 1.8.0 | sentence-transformers (句子转换器) | 2.6.1 | sentencepiece | 0.1.99 |
| setuptools | 68.0.0 | 沙普 | 0.44.0 | simplejson | 3.17.6 |
| 6 | 1.16.0 | 切片器 | 0.0.7 | smart-open | 5.2.1 |
| smmap | 5.0.0 | sniffio | 1.2.0 | 音频文件 | 0.12.1 |
| soupsieve | 2.4 | soxr | 0.3.7 | spacy | 3.7.2 |
| spacy-legacy | 3.0.12 | spacy-loggers | 1.0.5 | spark-tensorflow-distributor | 1.0.0 |
| SQLAlchemy | 1.4.39 | sqlparse | 0.4.2 | srsly | 2.4.8 |
| ssh-import-id | 5.11 | 堆栈数据 | 0.2.0 | 斯塔尼奥 | 0.5.0 |
| statsmodels | 0.14.0 | sympy | 1.11.1 | tangled -up-in-unicode | 0.2.0 |
| 毅力 | 8.2.2 | tensorboard | 2.16.2 | TensorBoard数据服务器 | 0.7.2 |
| tensorboard_plugin_profile | 2.15.1 | tensorboardX | 2.6.2.2 | TensorFlow | 2.16.1 |
| tensorflow-estimator | 2.15.0 | tensorflow-io-gcs-filesystem | 0.36.0 | termcolor | 2.4.0 |
| terminado | 0.17.1 | thinc | 8.2.3 | threadpoolctl | 2.2.0 |
| tifffile | 2021.7.2 | tiktoken | 0.5.2 | tinycss2 | 1.2.1 |
| tokenize-rt | 4.2.1 | 分词器 | 0.15.0 | 火炬 | 2.2.2+cu121 |
| torcheval | 0.0.7 | torchvision | 0.17.2+cu121 | 龙卷风 | 6.3.2 |
| tqdm | 4.65.0 | Traitlets | 5.7.1 | 变压器 | 4.39.2 |
| triton | 2.2.0 | typeguard | 2.13.3 | 打字员 | 0.9.4 |
| 输入检查 | 0.9.0 | 输入扩展 (typing_extensions) | 4.10.0 | tzdata | 2022年1月 |
| ujson | 5.4.0 | unattended-upgrades | 0.1 | urllib3 | 1.26.16 |
| virtualenv | 20.21.0 | visions | 0.7.5 | wadllib | 1.3.6 |
| 山葵 | 1.1.2 | wcwidth | 0.2.5 | weasel | 0.3.4 |
| Web编码 | 0.5.1 | WebSocket客户端 | 0.58.0 | Werkzeug | 2.2.3 |
| wheel | 0.38.4 | widgetsnbextension | 4.0.5 | wordcloud | 1.9.3 |
| 裹住 | 1.14.1 | xgboost | 2.0.3 | xxhash | 3.4.1 |
| yarl | 1.8.1 | ydata-profiling | 4.5.1 | 齐普 | 3.11.0 |
| zstd | 1.5.5.1 |
R 软件库
R 库与 Databricks Runtime 15.2 中的 R 库 相同。
Java 库和 Scala 库(Scala 2.12 群集)
除了 Databricks Runtime 15.2 中的 Java 和 Scala 库外,Databricks Runtime 15.2 ML 还包含以下 JAR:
CPU 群集
| 群组标识符 | 工件编号 | 版本 |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.dmlc | xgboost4j-spark_2.12 | 1.7.3 |
| ml.dmlc | xgboost4j_2.12 | 1.7.3 |
| org.graphframes | graphframes_2.12 | 0.8.3-db1-spark3.5 |
| org.mlflow | mlflow-client | 2.11.1 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |
GPU 群集
| 群组标识符 | 工件编号 | 版本 |
|---|---|---|
| com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
| ml.dmlc | xgboost4j-gpu_2.12 | 1.7.3 |
| ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.7.3 |
| org.graphframes | graphframes_2.12 | 0.8.3-db1-spark3.5 |
| org.mlflow | mlflow-client | 2.11.1 |
| org.scala-lang.modules | scala-java8-compat_2.12 | 0.8.0 |
| org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |