用于机器学习的 Databricks Runtime 16.0 基于 Databricks Runtime 16.0 为机器学习和数据科学提供了随时可用的环境。 Databricks Runtime ML 包含许多常用的机器学习库,包括 TensorFlow、PyTorch 和 XGBoost。 Databricks Runtime ML 包括 AutoML 工具,可用于自动训练机器学习管道。 Databricks Runtime ML 还支持使用 TorchDistributor、DeepSpeed 和 Ray 进行分布式深度学习训练。
提示
若要查看已终止支持 (EoS) 的 Databricks Runtime 版本的发行说明,请参阅终止支持 Databricks Runtime 发行说明。 EoS Databricks Runtime 版本已停用,可能不会更新。
新增功能和改进
Databricks Runtime 16.0 ML 基于 Databricks Runtime 16.0 构建。 若要了解 Databricks Runtime 16.0 中的新增功能,包括 Apache Spark MLlib 和 SparkR,请参阅 Databricks Runtime 16.0 发行说明。
新 Python 包
以下 Python 包已添加到 Databricks Runtime ML:
- composer 0.24.1
- optuna 3.6.1
用于预测的 AutoML 样本权重
AutoML 现在支持用于预测的样本权重,使你可以调整每个时间序列的重要性,以训练多时间序列预测模型。 有关详细信息,请参阅 AutoML Python API 的预测参数。
将 Unity Catalog 中的视图用作特征表
现在可以将 Unity Catalog 中的视图用作特征表。 请参阅使用 Unity Catalog 中的现有视图作为特征表。
其他更改
Horovod、HorovodRunner、Petastorm、spark-tensorflow-distributor
已删除
先前的 Databricks Runtime ML 版本中包含的以下包未包含在 Databricks Runtime 16.0 ML 中:
- Horovod
- HorovodRunner
- Petastorm
spark-tensorflow-distributor
Databricks 建议执行以下替换:
- 对于分布式深度学习,Databricks 建议使用 TorchDistributor 通过 PyTorch 进行分布式训练,或使用
tf.distribute.Strategy
API 通过 TensorFlow 进行分布式训练。 - 若要从云存储加载大型数据集,Databricks 建议使用 Mosaic 流式处理。
- 对于 TensorFlow 或 Keras 模型的分布式训练,Databricks 建议使用 Ray。 请参阅 Databricks 的 Ray 和 Ray 文档。
系统环境
Databricks Runtime 16.0 ML 中的系统环境在以下方面不同于 Databricks Runtime 16.0:
- 对于 GPU 群集,Databricks Runtime ML 包含以下 NVIDIA GPU 库:
- CUDA 12.6
- cublas 12.6.0.22-1
- cusolver 11.6.4.38-1
- cupti 12.6.37-1
- cusparse 12.5.2.23-1
- cuDNN 9.3.0.75-1
- NCCL 2.22.3
- TensorRT 10.2.0.19-1
图书馆
以下部分列出了 Databricks Runtime 16.0 ML 中包含的库,这些库不同于 Databricks Runtime 16.0 中包含的库。
本节内容:
顶层库
Databricks Runtime 16.0 ML 包含以下顶层库:
- 数据集
- GraphFrames
- MLflow
- PyTorch
- spark-tensorflow-connector
- Scikit-learn
- 流式处理
- TensorFlow
- TensorBoard
- 转换器
Python 库
Databricks Runtime 16.0 ML 使用 virtualenv
进行 Python 包管理,包含许多常用的 ML 包。
除了以下部分中指定的包,Databricks Runtime 16.0 ML 还包含以下包:
- hyperopt 0.2.7+db5
- automl 1.29.0
若要在本地 Python 虚拟环境中重现 Databricks Runtime ML Python 环境,请下载 requirements-16.0.txt 文件并运行 pip install -r requirements-16.0.txt
。 此命令安装 Databricks Runtime ML 使用的所有开源库,但不安装 Databricks 开发的库,例如 databricks-automl
、databricks-feature-engineering
,或 hyperopt
的 Databricks 分支。
CPU 群集上的 Python 库
库 | 版本 | 库 | 版本 | 库 | 版本 |
---|---|---|---|---|---|
absl-py | 1.0.0 | 加速 | 0.33.0 | aiohttp | 3.9.5 |
aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | alembic | 1.13.3 |
注释类型 | 0.7.0 | anyio | 4.2.0 | argcomplete | 3.5.0 |
argon2-cffi | 21.3.0 | argon2-cffi-bindings | 21.2.0 | 箭头 | 1.2.3 |
阿斯托尔 | 0.8.1 | asttokens | 2.0.5 | astunparse | 1.6.3 |
async-lru | 2.0.4 | 属性 | 23.1.0 | audioread | 3.0.1 |
自动命令 | 2.2.2 | azure-core | 1.31.0 | azure-cosmos | 4.3.1 |
Azure 身份识别 | 1.18.0 | azure-storage-blob | 12.23.1 | azure-storage-file-datalake | 12.17.0 |
巴别塔 | 2.11.0 | 回退 | 2.2.1 | backports.tarfile | 1.2.0 |
bcrypt | 3.2.0 | beautifulsoup4 | 4.12.3 | 黑色 | 24.4.2 |
漂白剂 | 4.1.0 | 闪烁器 | 1.7.0 | 布利斯 | 0.7.11 |
boto3 | 1.34.69 | botocore | 1.34.69 | Brotli | 1.0.9 |
cachetools (缓存工具) | 5.3.3 | 目录 | 2.0.10 | 类别编码器 | 2.6.3 |
certifi | 2024年6月2日 | cffi | 1.16.0 | chardet | 4.0.0 |
charset-normalizer (字符集正常化工具) | 2.0.4 | 断路器 | 2.0.0 | 单击 | 8.1.7 |
cloudpathlib | 0.19.0 | cloudpickle | 2.2.1 | cmdstanpy | 1.2.4 |
五彩缤纷 | 0.5.6 | colorlog | 6.8.2 | 通讯 | 0.2.1 |
作曲家 | 0.24.1 | 糖果 | 0.1.5 | configparser | 5.2.0 |
contourpy | 1.2.0 | coolname | 2.2.0 | 密码系统 | 42.0.5 |
骑行者 | 0.11.0 | cymem | 2.0.8 | Cython | 3.0.11 |
英安岩 | 1.8.1 | databricks-automl-runtime | 0.2.21 | Databricks-特征工程 | 0.7.0 |
Databricks软件开发工具包 (databricks-sdk) | 0.30.0 | 数据集 | 2.20.0 | dbl-tempo | 0.1.26 |
dbu-python | 1.3.2 | debugpy | 1.6.7 | 装饰师 | 5.1.1 |
deepspeed | 0.14.4 | defusedxml | 0.7.1 | 已放弃 | 1.2.14 |
莳萝 | 0.3.8 | distlib | 0.3.8 | dm-tree | 0.1.8 |
docstring-to-markdown | 0.11 | 入口点 | 0.4 | 评估 | 0.4.2 |
正在执行 | 0.8.3 | 各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 |
fastjsonschema | 2.20.0 | fasttext-wheel | 0.9.2 | 文件锁 (filelock) | 3.13.1 |
烧瓶 | 2.2.5 | FlatBuffers | 24.3.25 | fonttools(字体工具) | 4.51.0 |
fqdn | 1.5.1 | frozenlist | 1.4.0 | fsspec | 2023.5.0 |
未来 | 0.18.3 | 加斯特 | 0.4.0 | gitdb (Git数据库) | 4.0.11 |
GitPython | 3.1.37 | google-api-core | 2.20.0 | google-auth (谷歌身份验证) | 2.21.0 |
google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 | 谷歌云存储 (Google Cloud Storage) | 2.10.0 |
google-crc32c | 1.6.0 | google-pasta | 0.2.0 | google-resumable-media | 2.7.2 |
googleapis-common-protos | 1.65.0 | gql | 3.5.0 | graphql-core | 3.2.4 |
greenlet | 3.0.1 | grpcio | 1.60.0 | grpcio-status | 1.60.0 |
gunicorn | 20.1.0 | gviz-api | 1.10.0 | 体育馆 | 0.28.1 |
h11 | 0.14.0 | h5py | 3.11.0 | hjson | 3.1.0 |
假期 | 0.54 | htmlmin | 0.1.12 | httpcore | 1.0.5 |
httplib2 | 0.20.4 | httpx | 0.27.2 | huggingface-hub(哈根脸社区平台) | 0.24.5 |
idna | 3.7 | ImageHash | 4.3.1 | ImageIO | 2.33.1 |
imbalanced-learn | 0.12.3 | importlib-metadata | 6.0.0 | importlib_resources | 6.4.5 |
屈折 | 7.3.1 | ipyflow-core | 0.0.201 | ipykernel | 6.28.0 |
ipython | 8.25.0 | ipython-genutils(IPython通用工具) | 0.2.0 | ipywidgets | 7.7.2 |
isodate | 0.6.1 | isoduration | 20.11.0 | 它很危险 | 2.2.0 |
jaraco.context | 5.3.0 | jaraco.functools | 4.0.1 | jaraco.text | 3.12.1 |
Jax-Jumpy | 1.0.0 | jedi | 0.19.1 | Jinja2 | 3.1.4 |
抖动 | 0.5.0 | jmespath | 1.0.1 | joblib | 1.4.2 |
joblibspark | 0.5.1 | json5 | 0.9.6 | JSON补丁 | 1.33 |
jsonpointer | 3.0.0 | jsonschema | 4.19.2 | JSON模式规范 | 2023年7月1日 |
jupyter-events(Jupyter 事件) | 0.10.0 | jupyter-lsp | 2.2.0 | jupyter_client(Jupyter 客户端) | 8.6.0 |
jupyter_core(Jupyter核心) | 5.7.2 | Jupyter服务器 | 2.14.1 | Jupyter服务器终端 | 0.4.4 |
jupyterlab | 4.0.11 | jupyterlab-pygments | 0.1.2 | jupyterlab_server (JupyterLab 服务器) | 2.25.1 |
keras | 3.5.0 | kiwisolver | 1.4.4 | langchain | 0.2.12 |
langchain-core | 0.2.41 | langchain-文本分割器 | 0.2.4 | 语言代码 | 3.4.1 |
langsmith | 0.1.129 | 语言数据 | 1.2.0 | launchpadlib | 1.11.0 |
lazr.restfulclient | 0.14.6 | lazr.uri | 1.0.6 | lazy_loader | 0.4 |
libclang | 15.0.6.1 | librosa | 0.10.2 | lightgbm | 4.5.0 |
闪电工具 | 0.11.7 | linkify -it-py | 2.0.0 | llvmlite | 0.42.0 |
lz4 | 4.3.2 | Mako | 1.2.0 | marisa-trie | 1.2.0 |
Markdown | 3.4.1 | markdown-it-py | 2.2.0 | MarkupSafe | 2.1.3 |
matplotlib | 3.8.4 | matplotlib-inline | 0.1.6 | 麦卡贝 | 0.7.0 |
mdit-py-plugins | 0.3.0 | mdurl | 0.1.0 | memray | 1.14.0 |
mistune | 2.0.4 | ml-dtypes | 0.4.1 | mlflow-skinny | 2.15.1 |
more-itertools | 10.3.0 | mosaicml-cli | 0.6.41 | mosaicml-streaming | 0.8.0 |
mpmath | 1.3.0 | MSAL | 1.31.0 | msal-extensions | 1.2.0 |
msgpack | 1.1.0 | multidict | 6.0.4 | 多方法 | 1.12 |
多进程 | 0.70.16 | murmurhash | 1.0.10 | mypy | 1.10.0 |
mypy-extensions | 1.0.0 | namex | 0.0.8 | nbclient | 0.8.0 |
nbconvert | 7.10.0 | nbformat | 5.9.2 | nest-asyncio | 1.6.0 |
NetworkX | 3.2.1 | 忍者 | 1.11.1.1 | nltk | 3.8.1 |
nodeenv | 1.9.1 | 笔记本 | 7.0.8 | notebook_shim | 0.2.3 |
numba | 0.59.1 | numpy | 1.26.4 | nvidia-ml-py | 12.560.30 |
oauthlib | 3.2.0 | oci | 2.135.0 | openai | 1.40.2 |
opencensus | 0.11.4 | opencensus-context | 0.1.3 | opentelemetry-api | 1.27.0 |
opentelemetry-sdk | 1.27.0 | OpenTelemetry语义约定 | 0.48b0 | opt_einsum | 3.4.0 |
optree | 0.12.1 | optuna | 3.6.1 | optuna集成 | 3.6.0 |
orjson | 3.10.7 | 重写 | 7.4.0 | 打包 | 24.1 |
熊猫 | 1.5.3 | pandocfilters | 1.5.0 | paramiko | 3.4.0 |
帕尔索 | 0.8.3 | pathspec | 0.10.3 | 替罪羊 | 0.5.6 |
pexpect | 4.8.0 | phik | 0.12.4 | 枕头 | 10.3.0 |
果仁 | 24.2 | platformdirs | 3.10.0 | plotly | 5.22.0 |
Pluggy (Python库) | 1.0.0 | pmdarima | 2.0.4 | 狗狗 | 1.8.2 |
portalocker | 2.10.1 | preshed | 3.0.9 | prometheus-client | 0.14.1 |
prompt-toolkit | 3.0.43 | 先知 | 1.1.5 | proto-plus | 1.24.0 |
protobuf | 4.24.1 | psutil | 5.9.0 | psycopg2 | 2.9.3 |
ptyprocess | 0.7.0 | pure-eval | 0.2.2 | py-cpuinfo | 9.0.0 |
py-spy | 0.3.14 | pyarrow | 15.0.2 | pyarrow-hotfix | 0.6 |
pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 | pybind11 | 2.13.6 |
pyccolo | 0.0.65 | Python代码解析器 | 2.21 | pydantic | 2.8.2 |
pydantic_core | 2.20.1 | pyflakes | 3.2.0 | Pygments | 2.15.1 |
PyGObject | 3.48.2 | PyJWT | 2.7.0 | PyNaCl | 1.5.0 |
pyodbc | 5.0.1 | pyOpenSSL | 24.0.0 | pyparsing | 3.0.9 |
pyright | 1.1.294 | pytesseract | 0.3.10 | python-dateutil | 2.9.0.post0 |
Python代码编辑器 | 1.0.4 | python-json-logger | 2.0.7 | python-lsp-jsonrpc | 1.1.2 |
python-lsp-server | 1.10.0 | python-snappy | 0.6.1 | pytoolconfig | 1.2.6 |
pytorch-ranger | 0.1.1 | Python时区库pytz | 2024.1 | PyWavelets | 1.5.0 |
PyYAML | 6.0.1 | pyzmq | 25.1.2 | 问卷 | 1.10.0 |
射线 | 2.35.0 | 引用 | 0.30.2 | 正则表达式 | 2023年10月3日 |
请求 | 2.32.2 | requests-oauthlib | 1.3.1 | rfc3339-validator | 0.1.4 |
rfc3986验证器 | 0.1.1 | 富 | 13.3.5 | 绳子 | 1.12.0 |
rpds-py | 0.10.6 | rsa | 4.9 | ruamel.yaml | 0.18.6 |
ruamel.yaml.clib | 0.2.8 | s3transfer | 0.10.2 | safetensors | 0.4.4 |
scikit-image | 0.23.2 | scikit-learn | 1.4.2 | scipy | 1.13.1 |
seaborn | 0.13.2 | Send2Trash | 1.8.2 | sentence-transformers (句子转换器) | 3.0.1 |
sentencepiece | 0.2.0 | setuptools | 74.0.0 | 沙普 | 0.46.0 |
谢灵汉姆 | 1.5.4 | simplejson | 3.17.6 | 6 | 1.16.0 |
切片机 | 0.0.8 | smart-open | 5.2.1 | smmap | 5.0.0 |
思尼菲欧 | 1.3.0 | 音频文件 | 0.12.1 | 滤汤器 | 2.5 |
soxr | 0.5.0.post1 | spacy | 3.7.5 | spacy-legacy | 3.0.12 |
spacy-loggers | 1.0.5 | SQLAlchemy | 2.0.30 | sqlparse | 0.4.2 |
srsly | 2.4.8 | ssh-import-id | 5.11 | 堆栈数据 | 0.2.0 |
斯塔尼奥 | 0.5.1 | statsmodels | 0.14.2 | sympy | 1.12 |
制表 | 0.9.0 | tangled -up-in-unicode | 0.2.0 | 毅力 | 8.2.2 |
tensorboard | 2.17.0 | TensorBoard数据服务器 | 0.7.2 | tensorboard-profile插件 | 2.17.0 |
tensorboardX | 2.6.2.2 | TensorFlow | 2.18.0 | tensorflow-estimator | 2.15.0 |
termcolor | 2.4.0 | 完成 | 0.17.1 | 文本 | 0.81.0 |
tf_keras | 2.17.0 | thinc | 8.2.5 | threadpoolctl | 2.2.0 |
tifffile | 2023.4.12 | tiktoken | 0.7.0 | tinycss2 | 1.2.1 |
tokenize-rt | 4.2.1 | 分词器 | 0.19.1 | tomli | 2.0.1 |
火炬 | 2.4.0+cpu | torch-optimizer | 0.3.0 | torcheval | 0.0.7 |
torchmetrics | 1.4.0.post0 | torchvision | 0.19.0+cpu | 龙卷风 | 6.4.1 |
tqdm | 4.66.4 | Traitlets | 5.14.3 | 变压器 | 4.44.0 |
类型守卫 | 4.3.0 | 打字员 | 0.12.5 | types-protobuf | 3.20.3 |
types-psutil | 5.9.0 | types-pytz | 2023.3.1.1 | types-PyYAML | 6.0.0 |
类型-请求 | 2.31.0.0 | types-setuptools(类型-安装工具包) | 68.0.0.0 | 类型-六 | 1.16.0 |
types-urllib3 | 1.26.25.14 | typing_extensions | 4.11.0 | uc-micro-py | 1.0.1 |
ujson | 5.10.0 | 无人值守升级 | 0.1 | URI 模板 | 1.3.0 |
urllib3 | 1.26.16 | 验证程序 | 0.34.0 | virtualenv | 20.26.2 |
愿景 | 0.7.5 | wadllib | 1.3.6 | 山葵 | 1.1.3 |
wcwidth | 0.2.5 | 黄鼠狼 | 0.4.1 | webcolors | 24.8.0 |
Web编码 | 0.5.1 | WebSocket客户端 | 1.8.0 | WebSockets | 11.0.3 |
Werkzeug | 3.0.3 | whatthepatch | 1.0.2 | 轮子 | 0.43.0 |
wordcloud | 1.9.3 | 裹住 | 1.14.1 | xgboost | 2.0.3 |
xgboost-ray | 0.1.19 | xxhash | 3.4.1 | yapf | 0.33.0 |
yarl | 1.9.3 | ydata-profiling | 4.9.0 | 齐普 | 3.17.0 |
zstd | 1.5.5.1 |
GPU 群集上的 Python 库
库 | 版本 | 库 | 版本 | 库 | 版本 |
---|---|---|---|---|---|
absl-py | 1.0.0 | 加速 | 0.33.0 | aiohttp | 3.9.5 |
aiohttp-cors | 0.7.0 | aiosignal | 1.2.0 | 注释类型 | 0.7.0 |
anyio | 4.2.0 | argcomplete | 3.5.0 | argon2-cffi | 21.3.0 |
argon2-cffi-bindings | 21.2.0 | 箭头 | 1.2.3 | 阿斯托尔 | 0.8.1 |
asttokens | 2.0.5 | astunparse | 1.6.3 | async-lru | 2.0.4 |
属性 | 23.1.0 | audioread | 3.0.1 | 自动命令 | 2.2.2 |
azure-core | 1.31.0 | azure-cosmos | 4.3.1 | Azure 身份识别 | 1.18.0 |
azure-storage-blob | 12.23.1 | azure-storage-file-datalake | 12.17.0 | 巴别塔 | 2.11.0 |
回退 | 2.2.1 | backports.tarfile | 1.2.0 | bcrypt | 3.2.0 |
beautifulsoup4 | 4.12.3 | 黑色 | 24.4.2 | 漂白剂 | 4.1.0 |
闪烁器 | 1.7.0 | 布利斯 | 0.7.11 | boto3 | 1.34.69 |
botocore | 1.34.69 | Brotli | 1.0.9 | cachetools (缓存工具) | 5.3.3 |
目录 | 2.0.10 | 类别编码器 | 2.6.3 | certifi | 2024年6月2日 |
cffi | 1.16.0 | chardet | 4.0.0 | charset-normalizer (字符集正常化工具) | 2.0.4 |
断路器 | 2.0.0 | 单击 | 8.1.7 | cloudpathlib | 0.19.0 |
cloudpickle | 2.2.1 | cmdstanpy | 1.2.4 | 五彩缤纷 | 0.5.6 |
colorlog | 6.8.2 | 通讯 | 0.2.1 | 作曲家 | 0.24.1 |
糖果 | 0.1.5 | configparser | 5.2.0 | contourpy | 1.2.0 |
coolname | 2.2.0 | 密码系统 | 42.0.5 | 骑行者 | 0.11.0 |
cymem | 2.0.8 | Cython | 3.0.11 | 英安岩 | 1.8.1 |
databricks-automl-runtime | 0.2.21 | Databricks-特征工程 | 0.7.0 | Databricks软件开发工具包 (databricks-sdk) | 0.30.0 |
数据集 | 2.20.0 | dbl-tempo | 0.1.26 | dbu-python | 1.3.2 |
debugpy | 1.6.7 | 装饰师 | 5.1.1 | deepspeed | 0.14.4 |
defusedxml | 0.7.1 | 已放弃 | 1.2.14 | 莳萝 | 0.3.8 |
distlib | 0.3.8 | dm-tree | 0.1.8 | docstring-to-markdown | 0.11 |
einops | 0.8.0 | 入口点 | 0.4 | 评估 | 0.4.2 |
正在执行 | 0.8.3 | 各个方面概述 | 1.1.1 | Farama-通知 | 0.0.4 |
fastjsonschema | 2.20.0 | fasttext-wheel | 0.9.2 | 文件锁 (filelock) | 3.13.1 |
flash_attn | 2.5.6 | 烧瓶 | 2.2.5 | FlatBuffers | 24.3.25 |
fonttools(字体工具) | 4.51.0 | fqdn | 1.5.1 | frozenlist | 1.4.0 |
fsspec | 2023.5.0 | 未来 | 0.18.3 | 加斯特 | 0.4.0 |
gitdb (Git数据库) | 4.0.11 | GitPython | 3.1.37 | google-api-core | 2.20.0 |
google-auth (谷歌身份验证) | 2.21.0 | google-auth-oauthlib | 1.0.0 | google-cloud-core (Google云核心) | 2.4.1 |
谷歌云存储 (Google Cloud Storage) | 2.10.0 | google-crc32c | 1.6.0 | google-pasta | 0.2.0 |
google-resumable-media | 2.7.2 | googleapis-common-protos | 1.65.0 | gql | 3.5.0 |
graphql-core | 3.2.4 | greenlet | 3.0.1 | grpcio | 1.60.0 |
grpcio-status | 1.60.0 | gunicorn | 20.1.0 | gviz-api | 1.10.0 |
体育馆 | 0.28.1 | h11 | 0.14.0 | h5py | 3.11.0 |
hjson | 3.1.0 | 假期 | 0.54 | htmlmin | 0.1.12 |
httpcore | 1.0.5 | httplib2 | 0.20.4 | httpx | 0.27.2 |
huggingface-hub(哈根脸社区平台) | 0.24.5 | idna | 3.7 | ImageHash | 4.3.1 |
ImageIO | 2.33.1 | imbalanced-learn | 0.12.3 | importlib-metadata | 6.0.0 |
importlib_resources | 6.4.5 | 屈折 | 7.3.1 | ipyflow-core | 0.0.201 |
ipykernel | 6.28.0 | ipython | 8.25.0 | ipython-genutils(IPython通用工具) | 0.2.0 |
ipywidgets | 7.7.2 | isodate | 0.6.1 | isoduration | 20.11.0 |
它很危险 | 2.2.0 | jaraco.context | 5.3.0 | jaraco.functools | 4.0.1 |
jaraco.text | 3.12.1 | Jax-Jumpy | 1.0.0 | jedi | 0.19.1 |
Jinja2 | 3.1.4 | 抖动 | 0.5.0 | jmespath | 1.0.1 |
joblib | 1.4.2 | joblibspark | 0.5.1 | json5 | 0.9.6 |
JSON补丁 | 1.33 | jsonpointer | 3.0.0 | jsonschema | 4.19.2 |
JSON模式规范 | 2023年7月1日 | jupyter-events(Jupyter 事件) | 0.10.0 | jupyter-lsp | 2.2.0 |
jupyter_client(Jupyter 客户端) | 8.6.0 | jupyter_core(Jupyter核心) | 5.7.2 | Jupyter服务器 | 2.14.1 |
Jupyter服务器终端 | 0.4.4 | jupyterlab | 4.0.11 | jupyterlab-pygments | 0.1.2 |
jupyterlab_server (JupyterLab 服务器) | 2.25.1 | keras | 3.5.0 | kiwisolver | 1.4.4 |
langchain | 0.2.12 | langchain-core | 0.2.41 | langchain-文本分割器 | 0.2.4 |
语言代码 | 3.4.1 | langsmith | 0.1.129 | 语言数据 | 1.2.0 |
launchpadlib | 1.11.0 | lazr.restfulclient | 0.14.6 | lazr.uri | 1.0.6 |
lazy_loader | 0.4 | libclang | 15.0.6.1 | librosa | 0.10.2 |
lightgbm | 4.5.0 | 闪电工具 | 0.11.7 | linkify -it-py | 2.0.0 |
llvmlite | 0.42.0 | lz4 | 4.3.2 | Mako | 1.2.0 |
marisa-trie | 1.2.0 | Markdown | 3.4.1 | markdown-it-py | 2.2.0 |
MarkupSafe | 2.1.3 | matplotlib | 3.8.4 | matplotlib-inline | 0.1.6 |
麦卡贝 | 0.7.0 | mdit-py-plugins | 0.3.0 | mdurl | 0.1.0 |
memray | 1.14.0 | mistune | 2.0.4 | ml-dtypes | 0.4.1 |
mlflow-skinny | 2.15.1 | more-itertools | 10.3.0 | mosaicml-cli | 0.6.41 |
mosaicml-streaming | 0.8.0 | mpmath | 1.3.0 | MSAL | 1.31.0 |
msal-extensions | 1.2.0 | msgpack | 1.1.0 | multidict | 6.0.4 |
多方法 | 1.12 | 多进程 | 0.70.16 | murmurhash | 1.0.10 |
mypy | 1.10.0 | mypy-extensions | 1.0.0 | namex | 0.0.8 |
nbclient | 0.8.0 | nbconvert | 7.10.0 | nbformat | 5.9.2 |
nest-asyncio | 1.6.0 | NetworkX | 3.2.1 | 忍者 | 1.11.1.1 |
nltk | 3.8.1 | nodeenv | 1.9.1 | 笔记本 | 7.0.8 |
notebook_shim | 0.2.3 | numba | 0.59.1 | numpy | 1.26.4 |
nvidia-cublas-cu12 | 12.4.2.65 | nvidia-cuda-cupti-cu12 | 12.4.99 | nvidia-cuda-nvrtc-cu12 | 12.4.99 |
nvidia-cuda-runtime-cu12 | 12.4.99 | nvidia-cudnn-cu12 | 9.1.0.70 | nvidia-cufft-cu12 | 11.2.0.44 |
nvidia-curand-cu12 | 10.3.5.119 | nvidia-cusolver-cu12 | 11.6.0.99 | nvidia-cusparse-cu12 | 12.3.0.142 |
nvidia-ml-py | 12.560.30 | nvidia-nccl-cu12 | 2.20.5 | nvidia-nvjitlink-cu12 | 12.4.99 |
nvidia-nvtx-cu12 | 12.4.99 | oauthlib | 3.2.0 | oci | 2.135.0 |
openai | 1.40.2 | opencensus | 0.11.4 | opencensus-context | 0.1.3 |
opentelemetry-api | 1.27.0 | opentelemetry-sdk | 1.27.0 | OpenTelemetry语义约定 | 0.48b0 |
opt_einsum | 3.4.0 | optree | 0.12.1 | optuna | 3.6.1 |
optuna集成 | 3.6.0 | orjson | 3.10.7 | 重写 | 7.4.0 |
打包 | 24.1 | 熊猫 | 1.5.3 | pandocfilters | 1.5.0 |
paramiko | 3.4.0 | 帕尔索 | 0.8.3 | pathspec | 0.10.3 |
替罪羊 | 0.5.6 | pexpect | 4.8.0 | phik | 0.12.4 |
枕头 | 10.3.0 | 果仁 | 24.2 | platformdirs | 3.10.0 |
plotly | 5.22.0 | Pluggy (Python库) | 1.0.0 | pmdarima | 2.0.4 |
狗狗 | 1.8.2 | portalocker | 2.10.1 | preshed | 3.0.9 |
prometheus-client | 0.14.1 | prompt-toolkit | 3.0.43 | 先知 | 1.1.5 |
proto-plus | 1.24.0 | protobuf | 4.24.1 | psutil | 5.9.0 |
psycopg2 | 2.9.3 | ptyprocess | 0.7.0 | pure-eval | 0.2.2 |
py-cpuinfo | 9.0.0 | py-spy | 0.3.14 | pyarrow | 15.0.2 |
pyarrow-hotfix | 0.6 | pyasn1 | 0.4.8 | pyasn1-modules | 0.2.8 |
pybind11 | 2.13.6 | pyccolo | 0.0.65 | Python代码解析器 | 2.21 |
pydantic | 2.8.2 | pydantic_core | 2.20.1 | pyflakes | 3.2.0 |
Pygments | 2.15.1 | PyGObject | 3.48.2 | PyJWT | 2.7.0 |
PyNaCl | 1.5.0 | pyodbc | 5.0.1 | pyOpenSSL | 24.0.0 |
pyparsing | 3.0.9 | pyright | 1.1.294 | pytesseract | 0.3.10 |
python-dateutil | 2.9.0.post0 | Python代码编辑器 | 1.0.4 | python-json-logger | 2.0.7 |
python-lsp-jsonrpc | 1.1.2 | python-lsp-server | 1.10.0 | python-snappy | 0.6.1 |
pytoolconfig | 1.2.6 | pytorch-ranger | 0.1.1 | Python时区库pytz | 2024.1 |
PyWavelets | 1.5.0 | PyYAML | 6.0.1 | pyzmq | 25.1.2 |
问卷 | 1.10.0 | 射线 | 2.35.0 | 引用 | 0.30.2 |
正则表达式 | 2023年10月3日 | 请求 | 2.32.2 | requests-oauthlib | 1.3.1 |
rfc3339-validator | 0.1.4 | rfc3986验证器 | 0.1.1 | 富 | 13.3.5 |
绳子 | 1.12.0 | rpds-py | 0.10.6 | rsa | 4.9 |
ruamel.yaml | 0.18.6 | ruamel.yaml.clib | 0.2.8 | s3transfer | 0.10.2 |
safetensors | 0.4.4 | scikit-image | 0.23.2 | scikit-learn | 1.4.2 |
scipy | 1.13.1 | seaborn | 0.13.2 | Send2Trash | 1.8.2 |
sentence-transformers (句子转换器) | 3.0.1 | sentencepiece | 0.2.0 | setuptools | 74.0.0 |
沙普 | 0.46.0 | 谢灵汉姆 | 1.5.4 | simplejson | 3.17.6 |
6 | 1.16.0 | 切片机 | 0.0.8 | smart-open | 5.2.1 |
smmap | 5.0.0 | 思尼菲欧 | 1.3.0 | 音频文件 | 0.12.1 |
滤汤器 | 2.5 | soxr | 0.5.0.post1 | spacy | 3.7.5 |
spacy-legacy | 3.0.12 | spacy-loggers | 1.0.5 | SQLAlchemy | 2.0.30 |
sqlparse | 0.4.2 | srsly | 2.4.8 | ssh-import-id | 5.11 |
堆栈数据 | 0.2.0 | 斯塔尼奥 | 0.5.1 | statsmodels | 0.14.2 |
sympy | 1.12 | 制表 | 0.9.0 | tangled -up-in-unicode | 0.2.0 |
毅力 | 8.2.2 | tensorboard | 2.17.0 | TensorBoard数据服务器 | 0.7.2 |
tensorboard-profile插件 | 2.17.0 | tensorboardX | 2.6.2.2 | TensorFlow | 2.18.0 |
tensorflow-estimator | 2.15.0 | termcolor | 2.4.0 | 完成 | 0.17.1 |
文本 | 0.81.0 | tf_keras | 2.17.0 | thinc | 8.2.5 |
threadpoolctl | 2.2.0 | tifffile | 2023.4.12 | tiktoken | 0.7.0 |
tinycss2 | 1.2.1 | tokenize-rt | 4.2.1 | 分词器 | 0.19.1 |
tomli | 2.0.1 | 火炬 | 2.4.0+cu124 | torch-optimizer | 0.3.0 |
torcheval | 0.0.7 | torchmetrics | 1.4.0.post0 | torchvision | 0.19.0+cu124 |
龙卷风 | 6.4.1 | tqdm | 4.66.4 | Traitlets | 5.14.3 |
变压器 | 4.44.0 | 氚核 | 3.0.0 | 类型守卫 | 4.3.0 |
打字员 | 0.12.5 | types-protobuf | 3.20.3 | types-psutil | 5.9.0 |
types-pytz | 2023.3.1.1 | types-PyYAML | 6.0.0 | 类型-请求 | 2.31.0.0 |
types-setuptools(类型-安装工具包) | 68.0.0.0 | 类型-六 | 1.16.0 | types-urllib3 | 1.26.25.14 |
typing_extensions | 4.11.0 | uc-micro-py | 1.0.1 | ujson | 5.10.0 |
无人值守升级 | 0.1 | URI 模板 | 1.3.0 | urllib3 | 1.26.16 |
验证程序 | 0.34.0 | virtualenv | 20.26.2 | 愿景 | 0.7.5 |
wadllib | 1.3.6 | 山葵 | 1.1.3 | wcwidth | 0.2.5 |
黄鼠狼 | 0.4.1 | webcolors | 24.8.0 | Web编码 | 0.5.1 |
WebSocket客户端 | 1.8.0 | WebSockets | 11.0.3 | Werkzeug | 3.0.3 |
whatthepatch | 1.0.2 | 轮子 | 0.43.0 | wordcloud | 1.9.3 |
裹住 | 1.14.1 | xgboost | 2.0.3 | xgboost-ray | 0.1.19 |
xxhash | 3.4.1 | yapf | 0.33.0 | yarl | 1.9.3 |
ydata-profiling | 4.9.0 | 齐普 | 3.17.0 | zstd | 1.5.5.1 |
R 库
R 库与 Databricks Runtime 16.0 中的 R 库完全相同。
Java 库和 Scala 库(Scala 2.12 群集)
除了 Databricks Runtime 16.0 中的 Java 库和 Scala 库之外,Databricks Runtime 16.0 ML 还包含以下 JAR:
CPU 群集
组 ID | 项目 ID | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.dmlc | xgboost4j-spark_2.12 | 1.7.3 |
ml.dmlc | xgboost4j_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.4-db1-spark3.5 |
org.mlflow | mlflow-client | 2.15.1 |
org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |
GPU 群集
组 ID | 项目 ID | 版本 |
---|---|---|
com.typesafe.akka | akka-actor_2.12 | 2.5.23 |
ml.dmlc | xgboost4j-gpu_2.12 | 1.7.3 |
ml.dmlc | xgboost4j-spark-gpu_2.12 | 1.7.3 |
org.graphframes | graphframes_2.12 | 0.8.4-db1-spark3.5 |
org.mlflow | mlflow-client | 2.15.1 |
org.tensorflow | spark-tensorflow-connector_2.12(一个用于Spark与TensorFlow连接的软件包) | 1.15.0 |