Databricks Runtime 10.1(不受支持)

以下发行说明提供了由 Apache Spark 3.2.0 提供支持的 Databricks Runtime 10.1 和 Databricks Runtime 10.1 Photon 的相关信息。 Databricks 于 2021 年 11 月发布了这些映像。 Photon 处于公共预览版

新增功能和改进

用于压缩小文件的新 Delta 表设置

除了现有的 truefalse 值之外,Delta 表属性 delta.autoOptimize.autoCompact 现在还接受 autolegacy 的新值。 如果设置为 auto(建议),自动压缩将使用更好的默认值,例如将 32 MB 设置为目标文件大小(尽管默认行为将来可能会发生更改)。 如果设置为 legacytrue,自动压缩将使用 128 MB 作为目标文件大小。

可以将 spark.databricks.delta.autoCompact.enabled 配置设置为 autolegacytrue,而不是为单个表设置此属性,以便为所有 Delta 表启用自动压缩。 在当前会话期间,此配置优先于相关的表属性。

可以使用 spark.databricks.delta.autoCompact.maxFileSize 配置控制自动压缩的目标文件大小。

有关自动压缩的详细信息,请参阅 Azure Databricks 上的 Delta Lake 的自动压缩

用于 Parquet 查询扫描的新行组指标

具有 Parquet 扫描的查询现在会在 Spark UI 中显示行组指标。 这些行组指标包括:

  • parquet 行组总数
  • 读取的 parquet 行组数

用于 Delta 源流式处理查询的 Trigger.AvailableNow

此项更改支持对 Scala 中的增量源流式处理查询使用新类型的触发器:Trigger.AvailableNow。 它与 Trigger.Once 类似,会处理所有可用数据,然后停止查询。 但是,Trigger.AvailableNow 可提供更好的可伸缩性,因为数据可以分为多批(而不是一批)进行处理。 此更改未引入新接口;它实现现有 Spark API。 此触发器还支持 Delta 已支持作为源的所有速率限制选项。

例如:

spark.readStream
  .format("delta")
  .option("maxFilesPerTrigger", "1")
  .load(inputDir)
  .writeStream
  .trigger(Trigger.AvailableNow)
  .option("checkpointLocation", checkpointDir)
  .start()

请在什么是自动加载程序?中查看 Trigger.AvailableNow 的覆盖范围。

用于自动加载程序的 Trigger.AvailableNow

Trigger.AvailableNow 是类似于 Trigger.Once 的新流式处理触发器模式。 Trigger.Once 会处理所有可用数据,然后停止查询。 Trigger.AvailableNow 具有更好的可伸缩性,因为数据可以分为多批(而不是一批)进行处理。 现在,自动加载程序在 Scala 的目录列表和文件通知模式下都支持 Trigger.AvailableNow。 请在什么是自动加载程序?中查看 Trigger.AvailableNow 的覆盖范围。

针对通过 DataFrame 选项传递的 Hadoop 文件系统配置的 Delta 支持

与 Parquet 类似,Delta 现在支持在读取或写入表时,使用 DataFrameReader.load(path)DataFrameWriter.save(path)DataFrameReaderDataFrameWriter 选项读取 Hadoop 文件系统配置。 请参阅配置 Delta 存储凭据

有状态流式处理作业现在支持异步状态检查点(公共预览版)

异步状态检查点是一种新功能,它可能会减少具有大量状态更新的有状态流式处理作业中的端到端微批延迟。 有关用于有状态查询的异步状态检查点

具有凭据传递的 Sparklyr

现在,可以通过凭据传递,使用 sparklyr API 对云存储读取和写入数据。 此功能仅限于具有单用户访问权限的标准群集。 请参阅使用 Microsoft Entra ID(以前称为 Azure Active Directory)凭据直通访问 Azure Data Lake Storage(旧版)

Databricks 实用工具数据汇总精准率控制(公共预览版)

dbutils.data.summarize 的新 precise 参数可控制汇总结果的精确率。 当 precise 设置为 false(默认值)时,汇总会返回非重复计数、百分位和频繁项计数的近似结果。 当 precise 设置为 true 时,现在使用精确非重复计数和频繁项计数来计算汇总,具有更精确的百分位估计值。 请参阅 summarize 命令 (dbutils.data.summarize)

Azure Databricks 笔记本现可与 IPython 内核一起使用

现可将 Azure Databricks 群集配置为使用 IPython 内核来执行 Python 代码。 在 Azure Databricks 上使用 IPython 内核,可增加对 IPython 的显示和输出工具的支持。 此外,IPython 内核捕获由笔记本创建的子进程 stdout 和 stderr 输出,从而允许该输出包含在笔记本的命令结果中。

有关详细信息,请参阅 IPython 内核

Spark SQL 中的新函数

添加了以下对象和命令,用于处理 Unity Catalog(预览版)中的数据:

已为 Delta Sharing(预览版)添加了以下命令,通过这些命令,你可以与组织外部的收件人共享只读数据:

Bug 修复

  • 修复了一个争用条件,它可能会导致查询失败并出现 IOException(例如 No FileSystem for scheme),或是导致对 sparkContext.hadoopConfiguration 进行修改以便在查询中不会生效。

库升级

  • 升级了 Python 库:
    • filelock 从 3.0.12 到 3.3.1
    • koalas 从 1.8.1 到 1.8.2
    • plotly 从 5.1.0 到 5.3.0
  • 升级了 R 库:
    • bslib 从 0.3.0 到 0.3.1
    • caret 从 6.0-88 到 6.0-90
    • cpp11 从 0.3.1 到 0.4.0
    • data.table 从 1.14.0 到 1.14.2
    • desc 从 1.3.0 到 1.4.0
    • diffobj 从 0.3.4 到 0.3.5
    • digest 从 0.6.27 到 0.6.28
    • generics 从 0.1.0 到 0.1.1
    • hms 从 1.1.0 到 1.1.1
    • knitr 从 1.34 到 1.36
    • lattice 从 0.20-44 升级到 0.20-45
    • lifecycle 从 1.0.0 到 1.0.1
    • lubridate 从 1.7.10 到 1.8.0
    • mgcv 从 1.8-37 到 1.8-38
    • mime 从 0.11 到 0.12
    • pkgload 从 1.2.2 到 1.2.3
    • progressr 从 0.8.0 到 0.9.0
    • rcmdcheck 从 1.3.3 到 1.4.0
    • readr 从 2.0.1 到 2.0.2
    • recipes 从 0.1.16 到 0.1.17
    • remotes 从 2.4.0 到 2.4.1
    • rlang 从 0.4.11 到 0.4.12
    • rvest 从 1.0.1 到 1.0.2
    • shiny 从 1.6.0 到 1.7.1
    • stringi 从 1.7.4 到 1.7.5
    • testthat 从 3.0.4 到 3.1.0
    • tidyr 从 1.1.3 到 1.1.4
    • tinytex 从 0.33 到 0.34
    • usethis 从 2.0.1 到 2.1.2
    • xfun 从 0.26 到 0.27
  • 升级了 Java 库:
    • com.zaxxer.HikariCP 从 3.1.0 到 4.0.3

Apache Spark

Databricks Runtime 10.1 包括 Apache Spark 3.2.0。 此版本包括 Databricks Runtime 10.0(不受支持)中所包含的所有 Spark 修复和改进,以及对 Spark 进行的以下其他 bug 修复和改进:

  • [SPARK-37037] [SQL] 通过 UTF8String 和 ByteArray 的统一 compareTo 函数改进了字节数组排序
  • [SPARK-37091] [R] SystemRequirements 包含 Java < 18
  • [SPARK-37041] [SQL] 后端 HIVE-15025:对 HMS 的安全套接字层 (SSL) 支持
  • [SPARK-37098] [SQL] 更改表属性应使缓存失效
  • [SPARK-36992] [SQL] 通过 UTF8String 和 ByteArray 的统一 getPrefix 函数改进了字节数组排序性能
  • [SPARK-37047] [SQL] 为二进制字符串添加了 lpad 和 rpad 函数
  • [SPARK-37076] [SQL] 为 Scala 2.13 显式实现 StructType.toString
  • [SPARK-37075] [SQL] 将 UDAF 表达式生成从 sql/catalyst 移动到 sql/core
  • [SPARK-37084] [SQL] 将 spark.sql.files.openCostInBytes 设置为 bytesConf
  • [SPARK-37088] [PYSPARK][SQL] 写入器线程在任务完成侦听器返回后不得访问输入
  • [SPARK-37069] [SQL] 在 Hive.getWithoutRegisterFns 不可用时正确回退
  • [SPARK-37050] [PYTHON] 更新 Conda 安装说明
  • [SPARK-37067] [SQL] 使用 ZoneId.of() 处理 DatetimeUtils 中的时区字符串
  • [SPARK-35925] [SQL] 支持 width-bucket 函数中的 DayTimeIntervalType
  • [SPARK-35926] [SQL] 为 width_bucket 添加支持 YearMonthIntervalType
  • [SPARK-35973] [SQL] 添加命令 SHOW CATALOGS
  • [SPARK-36922] [SQL] SIGN/SIGNUM 函数应支持 ANSI 间隔
  • [SPARK-37078] [CORE] 支持旧的 3 参数接收器构造函数
  • [SPARK-37061] [SQL] 在使用内部类时修复 CustomMetrics
  • [SPARK-35918] [AVRO] 统一了针对读/写的架构不匹配处理并增强了错误消息
  • [SPARK-36871] [SQL] 将 CreateViewStatement 迁移到 v2 命令
  • [SPARK-36898] [SQL] 使随机哈希联接因子可配置
  • [SPARK-36921] [SQL] 通过 DIV 支持 ANSI 间隔
  • [SPARK-36794] [SQL] 为 SEMI/ANTI 随机哈希联接生成关系时忽略重复的联接键
  • [SPARK-36867] [SQL] 修复与 GROUP BY 别名有关的错误消息
  • [SPARK-36914] [SQL] 在 JDBC 中实现 dropIndex 和 listIndexes(MySQL 方言)
  • [SPARK-35531] [SQL] 在调用 getPartitions 时将 hive 表直接传递给 HiveClient,以避免进行 HiveTable -> CatalogTable - -> HiveTable 的不必要转换
  • [SPARK-36718] [SQL] 仅在不复制成本高昂的表达式时才折叠项目
  • [SPARK-37046] [SQL]:更改视图不保留列大小写
  • [SPARK-36978] [SQL] InferConstraints 规则应对访问的嵌套字段(而不是根嵌套类型)创建 IsNotNull 约束
  • [SPARK-37052] [CORE] 在为 sql shell 时,Spark 应仅将 -verbose 参数传递给主类
  • [SPARK-37017] [SQL] 减小同步范围以防止潜在的死锁
  • [SPARK-37032] [SQL] 修复 SQL 参考页面中的中断 SQL 语法链接
  • [SPARK-36905] [SQL] 修复在没有显式列名的情况下读取 hive 视图
  • [SPARK-36678] 迁移 SHOW TABLES 以在默认情况下使用 V2 命令
  • [SPARK-36943] [SQL] 改善缺少列错误消息的可读性
  • [SPARK-36980] [SQL] 使用 CTE 插入支持查询
  • [SPARK-37001] [SQL] 默认情况下对最终哈希聚合禁用两个级别的映射
  • [SPARK-36970] [SQL] 手动禁用 date_format 函数的格式 B,使 Java 17 与 Java 8 兼容
  • [SPARK-36546] [SQL] 添加数组支持以便可按名称进行联合
  • [SPARK-36979] [SQL] 将 RewriteLateralSubquery 规则添加到 nonExcludableRules 中
  • [SPARK-36949] [SQL] 禁止具有 ANSI 间隔的 Hive 提供程序表
  • [SPARK-36849] [SQL] 将 UseStatement 迁移到 v2 命令框架
  • [SPARK-36868] [SQL] 将 CreateFunctionStatement 迁移到 v2 命令框架
  • [SPARK-36841] [SQL] 添加 ansi 语法 set catalog xxx 以更改当前目录
  • [SPARK-36821] [SQL] 使类 ColumnarBatch 可扩展 - 附录
  • [SPARK-36963] [SQL] 将 max_by/min_by 添加到 sql.functions
  • [SPARK-36913] [SQL] 在 DS V2 JDBC 中实现 createIndex 和 IndexExists(MySQL 方言)
  • [SPARK-36848] [SQL] 将 ShowCurrentNamespaceStatement 迁移到 v2 命令框架
  • [SPARK-36526] [SQL] DSV2 索引支持:添加 supportsIndex 接口
  • [SPARK-36960] [SQL] 将具有 ANSI 间隔值的筛选器下推到 ORC
  • [SPARK-36929] [SQL] 删除未使用的方法 EliminateSubqueryAliasesSuite#assertEquivalent
  • [SPARK-36931] [SQL] 支持对 ORC 数据源读取和写入 ANSI 间隔
  • [SPARK-34980] [SQL] 支持在 AQE 中通过联合实现联合分区
  • [SPARK-36809] [SQL] 对 DPP 中使用的 InSubqueryExec 删除广播
  • [SPARK-36813] [SQL][PYTHON] 提出 as-of 联接的基础结构并实现 ps.merge_asof
  • [SPARK-36918] [SQL] 比较 unionByName 的结构时忽略类型
  • [SPARK-36891] [SQL] 重构 SpecificParquetRecordReaderBase 并对矢量化 Parquet 解码添加更多覆盖范围
  • [SPARK-36920] [SQL] 通过 ABS() 支持 ANSI 间隔
  • [SPARK-36888] [SQL] 为 sha2 函数添加测试用例
  • [SPARK-36889] [SQL] 通过 v2 parquet 扫描生成器遵循 spark.sql.parquet.filterPushdown
  • [SPARK-36830] [SQL] 支持对 JSON 数据源读取和写入 ANSI 间隔
  • [SPARK-36870] [SQL] 引入 INTERNAL_ERROR 错误类
  • [SPARK-36831] [SQL] 支持对 CSV 数据源读取和写入 ANSI 间隔。
  • [SPARK-36550] [SQL] 在 UDF 反射失败时传播原因
  • [SPARK-36866] [SQL] 将具有 ANSI 间隔值的筛选器下推到 parquet
  • [SPARK-33832] [SQL] 强制倾斜联接代码简化和改进
  • [SPARK-36642] [SQL] 添加 df.withMetadata pyspark API
  • [SPARK-35765] [SQL] 非重复聚合不区分重复项
  • [SPARK-36825] [SQL] 对 parquet 文件读取/写入具有 ANSI 间隔的数据帧
  • [SPARK-36829] [SQL] 重构 collectionOperators 的 NULL 检查
  • [SPARK-32712] [SQL] 支持写入 Hive Bucket 表(具有 Hive 哈希的 Hive 文件格式)
  • [SPARK-36797] [SQL] Union 应将嵌套列解析为顶级列
  • [SPARK-36838] [SQL] 改进 InSet 生成的代码性能
  • [SPARK-36683] [SQL] 添加新的内置 SQL 函数:SEC 和 CSC
  • [SPARK-36721] [SQL] 如果一端是文本,则简化布尔相等性
  • [SPARK-36760] [SQL] 添加接口 SupportsPushDownV2Filters
  • [SPARK-36652] [SQL] AQE 动态联接选择不应该应用于非等值联接
  • [SPARK-36745] [SQL] ExtractEquiJoinKeys 应对联接键返回原始谓词
  • [SPARK-36107] [SQL] 重构第一组 20 个查询执行错误以使用错误类
  • [SPARK-32709] [SQL] 支持写入 Hive Bucket 表(具有 Hive 哈希的 Parquet/ORC 格式)
  • [SPARK-36735] [SQL] 为 DPP 调整缓存关系的开销
  • [SPARK-33832] [SQL] 支持优化倾斜联接,即使引入了额外随机
  • [SPARK-36822] [SQL] BroadcastNestedLoopJoinExec 应使用所有条件而不是非等值条件
  • [SPARK-35221] [SQL] 添加对支持的联接提示的检查
  • [SPARK-36814] [SQL] 使类 ColumnarBatch 可扩展
  • [SPARK-36663] [SQL] 支持 ORC 数据源中的仅数字列名
  • [SPARK-36751] [SQL][PYTHON][R] 将 bit/octet_length API 添加到 Scala、Python 和 R
  • [SPARK-36733] [SQL] 修复结构具有多个字段时 SchemaPruning 中的性能问题
  • [SPARK-36724] [SQL] 支持timestamp_ntz 作为 SessionWindow 的时间列类型
  • [SPARK-36556] [SQL] 添加 DSV2 筛选器
  • [SPARK-36687] [SQL][CORE] 使用 _ERROR 后缀重命名错误类
  • [SPARK-35803] [SQL] 支持数据源 V2 CreateTempViewUsing
  • [SPARK-36642] [SQL] 添加 df.withMetadata:用于更新数据帧元数据的语法 suger

维护更新

请参阅 Databricks Runtime 10.1 维护更新

系统环境

  • 操作系统:Ubuntu 20.04.3 LTS
  • Java:Zulu 8.56.0.21-CA-linux64
  • Scala:2.12.14
  • Python:3.8.10
  • R:4.1.1
  • Delta Lake:1.0.0

已安装的 Python 库

版本 版本 版本
Antergos Linux 2015.10 (ISO-Rolling) appdirs 1.4.4 argon2-cffi 20.1.0
async-generator 1.10 attrs 20.3.0 backcall 0.2.0
bleach 3.3.0 boto3 1.16.7 botocore 1.19.7
certifi 2020.12.5 cffi 1.14.5 chardet 4.0.0
cycler 0.10.0 Cython 0.29.23 dbu-python 1.2.16
decorator 5.0.6 defusedxml 0.7.1 distlib 0.3.3
distro-info 0.23ubuntu1 entrypoints 0.3 facets-overview 1.0.0
filelock 3.3.1 idna 2.10 ipykernel 5.3.4
ipython 7.22.0 ipython-genutils 0.2.0 ipywidgets 7.6.3
jedi 0.17.2 Jinja2 2.11.3 jmespath 0.10.0
joblib 1.0.1 jsonschema 3.2.0 jupyter-client 6.1.12
jupyter-core 4.7.1 jupyterlab-pygments 0.1.2 jupyterlab-widgets 1.0.0
kiwisolver 1.3.1 koalas 1.8.2 MarkupSafe 2.0.1
matplotlib 3.4.2 mistune 0.8.4 nbclient 0.5.3
nbconvert 6.0.7 nbformat 5.1.3 nest-asyncio 1.5.1
笔记本 6.3.0 numpy 1.19.2 打包 20.9
pandas 1.2.4 pandocfilters 1.4.3 parso 0.7.0
patsy 0.5.1 pexpect 4.8.0 pickleshare 0.7.5
Pillow 8.2.0 pip 21.0.1 plotly 5.3.0
prometheus-client 0.10.1 prompt-toolkit 3.0.17 protobuf 3.17.2
psycopg2 2.8.5 ptyprocess 0.7.0 pyarrow 4.0.0
pycparser 2.20 Pygments 2.8.1 PyGObject 3.36.0
pyparsing 2.4.7 pyrsistent 0.17.3 python-apt 2.0.0+ubuntu0.20.4.6
python-dateutil 2.8.1 pytz 2020.5 pyzmq 20.0.0
请求 2.25.1 requests-unixsocket 0.2.0 s3transfer 0.3.7
scikit-learn 0.24.1 scipy 1.6.2 seaborn 0.11.1
Send2Trash 1.5.0 setuptools 52.0.0 6 1.15.0
ssh-import-id 5.10 statsmodels 0.12.2 tenacity 8.0.1
terminado 0.9.4 testpath 0.4.4 threadpoolctl 2.1.0
tornado 6.1 traitlets 5.0.5 unattended-upgrades 0.1
urllib3 1.25.11 virtualenv 20.4.1 wcwidth 0.2.5
webencodings 0.5.1 wheel 0.36.2 widgetsnbextension 3.5.1

已安装的 R 库

R 库安装自 2021-10-26 的 Microsoft CRAN 快照。

版本 版本 版本
askpass 1.1 assertthat 0.2.1 backports 1.2.1
base 4.1.1 base64enc 0.1-3 bit 4.0.4
bit64 4.0.5 blob 1.2.2 启动 1.3-28
brew 1.0-6 brio 1.1.2 broom 0.7.9
bslib 0.3.1 cachem 1.0.6 callr 3.7.0
caret 6.0-90 cellranger 1.1.0 chron 2.3-56
class 7.3-19 cli 3.0.1 clipr 0.7.1
cluster 2.1.2 codetools 0.2-18 colorspace 2.0-2
commonmark 1.7 compiler 4.1.1 config 0.3.1
cpp11 0.4.0 crayon 1.4.1 凭据 1.3.1
curl 4.3.2 data.table 1.14.2 datasets 4.1.1
DBI 1.1.1 dbplyr 2.1.1 desc 1.4.0
devtools 2.4.2 diffobj 0.3.5 digest 0.6.28
dplyr 1.0.7 dtplyr 1.1.0 e1071 1.7-9
ellipsis 0.3.2 评估 0.14 fansi 0.5.0
farver 2.1.0 fastmap 1.1.0 fontawesome 0.2.2
forcats 0.5.1 foreach 1.5.1 foreign 0.8-81
forge 0.2.0 fs 1.5.0 future 1.22.1
future.apply 1.8.1 gargle 1.2.0 generics 0.1.1
gert 1.4.1 ggplot2 3.3.5 gh 1.3.0
gitcreds 0.1.1 glmnet 4.1-2 globals 0.14.0
glue 1.4.2 googledrive 2.0.0 googlesheets4 1.0.0
gower 0.2.2 graphics 4.1.1 grDevices 4.1.1
grid 4.1.1 gridExtra 2.3 gsubfn 0.7
gtable 0.3.0 haven 2.4.3 highr 0.9
hms 1.1.1 htmltools 0.5.2 htmlwidgets 1.5.4
httpuv 1.6.3 httr 1.4.2 hwriter 1.3.2
hwriterPlus 1.0-3 ids 1.0.1 ini 0.3.1
ipred 0.9-12 isoband 0.2.5 iterators 1.0.13
jquerylib 0.1.4 jsonlite 1.7.2 KernSmooth 2.23-20
knitr 1.36 labeling 0.4.2 later 1.3.0
lattice 0.20-45 lava 1.6.10 lifecycle 1.0.1
listenv 0.8.0 lubridate 1.8.0 magrittr 2.0.1
markdown 1.1 MASS 7.3-54 矩阵 1.3-4
memoise 2.0.0 方法 4.1.1 mgcv 1.8-38
mime 0.12 ModelMetrics 1.2.2.2 modelr 0.1.8
munsell 0.5.0 nlme 3.1-152 nnet 7.3-16
numDeriv 2016.8-1.1 openssl 1.4.5 parallel 4.1.1
parallelly 1.28.1 pillar 1.6.4 pkgbuild 1.2.0
pkgconfig 2.0.3 pkgload 1.2.3 plogr 0.2.0
plyr 1.8.6 praise 1.0.0 prettyunits 1.1.1
pROC 1.18.0 processx 3.5.2 prodlim 2019.11.13
进度 1.2.2 progressr 0.9.0 promises 1.2.0.1
proto 1.0.0 proxy 0.4-26 ps 1.6.0
purrr 0.3.4 r2d3 0.2.5 R6 2.5.1
randomForest 4.6-14 rappdirs 0.3.3 rcmdcheck 1.4.0
RColorBrewer 1.1-2 Rcpp 1.0.7 readr 2.0.2
readxl 1.3.1 recipes 0.1.17 rematch 1.0.1
rematch2 2.1.2 remotes 2.4.1 reprex 2.0.1
reshape2 1.4.4 rlang 0.4.12 rmarkdown 2.11
RODBC 1.3-19 roxygen2 7.1.2 rpart 4.1-15
rprojroot 2.0.2 Rserve 1.8-8 RSQLite 2.2.8
rstudioapi 0.13 rversions 2.1.1 rvest 1.0.2
sass 0.4.0 scales 1.1.1 selectr 0.4-2
sessioninfo 1.1.1 shape 1.4.6 shiny 1.7.1
sourcetools 0.1.7 sparklyr 1.7.2 SparkR 3.2.0
spatial 7.3-11 splines 4.1.1 sqldf 0.4-11
SQUAREM 2021.1 stats 4.1.1 stats4 4.1.1
stringi 1.7.5 stringr 1.4.0 survival 3.2-13
sys 3.4 tcltk 4.1.1 TeachingDemos 2.10
testthat 3.1.0 tibble 3.1.5 tidyr 1.1.4
tidyselect 1.1.1 tidyverse 1.3.1 timeDate 3043.102
tinytex 0.34 工具 4.1.1 tzdb 0.1.2
usethis 2.1.2 utf8 1.2.2 utils 4.1.1
uuid 0.1-4 vctrs 0.3.8 viridisLite 0.4.0
vroom 1.5.5 waldo 0.3.1 whisker 0.4
withr 2.4.2 xfun 0.27 xml2 1.3.2
xopen 1.0.0 xtable 1.8-4 yaml 2.2.1
zip 2.2.0

已安装的 Java 库和 Scala 库(Scala 2.12 群集版本)

组 ID 项目 ID 版本
antlr antlr 2.7.7
com.amazonaws amazon-kinesis-client 1.12.0
com.amazonaws aws-java-sdk-autoscaling 1.11.655
com.amazonaws aws-java-sdk-cloudformation 1.11.655
com.amazonaws aws-java-sdk-cloudfront 1.11.655
com.amazonaws aws-java-sdk-cloudhsm 1.11.655
com.amazonaws aws-java-sdk-cloudsearch 1.11.655
com.amazonaws aws-java-sdk-cloudtrail 1.11.655
com.amazonaws aws-java-sdk-cloudwatch 1.11.655
com.amazonaws aws-java-sdk-cloudwatchmetrics 1.11.655
com.amazonaws aws-java-sdk-codedeploy 1.11.655
com.amazonaws aws-java-sdk-cognitoidentity 1.11.655
com.amazonaws aws-java-sdk-cognitosync 1.11.655
com.amazonaws aws-java-sdk-config 1.11.655
com.amazonaws aws-java-sdk-core 1.11.655
com.amazonaws aws-java-sdk-datapipeline 1.11.655
com.amazonaws aws-java-sdk-directconnect 1.11.655
com.amazonaws aws-java-sdk-directory 1.11.655
com.amazonaws aws-java-sdk-dynamodb 1.11.655
com.amazonaws aws-java-sdk-ec2 1.11.655
com.amazonaws aws-java-sdk-ecs 1.11.655
com.amazonaws aws-java-sdk-efs 1.11.655
com.amazonaws aws-java-sdk-elasticache 1.11.655
com.amazonaws aws-java-sdk-elasticbeanstalk 1.11.655
com.amazonaws aws-java-sdk-elasticloadbalancing 1.11.655
com.amazonaws aws-java-sdk-elastictranscoder 1.11.655
com.amazonaws aws-java-sdk-emr 1.11.655
com.amazonaws aws-java-sdk-glacier 1.11.655
com.amazonaws aws-java-sdk-glue 1.11.655
com.amazonaws aws-java-sdk-iam 1.11.655
com.amazonaws aws-java-sdk-importexport 1.11.655
com.amazonaws aws-java-sdk-kinesis 1.11.655
com.amazonaws aws-java-sdk-kms 1.11.655
com.amazonaws aws-java-sdk-lambda 1.11.655
com.amazonaws aws-java-sdk-logs 1.11.655
com.amazonaws aws-java-sdk-machinelearning 1.11.655
com.amazonaws aws-java-sdk-opsworks 1.11.655
com.amazonaws aws-java-sdk-rds 1.11.655
com.amazonaws aws-java-sdk-redshift 1.11.655
com.amazonaws aws-java-sdk-route53 1.11.655
com.amazonaws aws-java-sdk-s3 1.11.655
com.amazonaws aws-java-sdk-ses 1.11.655
com.amazonaws aws-java-sdk-simpledb 1.11.655
com.amazonaws aws-java-sdk-simpleworkflow 1.11.655
com.amazonaws aws-java-sdk-sns 1.11.655
com.amazonaws aws-java-sdk-sqs 1.11.655
com.amazonaws aws-java-sdk-ssm 1.11.655
com.amazonaws aws-java-sdk-storagegateway 1.11.655
com.amazonaws aws-java-sdk-sts 1.11.655
com.amazonaws aws-java-sdk-support 1.11.655
com.amazonaws aws-java-sdk-swf-libraries 1.11.22
com.amazonaws aws-java-sdk-workspaces 1.11.655
com.amazonaws jmespath-java 1.11.655
com.chuusai shapeless_2.12 2.3.3
com.clearspring.analytics 流 (stream) 2.9.6
com.databricks Rserve 1.8-3
com.databricks jets3t 0.7.1-0
com.databricks.scalapb compilerplugin_2.12 0.4.15-10
com.databricks.scalapb scalapb-runtime_2.12 0.4.15-10
com.esotericsoftware kryo-shaded 4.0.2
com.esotericsoftware minlog 1.3.0
com.fasterxml classmate 1.3.4
com.fasterxml.jackson.core jackson-annotations 2.12.2
com.fasterxml.jackson.core jackson-core 2.12.2
com.fasterxml.jackson.core jackson-databind 2.12.2
com.fasterxml.jackson.dataformat jackson-dataformat-cbor 2.12.2
com.fasterxml.jackson.datatype jackson-datatype-joda 2.12.2
com.fasterxml.jackson.module jackson-module-paranamer 2.12.2
com.fasterxml.jackson.module jackson-module-scala_2.12 2.12.2
com.github.ben-manes.caffeine caffeine 2.3.4
com.github.fommil jniloader 1.1
com.github.fommil.netlib core 1.1.2
com.github.fommil.netlib native_ref-java 1.1
com.github.fommil.netlib native_ref-java-natives 1.1
com.github.fommil.netlib native_system-java 1.1
com.github.fommil.netlib native_system-java-natives 1.1
com.github.fommil.netlib netlib-native_ref-linux-x86_64-natives 1.1
com.github.fommil.netlib netlib-native_system-linux-x86_64-natives 1.1
com.github.luben zstd-jni 1.5.0-4
com.github.wendykierp JTransforms 3.1
com.google.code.findbugs jsr305 3.0.0
com.google.code.gson gson 2.8.6
com.google.crypto.tink tink 1.6.0
com.google.flatbuffers flatbuffers-java 1.9.0
com.google.guava guava 15.0
com.google.protobuf protobuf-java 2.6.1
com.h2database h2 1.4.195
com.helger profiler 1.1.1
com.jcraft jsch 0.1.50
com.jolbox bonecp 0.8.0.RELEASE
com.lihaoyi sourcecode_2.12 0.1.9
com.microsoft.azure azure-data-lake-store-sdk 2.3.9
com.microsoft.sqlserver mssql-jdbc 9.2.1.jre8
com.ning compress-lzf 1.0.3
com.sun.istack istack-commons-runtime 3.0.8
com.sun.mail javax.mail 1.5.2
com.tdunning json 1.8
com.thoughtworks.paranamer paranamer 2.8
com.trueaccord.lenses lenses_2.12 0.4.12
com.twitter chill-java 0.10.0
com.twitter chill_2.12 0.10.0
com.twitter util-app_2.12 7.1.0
com.twitter util-core_2.12 7.1.0
com.twitter util-function_2.12 7.1.0
com.twitter util-jvm_2.12 7.1.0
com.twitter util-lint_2.12 7.1.0
com.twitter util-registry_2.12 7.1.0
com.twitter util-stats_2.12 7.1.0
com.typesafe config 1.2.1
com.typesafe.scala-logging scala-logging_2.12 3.7.2
com.univocity univocity-parsers 2.9.1
com.zaxxer HikariCP 4.0.3
commons-cli commons-cli 1.2
commons-codec commons-codec 1.15
commons-collections commons-collections 3.2.2
commons-dbcp commons-dbcp 1.4
commons-fileupload commons-fileupload 1.3.3
commons-httpclient commons-httpclient 3.1
commons-io commons-io 2.8.0
commons-lang commons-lang 2.6
commons-logging commons-logging 1.1.3
commons-net commons-net 3.1
commons-pool commons-pool 1.5.4
dev.ludovic.netlib arpack 1.3.2
dev.ludovic.netlib blas 1.3.2
dev.ludovic.netlib lapack 1.3.2
hive-2.3__hadoop-3.2 jets3t-0.7 liball_deps_2.12
info.ganglia.gmetric4j gmetric4j 1.0.10
io.airlift aircompressor 0.19
io.delta delta-sharing-spark_2.12 0.2.0
io.dropwizard.metrics metrics-core 4.1.1
io.dropwizard.metrics metrics-graphite 4.1.1
io.dropwizard.metrics metrics-healthchecks 4.1.1
io.dropwizard.metrics metrics-jetty9 4.1.1
io.dropwizard.metrics metrics-jmx 4.1.1
io.dropwizard.metrics metrics-json 4.1.1
io.dropwizard.metrics metrics-jvm 4.1.1
io.dropwizard.metrics metrics-servlets 4.1.1
io.netty netty-all 4.1.63.Final
io.prometheus simpleclient 0.7.0
io.prometheus simpleclient_common 0.7.0
io.prometheus simpleclient_dropwizard 0.7.0
io.prometheus simpleclient_pushgateway 0.7.0
io.prometheus simpleclient_servlet 0.7.0
io.prometheus.jmx 收集器 0.12.0
jakarta.annotation jakarta.annotation-api 1.3.5
jakarta.servlet jakarta.servlet-api 4.0.3
jakarta.validation jakarta.validation-api 2.0.2
jakarta.ws.rs jakarta.ws.rs-api 2.1.6
javax.activation activation 1.1.1
javax.annotation javax.annotation-api 1.3.2
javax.el javax.el-api 2.2.4
javax.jdo jdo-api 3.0.1
javax.transaction jta 1.1
javax.transaction transaction-api 1.1
javax.xml.bind jaxb-api 2.2.2
javax.xml.stream stax-api 1.0-2
javolution javolution 5.5.1
jline jline 2.14.6
joda-time joda-time 2.10.5
log4j apache-log4j-extras 1.2.17
log4j log4j 1.2.17
maven-trees hive-2.3__hadoop-3.2 liball_deps_2.12
net.java.dev.jna jna 5.8.0
net.razorvine pyrolite 4.30
net.sf.jpam jpam 1.1
net.sf.opencsv opencsv 2.3
net.sf.supercsv super-csv 2.2.0
net.snowflake snowflake-ingest-sdk 0.9.6
net.snowflake snowflake-jdbc 3.13.3
net.snowflake spark-snowflake_2.12 2.9.0-spark_3.1
net.sourceforge.f2j arpack_combined_all 0.1
org.acplt.remotetea remotetea-oncrpc 1.1.2
org.antlr ST4 4.0.4
org.antlr antlr-runtime 3.5.2
org.antlr antlr4-runtime 4.8
org.antlr stringtemplate 3.2.1
org.apache.ant ant 1.9.2
org.apache.ant ant-jsch 1.9.2
org.apache.ant ant-launcher 1.9.2
org.apache.arrow arrow-format 2.0.0
org.apache.arrow arrow-memory-core 2.0.0
org.apache.arrow arrow-memory-netty 2.0.0
org.apache.arrow arrow-vector 2.0.0
org.apache.avro avro 1.10.2
org.apache.avro avro-ipc 1.10.2
org.apache.avro avro-mapred 1.10.2
org.apache.commons commons-compress 1.20
org.apache.commons commons-crypto 1.1.0
org.apache.commons commons-lang3 3.12.0
org.apache.commons commons-math3 3.4.1
org.apache.commons commons-text 1.6
org.apache.curator curator-client 2.13.0
org.apache.curator curator-framework 2.13.0
org.apache.curator curator-recipes 2.13.0
org.apache.derby derby 10.14.2.0
org.apache.hadoop hadoop-client-api 3.3.1-databricks
org.apache.hadoop hadoop-client-runtime 3.3.1
org.apache.hive hive-beeline 2.3.9
org.apache.hive hive-cli 2.3.9
org.apache.hive hive-jdbc 2.3.9
org.apache.hive hive-llap-client 2.3.9
org.apache.hive hive-llap-common 2.3.9
org.apache.hive hive-serde 2.3.9
org.apache.hive hive-shims 2.3.9
org.apache.hive hive-storage-api 2.7.2
org.apache.hive.shims hive-shims-0.23 2.3.9
org.apache.hive.shims hive-shims-common 2.3.9
org.apache.hive.shims hive-shims-scheduler 2.3.9
org.apache.htrace htrace-core4 4.1.0-incubating
org.apache.httpcomponents httpclient 4.5.13
org.apache.httpcomponents httpcore 4.4.12
org.apache.ivy ivy 2.5.0
org.apache.mesos mesos-shaded-protobuf 1.4.0
org.apache.orc orc-core 1.6.10
org.apache.orc orc-mapreduce 1.6.10
org.apache.orc orc-shims 1.6.10
org.apache.parquet parquet-column 1.12.0-databricks-0003
org.apache.parquet parquet-common 1.12.0-databricks-0003
org.apache.parquet parquet-encoding 1.12.0-databricks-0003
org.apache.parquet parquet-format-structures 1.12.0-databricks-0003
org.apache.parquet parquet-hadoop 1.12.0-databricks-0003
org.apache.parquet parquet-jackson 1.12.0-databricks-0003
org.apache.thrift libfb303 0.9.3
org.apache.thrift libthrift 0.12.0
org.apache.xbean xbean-asm9-shaded 4.20
org.apache.yetus audience-annotations 0.5.0
org.apache.zookeeper zookeeper 3.6.2
org.apache.zookeeper zookeeper-jute 3.6.2
org.checkerframework checker-qual 3.5.0
org.codehaus.jackson jackson-core-asl 1.9.13
org.codehaus.jackson jackson-mapper-asl 1.9.13
org.codehaus.janino commons-compiler 3.0.16
org.codehaus.janino janino 3.0.16
org.datanucleus datanucleus-api-jdo 4.2.4
org.datanucleus datanucleus-core 4.1.17
org.datanucleus datanucleus-rdbms 4.1.19
org.datanucleus javax.jdo 3.2.0-m3
org.eclipse.jetty jetty-client 9.4.40.v20210413
org.eclipse.jetty jetty-continuation 9.4.40.v20210413
org.eclipse.jetty jetty-http 9.4.40.v20210413
org.eclipse.jetty jetty-io 9.4.40.v20210413
org.eclipse.jetty jetty-jndi 9.4.40.v20210413
org.eclipse.jetty jetty-plus 9.4.40.v20210413
org.eclipse.jetty jetty-proxy 9.4.40.v20210413
org.eclipse.jetty jetty-security 9.4.40.v20210413
org.eclipse.jetty jetty-server 9.4.40.v20210413
org.eclipse.jetty jetty-servlet 9.4.40.v20210413
org.eclipse.jetty jetty-servlets 9.4.40.v20210413
org.eclipse.jetty jetty-util 9.4.40.v20210413
org.eclipse.jetty jetty-util-ajax 9.4.40.v20210413
org.eclipse.jetty jetty-webapp 9.4.40.v20210413
org.eclipse.jetty jetty-xml 9.4.40.v20210413
org.eclipse.jetty.websocket websocket-api 9.4.40.v20210413
org.eclipse.jetty.websocket websocket-client 9.4.40.v20210413
org.eclipse.jetty.websocket websocket-common 9.4.40.v20210413
org.eclipse.jetty.websocket websocket-server 9.4.40.v20210413
org.eclipse.jetty.websocket websocket-servlet 9.4.40.v20210413
org.fusesource.leveldbjni leveldbjni-all 1.8
org.glassfish.hk2 hk2-api 2.6.1
org.glassfish.hk2 hk2-locator 2.6.1
org.glassfish.hk2 hk2-utils 2.6.1
org.glassfish.hk2 osgi-resource-locator 1.0.3
org.glassfish.hk2.external aopalliance-repackaged 2.6.1
org.glassfish.hk2.external jakarta.inject 2.6.1
org.glassfish.jaxb jaxb-runtime 2.3.2
org.glassfish.jersey.containers jersey-container-servlet 2.34
org.glassfish.jersey.containers jersey-container-servlet-core 2.34
org.glassfish.jersey.core jersey-client 2.34
org.glassfish.jersey.core jersey-common 2.34
org.glassfish.jersey.core jersey-server 2.34
org.glassfish.jersey.inject jersey-hk2 2.34
org.hibernate.validator hibernate-validator 6.1.0.Final
org.javassist javassist 3.25.0-GA
org.jboss.logging jboss-logging 3.3.2.Final
org.jdbi jdbi 2.63.1
org.jetbrains annotations 17.0.0
org.joda joda-convert 1.7
org.jodd jodd-core 3.5.2
org.json4s json4s-ast_2.12 3.7.0-M11
org.json4s json4s-core_2.12 3.7.0-M11
org.json4s json4s-jackson_2.12 3.7.0-M11
org.json4s json4s-scalap_2.12 3.7.0-M11
org.lz4 lz4-java 1.7.1
org.mariadb.jdbc mariadb-java-client 2.2.5
org.objenesis objenesis 2.5.1
org.postgresql postgresql 42.2.19
org.roaringbitmap RoaringBitmap 0.9.14
org.roaringbitmap shims 0.9.14
org.rocksdb rocksdbjni 6.20.3
org.rosuda.REngine REngine 2.1.0
org.scala-lang scala-compiler_2.12 2.12.14
org.scala-lang scala-library_2.12 2.12.14
org.scala-lang scala-reflect_2.12 2.12.14
org.scala-lang.modules scala-collection-compat_2.12 2.4.3
org.scala-lang.modules scala-parser-combinators_2.12 1.1.2
org.scala-lang.modules scala-xml_2.12 1.2.0
org.scala-sbt test-interface 1.0
org.scalacheck scalacheck_2.12 1.14.2
org.scalactic scalactic_2.12 3.0.8
org.scalanlp breeze-macros_2.12 1.0
org.scalanlp breeze_2.12 1.0
org.scalatest scalatest_2.12 3.0.8
org.slf4j jcl-over-slf4j 1.7.30
org.slf4j jul-to-slf4j 1.7.30
org.slf4j slf4j-api 1.7.30
org.slf4j slf4j-log4j12 1.7.30
org.spark-project.spark unused 1.0.0
org.springframework spring-core 4.1.4.RELEASE
org.springframework spring-test 4.1.4.RELEASE
org.threeten threeten-extra 1.5.0
org.tukaani xz 1.8
org.typelevel algebra_2.12 2.0.0-M2
org.typelevel cats-kernel_2.12 2.0.0-M4
org.typelevel machinist_2.12 0.6.8
org.typelevel macro-compat_2.12 1.1.1
org.typelevel spire-macros_2.12 0.17.0-M1
org.typelevel spire-platform_2.12 0.17.0-M1
org.typelevel spire-util_2.12 0.17.0-M1
org.typelevel spire_2.12 0.17.0-M1
org.wildfly.openssl wildfly-openssl 1.0.7.Final
org.xerial sqlite-jdbc 3.8.11.2
org.xerial.snappy snappy-java 1.1.8.4
org.yaml snakeyaml 1.24
oro oro 2.0.8
pl.edu.icm JLargeArrays 1.5
software.amazon.ion ion-java 1.0.2
stax stax-api 1.0.1