故障排除和限制
疑难解答
错误消息:Database recommender_system does not exist in the Hive metastore.
特征表存储为 Delta 表。 该数据库由表名称前缀指定,因此特征表 Recommender_system.customer_features 将存储在 recommender_system 数据库中。
若要创建数据库,请运行:
%sql CREATE DATABASE IF NOT EXISTS recommender_system;
错误消息:ModuleNotFoundError: No module named 'databricks.feature_engineering'
or ModuleNotFoundError: No module named 'databricks.feature_store'
如果你使用的 Databricks Runtime 上未安装 databricks-feature-engineering,则会发生此错误。
databricks-feature-engineering 在 PyPI 上可用,可随以下项一起安装:
%pip install databricks-feature-engineering
错误消息:ModuleNotFoundError: No module named 'databricks.feature_store'
如果你使用的 Databricks Runtime 上未安装 databricks-feature-store,则会发生此错误。
注意
对于 Databricks Runtime 14.3 及更高版本,请通过 %pip install databricks-feature-engineering
改用 databricks-feature-engineering
databricks-feature-store 在 PyPI上可用,可随以下项一起安装:
%pip install databricks-feature-store
错误消息:Invalid input. Data is not compatible with model signature. Cannot convert non-finite values...'
在 Mosaic AI 模型服务中使用功能存储打包模型时,可能会出现此错误。 在向终结点的输入中提供自定义功能值时,必须为输入中的每个行或无行提供该功能的值。 不能仅为某些行提供功能自定义值。
限制
一个模型最多可以使用 50 个表和 100 个函数进行训练。
使用增量实时表作为功能表时,不支持 Databricks Runtime ML 群集。 相反,请使用共享群集,然后使用
pip install databricks-feature-engineering
手动安装客户端。 还必须安装任何其他必需的 ML 库。%pip install databricks-feature-engineering
具体化视图和流式处理表由增量实时表管道管理。
fe.write_table()
不会更更新它们。 相反,请使用增量实时表管道来更新这些表。工作区特征存储不支持从特征表中删除单个特征。
模型中最多可以使用 100 个按需功能。