故障排除和限制

疑难解答

错误消息:Database recommender_system does not exist in the Hive metastore.

特征表存储为 Delta 表。 该数据库由表名称前缀指定,因此特征表 Recommender_system.customer_features 将存储在 recommender_system 数据库中。

若要创建数据库,请运行:

%sql CREATE DATABASE IF NOT EXISTS recommender_system;

错误消息:ModuleNotFoundError: No module named 'databricks.feature_engineering' or ModuleNotFoundError: No module named 'databricks.feature_store'

如果你使用的 Databricks Runtime 上未安装 databricks-feature-engineering,则会发生此错误。

databricks-feature-engineering 在 PyPI 上可用,可随以下项一起安装:

%pip install databricks-feature-engineering

错误消息:ModuleNotFoundError: No module named 'databricks.feature_store'

如果你使用的 Databricks Runtime 上未安装 databricks-feature-store,则会发生此错误。

注意

对于 Databricks Runtime 14.3 及更高版本,请通过 %pip install databricks-feature-engineering 改用 databricks-feature-engineering

databricks-feature-store 在 PyPI上可用,可随以下项一起安装:

%pip install databricks-feature-store

错误消息:Invalid input. Data is not compatible with model signature. Cannot convert non-finite values...'

在 Mosaic AI 模型服务中使用功能存储打包模型时,可能会出现此错误。 在向终结点的输入中提供自定义功能值时,必须为输入中的每个行或无行提供该功能的值。 不能仅为某些行提供功能自定义值。

限制

  • 一个模型最多可以使用 50 个表和 100 个函数进行训练。

  • 使用增量实时表作为功能表时,不支持 Databricks Runtime ML 群集。 相反,请使用共享群集,然后使用 pip install databricks-feature-engineering 手动安装客户端。 还必须安装任何其他必需的 ML 库。

    %pip install databricks-feature-engineering
    
  • 具体化视图和流式处理表由增量实时表管道管理。 fe.write_table() 不会更更新它们。 相反,请使用增量实时表管道来更新这些表。

  • 工作区特征存储不支持从特征表中删除单个特征。

  • 模型中最多可以使用 100 个按需功能