AutoML 特征存储集成

AutoML 可使用 Unity Catalog 中的特征表工作区功能存储中的功能增强原始输入数据集。

要求

  • 分类与回归试验需要 Databricks Runtime 11.3 LTS ML 及更高版本。
  • 预测试验需要 Databricks Runtime 12.2 LTS ML 及更高版本。

使用 AutoML UI 来选择特征表

配置 AutoML 试验后,可以使用以下步骤选择特征表:

  1. 单击“加入特征(可选)”。

    选择“加入特征”按钮

  2. 在“加入其他特征”页的“特征表”字段中选择一个特征表。

  3. 对于每个特征表主键,选择相应的查找键。 查找键应该是为 AutoML 试验提供的训练数据集中的列。

  4. 对于时序特征表,请选择相应的时间戳查找键。 同样,时间戳查找键应该是为 AutoML 试验提供的训练数据集中的列。

    选择主键和查找表

  5. 若要添加更多特征表,请单击“添加另一个特征表”并重复上述步骤。

将特征表与 AutoML API 配合使用

若要使用现有特征表,可以在 AutoML 运行规范中设置 feature_store_lookups 参数。

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

以下笔记本演示如何将特征表连接到训练数据集,以便与 AutoML 配合使用。

使用特征表笔记本的 AutoML 试验

获取笔记本