AutoML 特征存储集成
AutoML 可使用 Unity Catalog 中的特征表或工作区功能存储中的功能增强原始输入数据集。
要求
- 分类与回归试验需要 Databricks Runtime 11.3 LTS ML 及更高版本。
- 预测试验需要 Databricks Runtime 12.2 LTS ML 及更高版本。
使用 AutoML UI 来选择特征表
配置 AutoML 试验后,可以使用以下步骤选择特征表:
单击“加入特征(可选)”。
在“加入其他特征”页的“特征表”字段中选择一个特征表。
对于每个特征表主键,选择相应的查找键。 查找键应该是为 AutoML 试验提供的训练数据集中的列。
对于时序特征表,请选择相应的时间戳查找键。 同样,时间戳查找键应该是为 AutoML 试验提供的训练数据集中的列。
若要添加更多特征表,请单击“添加另一个特征表”并重复上述步骤。
将特征表与 AutoML API 配合使用
若要使用现有特征表,可以在 AutoML 运行规范中设置 feature_store_lookups
参数。
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
以下笔记本演示如何将特征表连接到训练数据集,以便与 AutoML 配合使用。