CLI (v2) 计划用于模型监视的 YAML 架构(预览版)
本文内容
适用于:Azure CLI ml 扩展 v2(当前)
本文档中详细介绍的 YAML 语法基于最新版本的 ML CLI v2 扩展的 JSON 架构。 此语法必定仅适用于最新版本的 ML CLI v2 扩展。 详尽的 JSON 架构请参见 https://azuremlschemas.azureedge.net/latest/monitorSchedule.schema.json 。
可以在 https://azuremlschemasprod.azureedge.net/ 上查找早期扩展版本的架构。
YAML 语法
密钥
类型
说明
允许的值
$schema
字符串
YAML 架构。
name
字符串
必需。 计划名称。
description
string
计划的描述。
tags
object
计划的标记字典。
trigger
object
必需。 用于定义何时触发作业的规则的触发器配置。 必须指定 RecurrenceTrigger
或 CronTrigger
。
create_monitor
object
必需。 将由计划触发的监视的定义。 MonitorDefinition
是必需的。
触发器配置
重复触发器
密钥
类型
说明
允许的值
type
字符串
必需。 指定计划类型。
recurrence
frequency
字符串
必需。 指定描述计划触发频率的时间单位。
minute
、hour
、day
、week
、month
interval
整型
必需。 指定计划触发的时间间隔。
start_time
字符串
使用时区描述开始日期和时间。 如果省略 start_time
,第一个作业将立即运行,以后的作业根据计划触发,即 start_time
等于作业创建时间。 如果开始时间在过去,则第一个作业将在下一个计算的运行时间运行。
end_time
字符串
用时区描述结束日期和时间。 如果省略 end_time
,计划将继续运行,直到被显式禁用为止。
timezone
字符串
指定定期时区。 如果省略,则默认为 UTC。
请参阅时区值附录
pattern
object
指定定期模式。 如果省略模式,将根据 start_time、frequency 和 interval 的逻辑触发作业。
定期计划
定期计划定义定期模式,包含 hours
、minutes
和 weekdays
。
当频率为 day
时,模式可指定 hours
和 minutes
。
当频率为 week
和 month
时,模式可指定 hours
、minutes
和 weekdays
。
密钥
类型
允许的值
hours
整数或整数数组
0-23
minutes
整数或整数数组
0-59
week_days
字符串或字符串数组
monday
、tuesday
、wednesday
、thursday
、friday
、saturday
、sunday
CronTrigger
密钥
类型
说明
允许的值
type
字符串
必需。 指定计划类型。
cron
expression
字符串
必需。 指定用于定义如何触发作业的 cron 表达式。 表达式使用标准 crontab 表达式来表达定期计划。 单个表达式由 5 个空格分隔的字段组成:MINUTES HOURS DAYS MONTHS DAYS-OF-WEEK
start_time
字符串
使用时区描述开始日期和时间。 如果省略 start_time,第一个作业将立即运行,以后的作业根据计划触发,即 start_time 等于作业创建时间。 如果开始时间在过去,则第一个作业将在下一个计算的运行时间运行。
end_time
字符串
用时区描述结束日期和时间。 如果 end_time 被省略,计划将继续运行,直到被显式禁用为止。
timezone
字符串
指定定期时区。 如果省略,则默认为 UTC。
请参阅时区值附录
监视定义
密钥
类型
说明
允许的值
默认值
compute
Object
“必需”。 用于运行监视作业的 Spark 池计算资源的说明。
compute.instance_type
String
“必需”。 要用于 Spark 池的计算实例类型。
“standard_e4s_v3”、“standard_e8s_v3”、“standard_e16s_v3”、“standard_e32s_v3”、“standard_e64s_v3”
不适用
compute.runtime_version
String
可选。 定义 Spark 运行时版本。
3.3
3.3
monitoring_target
Object
与模型监视关联的 Azure 机器学习资产。
monitoring_target.ml_task
字符串
模型的机器学习任务。
允许的值为:classification
、regression
、question_answering
monitoring_target.endpoint_deployment_id
字符串
可选。 关联的 Azure 机器学习终结点/部署 ID,格式为 azureml:myEndpointName:myDeploymentName
。 如果终结点/部署已启用模型数据收集用于模型监视,则此字段是必需的。
monitoring_target.model_id
String
可选。 用于模型监视的关联模型 ID。
monitoring_signals
Object
要包含的监视信号字典。 键是监视上下文中监视信号的名称,值是包含监视信号规范 的对象。 对于使用最近的以往生产数据作为比较基线并具有 3 个监视信号(数据偏移、预测偏移和数据质量)的基本模型监视可选 。
alert_notification
字符串或对象
警报通知收件人的说明。
允许两个警报目标之一:azmonitoring
字符串或 emails
对象(包含电子邮件收件人数组)
alert_notification.emails
Object
要接收警报通知的电子邮件地址列表。
监视信号
数据偏移
随着用于训练模型的数据在生产中不断演变,数据的分布可能会发生变化,从而导致训练数据与模型用于预测的真实数据之间的不匹配。 数据偏移是当用于训练模型的输入数据的统计属性随时间变化时,机器学习中发生的一种现象。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件。
data_drift
data_drift
production_data
Object
可选。 要分析以监视信号的生产数据的说明。
production_data.input_data
Object
可选。 输入数据源的说明,请参阅作业输入数据 规范。
production_data.data_context
String
数据的上下文,它引用模型生产数据,可以是模型输入或模型输出
model_inputs
production_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset
和 production_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start
和 production_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
production_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 production_data.data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
reference_data
Object
可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。
reference_data.input_data
Object
输入数据源的说明,请参阅作业输入数据 规范。
reference_data.data_context
String
数据的上下文,它是指之前使用数据集的上下文
model_inputs
、training
、test
、validation
reference_data.data_column_names.target_column
Object
可选。 如果 reference_data
是训练数据,则需要此属性来监视数据偏移的前 N 个特征。
reference_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset
和 reference_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start
和 reference_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
reference_data_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 reference_data.input_data.type
为 uri_folder
,则为必需项 ,请参阅预处理组件规范 。
features
Object
可选。 要为数据偏移监视的目标特征。 某些模型可能有数百或数千个特征,始终建议指定感兴趣的特征进行监视。
以下值之一:特征名称列表、features.top_n_feature_importance
或 all_features
如果 production_data.data_context
为 training
,则默认值为 features.top_n_feature_importance = 10
;否则,默认值为 all_features
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds
Object
监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled
为 true
时,用户将收到警报通知。
metric_thresholds.numerical
Object
可选。 key:value
格式的指标和阈值列表,其中 key
是指标名称,value
是阈值。
允许的数字指标名称:jensen_shannon_distance
、normalized_wasserstein_distance
、population_stability_index
、two_sample_kolmogorov_smirnov_test
metric_thresholds.categorical
Object
可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。
允许的分类指标名称:jensen_shannon_distance
、chi_squared_test
、population_stability_index
预测偏移
预测偏移通过将模型预测输出与验证或测试标记的数据或最近的过往生产数据进行比较来跟踪其分布的变化。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件。
prediction_drift
prediction_drift
production_data
Object
可选。 要分析以监视信号的生产数据的说明。
production_data.input_data
Object
可选。 输入数据源的说明,请参阅作业输入数据 规范。
production_data.data_context
String
数据的上下文,它引用模型生产数据,可以是模型输入或模型输出
model_outputs
production_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset
和 production_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start
和 production_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
production_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 production_data.data.input_data.type
为 uri_folder
时是必填项。 有关预处理组件规范的详细信息,请参阅预处理组件规范 。
reference_data
Object
可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。
reference_data.input_data
Object
输入数据源的说明,请参阅作业输入数据 规范。
reference_data.data_context
String
数据的上下文,它是指之前使用数据集的上下文
model_inputs
、training
、test
、validation
reference_data.data_column_names.target_column
Object
可选。 如果“rreference_data”是训练数据,则需要此属性来监视数据偏移的前 N 个特征。
reference_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset
和 reference_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start
和 reference_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
reference_data_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 reference_data.input_data.type
为 uri_folder
,则为必需项 ,请参阅预处理组件规范 。
features
Object
可选。 要为数据偏移监视的目标特征。 某些模型可能有数百或数千个特征,始终建议指定感兴趣的特征进行监视。
以下值之一:特征名称列表、features.top_n_feature_importance
或 all_features
如果 production_data.data_context
为 training
,则默认值为 features.top_n_feature_importance = 10
;否则,默认值为 all_features
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds
Object
监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled
为 true
时,用户将收到警报通知。
metric_thresholds.numerical
Object
可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。
允许的数字指标名称:jensen_shannon_distance
、normalized_wasserstein_distance
、population_stability_index
、two_sample_kolmogorov_smirnov_test
metric_thresholds.categorical
Object
可选。 “key:value”格式的指标和阈值列表,其中“key”是指标名称,“value”是阈值。
允许的分类指标名称:jensen_shannon_distance
、chi_squared_test
、population_stability_index
数据质量
数据质量信号通过比较训练数据或最近的过往生产数据来跟踪生产中的数据质量问题。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件
data_quality
data_quality
production_data
Object
可选。 要分析以监视信号的生产数据的说明。
production_data.input_data
Object
可选。 输入数据源的说明,请参阅作业输入数据 规范。
production_data.data_context
String
数据的上下文,它引用模型生产数据,可以是模型输入或模型输出
model_inputs
、model_outputs
production_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset
和 production_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start
和 production_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
production_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 production_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
reference_data
Object
可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。
reference_data.input_data
Object
输入数据源的说明,请参阅作业输入数据 规范。
reference_data.data_context
String
数据的上下文,它是指之前使用数据集的上下文
model_inputs
、model_outputs
、training
、test
、validation
reference_data.data_column_names.target_column
对象
可选。 如果“rreference_data”是训练数据,则需要此属性来监视数据偏移的前 N 个特征。
reference_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset
和 reference_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start
和 reference_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
reference_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 reference_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
features
Object
可选。 要为数据质量监视的目标特征。 某些模型可能具有数百或数千个特征。 始终建议指定感兴趣的特征进行监视。
以下值之一:特征名称列表、features.top_n_feature_importance
或 all_features
如果 reference_data.data_context
为 training
,则默认值为 features.top_n_feature_importance = 10
;否则,默认值为 all_features
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds
Object
监视信号的指标和阈值属性列表。 超过阈值且 alert_enabled
为 true
时,用户将收到警报通知。
metric_thresholds.numerical
Object
key:value
格式的指标和阈值的可选列表,其中 key
是指标名称,value
是阈值。
允许的数字指标名称:data_type_error_rate
、null_value_rate
、out_of_bounds_rate
metric_thresholds.categorical
Object
key:value
格式的指标和阈值的可选列表,其中 key
是指标名称,value
是阈值。
允许的分类指标名称:data_type_error_rate
、null_value_rate
、out_of_bounds_rate
特征归因偏移(预览版)
由于数据分布的变化、特征之间关系的变化或正在解决的基础问题的变化,模型的特征归因可能会随时间而改变。 特征归因偏移是当特征对预测输出的重要性或贡献随时间变化时,机器学习模型中发生的一种现象。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件
feature_attribution_drift
feature_attribution_drift
production_data
Array
可选;如果未提供,则默认为与 Azure 机器学习终结点关联的收集的数据。 production_data
是数据集及其关联的元数据的列表,它必须包括模型输入和模型输出数据。 它可以是具有模型输入和输出的单个数据集,也可以是包含一个模型输入和一个模型输出的两个单独的数据集。
production_data.input_data
Object
可选。 输入数据源的说明,请参阅作业输入数据 规范。
production_data.input_data.data_column_names
Object
key:value
格式的关联列名和预测列名,它们是数据联接所必需的。
允许的键包括:correlation_id
、target_column
production_data.data_context
字符串
数据的上下文。 它指的是生产模型输入数据。
model_inputs
、model_outputs
、model_inputs_outputs
production_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset
和 production_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start
和 production_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
production_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 production_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
production_data.data_window_size
字符串
可选。 ISO8601 格式的数据窗口大小(以天为单位),例如 P7D
。 这是要为数据质量问题计算的生产数据窗口。
默认情况下,数据窗口大小为最后一个监视期。
reference_data
Object
可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。
reference_data.input_data
Object
输入数据源的说明,请参阅作业输入数据 规范。
reference_data.data_context
String
数据的上下文,它是指之前使用数据集的上下文。 对于特征属性偏移,仅允许 training
数据。
training
reference_data.data_column_names.target_column
字符串
必需。
reference_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset
和 reference_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start
和 reference_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
reference_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 reference_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds
Object
key:value
格式的特性属性偏移的指标名称和阈值,其中 key
是指标名称,value
是阈值。 超过阈值且 alert_enabled
处于打开状态时,用户将收到警报通知。
允许的指标名称:normalized_discounted_cumulative_gain
自定义监视信号
通过自定义 Azure 机器学习组件自定义监视信号。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件。
custom
custom
component_id
字符串
必需。 与你的自定义信号相对应的 Azure 机器学习组件 ID。 例如 azureml:mycustomcomponent:1
input_data
Object
可选。 监视信号要分析的输入数据的说明,请参阅作业输入数据 规范。
input_data.<data_name>.data_context
字符串
数据的上下文,它引用模型生产数据,可以是模型输入或模型输出
model_inputs
input_data.<data_name>.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 input_data.<data_name>.data_window.lookback_window_offset
和 input_data.<data_name>.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 input_data.<data_name>.data_window.window_start
和 input_data.<data_name>.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
input_data.<data_name>.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 input_data.<data_name>.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds.metric_name
Object
自定义指标的名称。
threshold
Object
自定义指标的可接受阈值。
模型性能跟踪生产中模型输出的客观性能的方式是将其与收集的地面实况数据进行比较。
密钥
类型
说明
允许的值
默认值
type
String
“必需”。 监视信号的类型。 根据此处指定的 type
自动加载预生成的监视信号处理组件
model_performance
model_performance
production_data
Array
可选;如果未提供,则默认为与 Azure 机器学习终结点关联的收集的数据。 production_data
是数据集及其关联的元数据的列表,它必须包括模型输入和模型输出数据。 它可以是具有模型输入和输出的单个数据集,也可以是包含一个模型输入和一个模型输出的两个单独的数据集。
production_data.input_data
Object
可选。 输入数据源的说明,请参阅作业输入数据 规范。
production_data.input_data.data_column_names
Object
key:value
格式的关联列名和预测列名,它们是数据联接所必需的。
允许的键包括:correlation_id
、target_column
production_data.data_context
字符串
数据的上下文。 它指的是生产模型输入数据。
model_inputs
、model_outputs
、model_inputs_outputs
production_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 production_data.data_window.lookback_window_offset
和 production_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 production_data.data_window.window_start
和 production_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
production_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 production_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
production_data.data_window_size
字符串
可选。 ISO8601 格式的数据窗口大小(以天为单位),例如 P7D
。 这是要为数据质量问题计算的生产数据窗口。
默认情况下,数据窗口大小为最后一个监视期。
reference_data
Object
可选。 如果未指定,则最近的以往生产数据将用作比较基线数据。 建议使用训练数据作为比较基线。
reference_data.input_data
Object
输入数据源的说明,请参阅作业输入数据 规范。
reference_data.data_context
String
数据的上下文,它是指之前使用数据集的上下文。 对于特征属性偏移,仅允许 training
数据。
training
reference_data.data_column_names.target_column
字符串
必需。
reference_data.data_window
Object
可选。 要用作比较基线数据的引用数据的数据窗口。
仅允许滚动数据窗口或固定数据窗口。 若要使用滚动数据窗口,请指定 reference_data.data_window.lookback_window_offset
和 reference_data.data_window.lookback_window_size
属性。 若要使用固定数据窗口,请指定 reference_data.data_window.window_start
和 reference_data.data_window.window_end
属性。 所有属性值都必须采用 ISO8601 格式。
reference_data.pre_processing_component
字符串
已注册组件的组件 ID(采用 azureml:myPreprocessing@latest
格式)。 如果 reference_data.input_data.type
为 uri_folder
,则为必需项,请参阅预处理组件规范 。
alert_enabled
布尔
打开/关闭监视信号的警报通知。 True
或 False
metric_thresholds.classification
Object
key:value
格式的指标和阈值的可选列表,其中 key
是指标名称,value
是阈值。
允许的 classification
指标名称:accuracy
、precision
、recall
metric_thresholds.regression
Object
key:value
格式的指标和阈值的可选列表,其中 key
是指标名称,value
是阈值。
允许的 regression
指标名称:mae
、mse
、rmse
az ml schedule
命令可用于管理 Azure 机器学习模型。
示例
示例 GitHub 存储库 中提供了监视 CLI 示例。 一些指标和阈值如下:
YAML:现成的监视器
适用于:Azure CLI ml 扩展 v2(当前)
# out-of-box-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: credit_default_model_monitoring
display_name: Credit default model monitoring
description: Credit default model monitoring setup with minimal configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute: # specify a spark compute for monitoring job
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification # model task type: [classification, regression, question_answering]
endpoint_deployment_id: azureml:credit-default:main # azureml endpoint deployment id
alert_notification: # emails to get alerts
emails:
- abc@example.com
- def@example.com
YAML:高级监视器
适用于:Azure CLI ml 扩展 v2(当前)
# advanced-model-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with advanced configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute:
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification
endpoint_deployment_id: azureml:credit-default:main
monitoring_signals:
advanced_data_drift: # monitoring signal name, any user defined name works
type: data_drift
# reference_dataset is optional. By default referece_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1 # use training data as comparison reference dataset
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
features:
top_n_feature_importance: 10 # monitor drift for top 10 features
metric_thresholds:
numerical:
jensen_shannon_distance: 0.01
categorical:
pearsons_chi_squared_test: 0.02
advanced_data_quality:
type: data_quality
# reference_dataset is optional. By default reference_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
features: # monitor data quality for 3 individual features only
- SEX
- EDUCATION
metric_thresholds:
numerical:
null_value_rate: 0.05
categorical:
out_of_bounds_rate: 0.03
feature_attribution_drift_signal:
type: feature_attribution_drift
# production_data: is not required input here
# Please ensure Azure Machine Learning online endpoint is enabled to collected both model_inputs and model_outputs data
# Azure Machine Learning model monitoring will automatically join both model_inputs and model_outputs data and used it for computation
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
metric_thresholds:
normalized_discounted_cumulative_gain: 0.9
alert_notification:
emails:
- abc@example.com
- def@example.com
附录
时区
当前计划支持以下时区。 键可直接在 Python SDK 中使用,而值可在 YAML 作业中使用。 下表按 UTC(协调世界时)进行整理。
UTC
密钥
值
UTC -12:00
DATELINE_STANDARD_TIME
“国际日期变更线标准时间”
UTC -11:00
UTC_11
“UTC-11”
UTC - 10:00
ALEUTIAN_STANDARD_TIME
阿留申群岛标准时间
UTC - 10:00
HAWAIIAN_STANDARD_TIME
“夏威夷标准时间”
UTC -09:30
MARQUESAS_STANDARD_TIME
“马克萨斯标准时间”
UTC -09:00
ALASKAN_STANDARD_TIME
“阿拉斯加标准时间”
UTC -09:00
UTC_09
“UTC-09”
UTC -08:00
PACIFIC_STANDARD_TIME_MEXICO
“太平洋标准时间(墨西哥)”
UTC -08:00
UTC_08
“UTC-08”
UTC -08:00
PACIFIC_STANDARD_TIME
“太平洋标准时间”
UTC -07:00
US_MOUNTAIN_STANDARD_TIME
“美国山地标准时间”
UTC -07:00
MOUNTAIN_STANDARD_TIME_MEXICO
“山地标准时间(墨西哥)”
UTC -07:00
MOUNTAIN_STANDARD_TIME
“山地标准时间”
UTC -06:00
CENTRAL_AMERICA_STANDARD_TIME
“中美洲标准时间”
UTC -06:00
CENTRAL_STANDARD_TIME
“中部标准时间”
UTC -06:00
EASTER_ISLAND_STANDARD_TIME
“复活节岛标准时间”
UTC -06:00
CENTRAL_STANDARD_TIME_MEXICO
“中部标准时间(墨西哥)”
UTC -06:00
CANADA_CENTRAL_STANDARD_TIME
“加拿大中部标准时间”
UTC -05:00
SA_PACIFIC_STANDARD_TIME
“南美洲太平洋标准时间”
UTC -05:00
EASTERN_STANDARD_TIME_MEXICO
“东部标准时间(墨西哥)”
UTC -05:00
EASTERN_STANDARD_TIME
“东部标准时间”
UTC -05:00
HAITI_STANDARD_TIME
“海地标准时间”
UTC -05:00
CUBA_STANDARD_TIME
“古巴标准时间”
UTC -05:00
US_EASTERN_STANDARD_TIME
“美国东部标准时间”
UTC -05:00
TURKS_AND_CAICOS_STANDARD_TIME
“特克斯和凯科斯群岛标准时间”
UTC -04:00
PARAGUAY_STANDARD_TIME
“巴拉圭标准时间”
UTC -04:00
ATLANTIC_STANDARD_TIME
“大西洋标准时间”
UTC -04:00
VENEZUELA_STANDARD_TIME
“委内瑞拉标准时间”
UTC -04:00
CENTRAL_BRAZILIAN_STANDARD_TIME
“巴西中部标准时间”
UTC -04:00
SA_WESTERN_STANDARD_TIME
“南美洲西部标准时间”
UTC -04:00
PACIFIC_SA_STANDARD_TIME
“太平洋南美洲标准时间”
UTC -03:30
NEWFOUNDLAND_STANDARD_TIME
“纽芬兰标准时间”
UTC -03:00
TOCANTINS_STANDARD_TIME
“托坎廷斯标准时间”
UTC -03:00
E_SOUTH_AMERICAN_STANDARD_TIME
“E. 南美洲标准时间”
UTC -03:00
SA_EASTERN_STANDARD_TIME
“南美洲东部标准时间”
UTC -03:00
ARGENTINA_STANDARD_TIME
“阿根廷标准时间”
UTC -03:00
GREENLAND_STANDARD_TIME
“格陵兰标准时间”
UTC -03:00
MONTEVIDEO_STANDARD_TIME
“蒙得维的亚标准时间”
UTC -03:00
SAINT_PIERRE_STANDARD_TIME
“圣皮埃尔标准时间”
UTC -03:00
BAHIA_STANDARD_TIM
“巴伊亚标准时间”
UTC -02:00
UTC_02
“UTC-02”
UTC -02:00
MID_ATLANTIC_STANDARD_TIME
“中大西洋标准时间”
UTC -01:00
AZORES_STANDARD_TIME
“亚速尔群岛标准时间”
UTC -01:00
CAPE_VERDE_STANDARD_TIME
“佛得角群岛标准时间”
UTC
UTC
UTC
UTC +00:00
GMT_STANDARD_TIME
“GMT 标准时间”
UTC +00:00
GREENWICH_STANDARD_TIME
“格林威治标准时间”
UTC +01:00
MOROCCO_STANDARD_TIME
“摩洛哥标准时间”
UTC +01:00
W_EUROPE_STANDARD_TIME
“西 欧标准时间”
UTC +01:00
CENTRAL_EUROPE_STANDARD_TIME
“中欧标准时间”
UTC +01:00
ROMANCE_STANDARD_TIME
“罗马标准时间”
UTC +01:00
CENTRAL_EUROPEAN_STANDARD_TIME
“中欧标准时间”
UTC +01:00
W_CENTRAL_AFRICA_STANDARD_TIME
“中非 西部标准时间”
UTC +02:00
NAMIBIA_STANDARD_TIME
“纳米比亚标准时间”
UTC +02:00
JORDAN_STANDARD_TIME
“约旦标准时间”
UTC +02:00
GTB_STANDARD_TIME
“GTB 标准时间”
UTC +02:00
MIDDLE_EAST_STANDARD_TIME
“中东标准时间”
UTC +02:00
EGYPT_STANDARD_TIME
“埃及标准时间”
UTC +02:00
E_EUROPE_STANDARD_TIME
“E. 欧标准时间”
UTC +02:00
SYRIA_STANDARD_TIME
“叙利亚标准时间”
UTC +02:00
WEST_BANK_STANDARD_TIME
“西岸标准时间”
UTC +02:00
SOUTH_AFRICA_STANDARD_TIME
“南非标准时间”
UTC +02:00
FLE_STANDARD_TIME
“FLE 标准时间”
UTC +02:00
ISRAEL_STANDARD_TIME
“以色列标准时间”
UTC +02:00
KALININGRAD_STANDARD_TIME
“加里宁格勒标准时间”
UTC +02:00
LIBYA_STANDARD_TIME
“利比亚标准时间”
UTC +03:00
TÜRKIYE_STANDARD_TIME
“土耳其标准时间”
UTC +03:00
ARABIC_STANDARD_TIME
“阿拉伯标准时间”
UTC +03:00
ARAB_STANDARD_TIME
“阿拉伯标准时间”
UTC +03:00
BELARUS_STANDARD_TIME
“白俄罗斯标准时间”
UTC +03:00
RUSSIAN_STANDARD_TIME
“俄罗斯标准时间”
UTC +03:00
E_AFRICA_STANDARD_TIME
“E. 非标准时间”
UTC +03:30
IRAN_STANDARD_TIME
“伊朗标准时间”
UTC +04:00
ARABIAN_STANDARD_TIME
“阿拉伯半岛标准时间”
UTC +04:00
ASTRAKHAN_STANDARD_TIME
“阿斯特拉罕标准时间”
UTC +04:00
AZERBAIJAN_STANDARD_TIME
“阿塞拜疆标准时间”
UTC +04:00
RUSSIA_TIME_ZONE_3
“俄罗斯时区 3”
UTC +04:00
MAURITIUS_STANDARD_TIME
“毛里求斯标准时间”
UTC +04:00
GEORGIAN_STANDARD_TIME
“格鲁吉亚标准时间”
UTC +04:00
CAUCASUS_STANDARD_TIME
“高加索标准时间”
UTC +04:30
AFGHANISTAN_STANDARD_TIME
“阿富汗标准时间”
UTC +05:00
WEST_ASIA_STANDARD_TIME
“西亚标准时间”
UTC +05:00
EKATERINBURG_STANDARD_TIME
“叶卡捷琳堡标准时间”
UTC +05:00
PAKISTAN_STANDARD_TIME
“巴基斯坦标准时间”
UTC +05:30
INDIA_STANDARD_TIME
“印度标准时间”
UTC +05:30
SRI_LANKA_STANDARD_TIME
“斯里兰卡标准时间”
UTC +05:45
NEPAL_STANDARD_TIME
“尼泊尔标准时间”
UTC +06:00
CENTRAL_ASIA_STANDARD_TIME
“中亚北部标准时间”
UTC +06:00
BANGLADESH_STANDARD_TIME
“孟加拉标准时间”
UTC +06:30
MYANMAR_STANDARD_TIME
“缅甸标准时间”
UTC +07:00
N_CENTRAL_ASIA_STANDARD_TIME
“中亚 北部标准时间”
UTC +07:00
SE_ASIA_STANDARD_TIME
“东南亚标准时间”
UTC +07:00
ALTAI_STANDARD_TIME
“阿尔泰标准时间”
UTC +07:00
W_MONGOLIA_STANDARD_TIME
“西 蒙古标准时间”
UTC +07:00
NORTH_ASIA_STANDARD_TIME
“北亚标准时间”
UTC +07:00
TOMSK_STANDARD_TIME
“托木斯克标准时间”
UTC +08:00
CHINA_STANDARD_TIME
“中国标准时间”
UTC +08:00
NORTH_ASIA_EAST_STANDARD_TIME
“北亚东部标准时间”
UTC +08:00
SINGAPORE_STANDARD_TIME
“新加坡标准时间”
UTC +08:00
W_AUSTRALIA_STANDARD_TIME
“澳大利亚 西部标准时间”
UTC +08:00
TAIPEI_STANDARD_TIME
“台北标准时间”
UTC +08:00
ULAANBAATAR_STANDARD_TIME
“乌兰巴托标准时间”
UTC +08:45
AUS_CENTRAL_W_STANDARD_TIME
“澳大利亚中西部标准时间”
UTC +09:00
NORTH_KOREA_STANDARD_TIME
“朝鲜标准时间”
UTC +09:00
TRANSBAIKAL_STANDARD_TIME
“外贝加尔标准时间”
UTC +09:00
TOKYO_STANDARD_TIME
“东京标准时间”
UTC +09:00
KOREA_STANDARD_TIME
“韩国标准时间”
UTC +09:00
YAKUTSK_STANDARD_TIME
“雅库茨克标准时间”
UTC +09:30
CEN_AUSTRALIA_STANDARD_TIME
“中部 澳大利亚标准时间”
UTC +09:30
AUS_CENTRAL_STANDARD_TIME
“澳大利亚中部标准时间”
UTC +10:00
E_AUSTRALIAN_STANDARD_TIME
“E. 澳大利亚标准时间”
UTC +10:00
AUS_EASTERN_STANDARD_TIME
“澳大利亚东部标准时间”
UTC +10:00
WEST_PACIFIC_STANDARD_TIME
“太平洋西部标准时间”
UTC +10:00
TASMANIA_STANDARD_TIME
“塔斯马尼亚岛标准时间”
UTC +10:00
VLADIVOSTOK_STANDARD_TIME
“符拉迪沃斯托克标准时间”
UTC +10:30
LORD_HOWE_STANDARD_TIME
“豪勋爵岛标准时间”
UTC +11:00
BOUGAINVILLE_STANDARD_TIME
“布干维尔标准时间”
UTC +11:00
RUSSIA_TIME_ZONE_10
“俄罗斯时区 10”
UTC +11:00
MAGADAN_STANDARD_TIME
“马加丹标准时间”
UTC +11:00
NORFOLK_STANDARD_TIME
“诺福克标准时间”
UTC +11:00
SAKHALIN_STANDARD_TIME
“萨哈林标准时间”
UTC +11:00
CENTRAL_PACIFIC_STANDARD_TIME
“太平洋中部标准时间”
UTC +12:00
RUSSIA_TIME_ZONE_11
“俄罗斯时区 11”
UTC +12:00
NEW_ZEALAND_STANDARD_TIME
“新西兰标准时间”
UTC +12:00
UTC_12
“UTC+12”
UTC +12:00
FIJI_STANDARD_TIME
“斐济标准时间”
UTC +12:00
KAMCHATKA_STANDARD_TIME
“勘察加标准时间”
UTC +12:45
CHATHAM_ISLANDS_STANDARD_TIME
“查塔姆群岛标准时间”
UTC +13:00
TONGA__STANDARD_TIME
“汤加标准时间”
UTC +13:00
SAMOA_STANDARD_TIME
“萨摩亚标准时间”
UTC +14:00
LINE_ISLANDS_STANDARD_TIME
“来恩群岛标准时间”