“导出数据”组件
本文介绍 Azure 机器学习设计器中的一个组件。
使用此组件将结果、中间数据和工作数据从管道保存到云存储目标中。
此组件支持将数据导出到以下云数据服务:
- Azure Blob 容器
- Azure 文件共享
- Azure Data Lake Storage Gen1
- Azure Data Lake Storage Gen2
- Azure SQL 数据库
导出数据之前,首先需要在 Azure 机器学习工作区中注册数据存储。 有关详细信息,请参阅访问 Azure 存储服务中的数据。
如何配置“导出数据”
在设计器中将“导出数据”组件添加到管道。 可以在“输入和输出”类别中找到此组件。
将“导出数据”连接到包含要导出的数据的组件。
选择“导出数据”,打开“属性”窗格 。
对于“数据存储”,请从下拉列表中选择现有数据存储。 还可以创建新的数据存储。 通过访问访问 Azure 存储服务中的数据来查看方法。
注意
不支持将某种数据类型的数据导出到指定为另一种数据类型的 SQL 数据库列。 目标表不需要先存在。
“重新生成输出”复选框决定是否在运行时执行组件以重新生成输出。
它默认处于未选中状态,这意味着,如果先前已使用相同的参数执行了该组件,系统会重复使用上次运行的输出以缩短运行时间。
如果选择它,系统会再次执行组件以重新生成输出。
在数据存储中定义数据所在的路径。 该路径是相对路径。以
data/testoutput
为例,它表示“导出数据”的输入数据将导出到你在该组件的“输出设置”中设定的数据存储的data/testoutput
中。注意
不允许使用空路径或 URL 路径。
对于“文件格式”,请选择数据的存储格式。
提交管道。
限制
由于存在数据存储访问限制,如果你的推理管道包含“导出数据”组件,它将在部署到实时终结点时被自动删除。
后续步骤
请参阅 Azure 机器学习可用的组件集。