部署模型进行批量推理和预测

本文介绍了 Databricks 建议用于批量和流式推理的内容。

使用 ai_query 进行批量推理

重要

此功能目前以公共预览版提供。

Databricks 建议将 ai_query 与模型服务结合使用以进行批量推理。 ai_query 是一个内置的 Databricks SQL 函数,可用于使用 SQL 查询现有模型服务终结点。 经验证,它能够在数十亿个令牌范围内可靠且一致地处理数据集。

为了快速试验,ai_query 可以与按令牌付费端点一起使用,因为这些端点已在你的工作区上预先配置。

当准备对大型或生产数据运行批量推理时,Databricks 建议使用预配的吞吐量端点来提高性能。