对话语言理解中使用的术语和定义

项目
2024-12-02

使用本文了解你在使用对话语言理解时可能遇到的一些定义和术语。

实体

实体是言语中的字词，描述用于实现或识别意向的信息。如果实体很复杂，并且你希望模型标识特定的部分，可将模型分解为子实体。例如，你可能希望模型预测某个地址，但同时预测街道、城市、州和邮政编码等子实体。

F1 分数

F1 分数是精准率和召回率的函数。在精准率和召回率之间进行平衡时，需要用到它。

Intent

意向表示用户想执行的任务或操作。用户输入的内容中所表达的目的或目标，比如预订航班或支付帐单。

列表实体

列表实体表示一组固定、封闭的相关字词及其同义词。与机器学习实体不同，列表实体是精确匹配项。

如果列表实体中的某个字词包含在列表中，则可预测到该实体。例如，如果你有一个名为“大小”的列表实体，并且列表中包含字词“小、中、大”，则无论上下文如何，均可预测使用字词“小”、“中”或“大”的所有言语的大小实体。

型号

模型是经过训练来执行特定任务的对象，在此示例中为对话理解任务。通过提供标记数据来训练模型以供学习，以便以后可以使用这些模型来理解语句。

模型评估是一种在训练后立即进行的过程，可了解模型的性能情况。
部署指的是将模型分配到部署以便通过预测 API 使用它的过程。

过度拟合

若模型只关注特定示例而无法很好地实现通用，就会发生过度拟合。

Precision

度量模型的精确度/准确度。它是正确识别的正值（真正）与所有识别出的正值之间的比率。精准率指标指示正确标记了多少个预测类。

Project

项目是一个工作区，用于基于你的数据构建自定义 ML 模型。只有你和对所使用的 Azure 资源具有访问权限的其他人才能访问你的项目。

Recall

度量模型预测实际正类的能力。这是预测的真正值与实际标记的结果之间的比率。召回率指标显示正确的预测类的数量。

正则表达式

正则表达式实体表示正则表达式。正则表达式实体是完全匹配的。

架构

架构被定义为项目中意向和实体的组合。架构设计是项目成功的关键部分。创建架构时，需要考虑应在项目中包括哪些意向和实体。

训练数据

训练数据是训练模型所需的信息集。

话语

言语是用户输入，它是对话中一个句子的简短文本代表。言语是一条自然语言短语，例如“订 2 张下周二到西雅图的票”。通过添加实例言语来训练模型，模型在运行时对新言语进行预测

后续步骤

数据和服务限制。
对话语言理解概述。

通过