对话语言理解中使用的术语和定义

使用本文了解你在使用对话语言理解时可能遇到的一些定义和术语。

实体

实体是言语中的字词,描述用于实现或识别意向的信息。 如果实体很复杂,并且你希望模型标识特定的部分,可将模型分解为子实体。 例如,你可能希望模型预测某个地址,但同时预测街道、城市、州和邮政编码等子实体。

F1 分数

F1 分数是精准率和召回率的函数。 在精准率召回率之间进行平衡时,需要用到它。

Intent

意向表示用户想执行的任务或操作。 用户输入的内容中所表达的目的或目标,比如预订航班或支付帐单。

列表实体

列表实体表示一组固定、封闭的相关字词及其同义词。 与机器学习实体不同,列表实体是精确匹配项。

如果列表实体中的某个字词包含在列表中,则可预测到该实体。 例如,如果你有一个名为“大小”的列表实体,并且列表中包含字词“小、中、大”,则无论上下文如何,均可预测使用字词“小”、“中”或“大”的所有言语的大小实体。

型号

模型是经过训练来执行特定任务的对象,在此示例中为对话理解任务。 通过提供标记数据来训练模型以供学习,以便以后可以使用这些模型来理解语句。

  • 模型评估是一种在训练后立即进行的过程,可了解模型的性能情况。
  • 部署指的是将模型分配到部署以便通过预测 API 使用它的过程。

过度拟合

若模型只关注特定示例而无法很好地实现通用,就会发生过度拟合。

Precision

度量模型的精确度/准确度。 它是正确识别的正值(真正)与所有识别出的正值之间的比率。 精准率指标指示正确标记了多少个预测类。

Project

项目是一个工作区,用于基于你的数据构建自定义 ML 模型。 只有你和对所使用的 Azure 资源具有访问权限的其他人才能访问你的项目。

Recall

度量模型预测实际正类的能力。 这是预测的真正值与实际标记的结果之间的比率。 召回率指标显示正确的预测类的数量。

正则表达式

正则表达式实体表示正则表达式。 正则表达式实体是完全匹配的。

架构

架构被定义为项目中意向和实体的组合。 架构设计是项目成功的关键部分。 创建架构时,需要考虑应在项目中包括哪些意向和实体。

训练数据

训练数据是训练模型所需的信息集。

话语

言语是用户输入,它是对话中一个句子的简短文本代表。 言语是一条自然语言短语,例如“订 2 张下周二到西雅图的票”。 通过添加实例言语来训练模型,模型在运行时对新言语进行预测

后续步骤