对话语言理解中使用的术语和定义
使用本文了解你在使用对话语言理解时可能遇到的一些定义和术语。
实体
实体是言语中的字词,描述用于实现或识别意向的信息。 如果实体很复杂,并且你希望模型标识特定的部分,可将模型分解为子实体。 例如,你可能希望模型预测某个地址,但同时预测街道、城市、州和邮政编码等子实体。
F1 分数
F1 分数是精准率和召回率的函数。 在精准率和召回率之间进行平衡时,需要用到它。
Intent
意向表示用户想执行的任务或操作。 用户输入的内容中所表达的目的或目标,比如预订航班或支付帐单。
列表实体
列表实体表示一组固定、封闭的相关字词及其同义词。 与机器学习实体不同,列表实体是精确匹配项。
如果列表实体中的某个字词包含在列表中,则可预测到该实体。 例如,如果你有一个名为“大小”的列表实体,并且列表中包含字词“小、中、大”,则无论上下文如何,均可预测使用字词“小”、“中”或“大”的所有言语的大小实体。
型号
模型是经过训练来执行特定任务的对象,在此示例中为对话理解任务。 通过提供标记数据来训练模型以供学习,以便以后可以使用这些模型来理解语句。
- 模型评估是一种在训练后立即进行的过程,可了解模型的性能情况。
- 部署指的是将模型分配到部署以便通过预测 API 使用它的过程。
过度拟合
若模型只关注特定示例而无法很好地实现通用,就会发生过度拟合。
Precision
度量模型的精确度/准确度。 它是正确识别的正值(真正)与所有识别出的正值之间的比率。 精准率指标指示正确标记了多少个预测类。
Project
项目是一个工作区,用于基于你的数据构建自定义 ML 模型。 只有你和对所使用的 Azure 资源具有访问权限的其他人才能访问你的项目。
Recall
度量模型预测实际正类的能力。 这是预测的真正值与实际标记的结果之间的比率。 召回率指标显示正确的预测类的数量。
正则表达式
正则表达式实体表示正则表达式。 正则表达式实体是完全匹配的。
架构
架构被定义为项目中意向和实体的组合。 架构设计是项目成功的关键部分。 创建架构时,需要考虑应在项目中包括哪些意向和实体。
训练数据
训练数据是训练模型所需的信息集。
话语
言语是用户输入,它是对话中一个句子的简短文本代表。 言语是一条自然语言短语,例如“订 2 张下周二到西雅图的票”。 通过添加实例言语来训练模型,模型在运行时对新言语进行预测