多语言项目
对话语言理解使你能够轻松地将项目一次扩展到多种语言。 在项目中启用多种语言时,可以在项目中添加特定于某种语言的语句和同义词。 你可以获取针对意向和实体的多语言预测。
多语言意向和已学习的实体组件
在项目中启用多种语言时,可以主要使用一种语言训练该项目,然后直接获取其他语言的预测。
例如,可以完全使用英语语句训练项目,然后使用法语、德语、普通话、日语、韩语等语言进行查询。 通过对话语言理解,你可以轻松使用多语言技术训练模型,将项目扩展为多种语言。
当发现特定语言的表现不如其他语言时,可以在项目中添加该语言的语句。 在 Language Studio 的标记语句页中,可以选择要添加的语句的语言。 向模型引入该语言的示例时,模型将会引入该语言的更多语法,并学习更好地进行预测。
不需要为每种语言添加相同数量的语句。 你应该使用一种语言构建项目中的绝大部分,然后仅为你发现表现不佳的语言添加一些语句。 如果创建一个以英语为主要语言的项目,然后开始使用法语、德语和西班牙语进行测试,你可能会发现德语的表现不如另外两种语言。 在这种情况下,请考虑在原始英语示例中添加 5% 的德语内容,训练新模型,然后再次使用德语进行测试。 对于德语查询,应会看到更好的结果。 添加的语句越多,结果可能越好。
以另一种语言添加数据时,不应期望数据对其他语言产生负面影响。
以多种语言列出和预生成的组件
启用了多种语言的项目将允许你为每个列表键指定每种语言的同义词。 根据查询项目时使用的语言,你只会获得具有该语言同义词的列表组件的匹配项。 查询项目时,可以在请求正文中指定语言:
"query": "{query}"
"language": "{language code}"
如果未提供语言,它将回退到项目的默认语言。 有关不同语言代码的列表,请参阅语言支持。
预生成组件与此类似,你应预期会获得以特定语言提供的预生成组件的预测。 请求的语言再次确定正在尝试预测的组件。 如需了解每个预生成组件的语言支持,请参阅支持的预生成实体组件。