对话智能体泛化研究在线挑战启动

原创

用户11764306

发布于 2025-10-20 13:00:01

1240

某中心启动在线挑战赛推动对话智能体泛化研究

为促进任务型对话智能体在新场景中的泛化能力研究，某中心语音助手团队在EvalAI平台推出了对话人工智能挑战赛。作为基准参考，我们还发布了一套在七项挑战任务中五项达到领先水平的模型。

这项名为DialoGLUE的挑战旨在推动基于表示的迁移、领域自适应和样本高效任务学习技术发展。这些技术的进步将实现对话泛化能力，即训练完成某个任务的对话智能体能够轻松适应新任务。

当前扩展对话智能体功能所需的工作量通常与新增领域数量呈线性增长。我们认为部分原因在于对话研究社区缺乏标准化的数据集和评估方法。为支持DialoGLUE，我们发布了聚合七个公开对话数据集的标准数据集，统一了数据表示格式，可用于训练和评估单一对话模型。

数据集的标注涵盖四大自然语言理解任务：

DialoGLUE挑战提供两种评估设置：

该挑战采用滚动参与机制，参与者可随时提交模型，排行榜将实时更新。我们的基线模型在七项任务中的五项取得了领先结果，既证明了聚合数据集的价值，也为参与者设立了明确的基准目标。基线系统已公开提供。

图示：对话智能体的职责包括槽位追踪和状态跟踪，需确定用户在对话过程中的意图变化

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

登录后参与评论

0 条评论

热度