在伦敦大学学院计算机科学教授、某机构学者Emine Yilmaz看来,未来用户将通过对话与计算机交互来精确识别所需信息,而非滚动浏览冗长的结果列表。
多年来,Emine Yilmaz一直深度参与欧洲信息检索会议(ECIR)。她曾担任2020年会议的程序委员会联合主席和2017年的博士联盟联合主席,今年,她是评选会议时间检验奖获奖者的委员会成员。
她表示,最近注意到ECIR社区对对话式信息检索(即使用多轮对话来优化查询)的兴趣日益浓厚。
“对话式信息检索是一个正在慢慢兴起的领域。” Yilmaz说,“如何构建一个能与用户协同工作的交互式系统?又如何让这类系统具备潜在的主动性?我认为这些问题正变得越来越重要。”
在某机构,Yilmaz与Alexa Shopping团队合作,对话式信息检索是该团队的核心研究课题。传统的基于网页的搜索引擎通常会返回一个结果列表,用户只需从中选择最感兴趣的一两个。但很少有语音服务用户愿意听完10到20个结果的播报,因此,能够交互式地优化查询变得至关重要。
Yilmaz解释说,短期内,“主要焦点是预测用户满意度。我们观察用户与Alexa的互动,看行为如何演变。基于此,我们尝试检测或预测用户交互是否令人满意。”
尝试预测用户满意度的原因之一是,语音交互产生的数据比基于网页的交互少。点击传统搜索引擎返回的20个结果中的两个链接,不仅传达了关于这两个链接的信息,也隐含了对其余18个链接的反馈。而如果基于语音的查询只返回一个结果,用户决定是否与该结果互动所能提供的信息量就少得多。预测用户对未接触到的查询结果的满意度有助于填补这些信息空白。
探索、利用、评估
但Yilmaz解释说,预测用户满意度还有其他用途。“假设你正在Beta测试一项新功能,你必须决定是否向用户展示它,”她说,“这里存在一个两难境地。你不想把它展示给太多用户,因为它可能是个不好的功能,你不想影响用户满意度和用户体验。另一方面,你需要把它展示给足够多的用户,以获得对其质量的可靠评估。所以,你应该把它展示给一个有针对性的一小部分用户,并理想地通过使用非常有限的数据集来识别用户是否会对其满意。”
Yilmaz解释道,预测用户满意度也有助于评估对话式信息检索系统。“作为用户,你不会想到评估这类系统的重要性,”她说,“但归根结底,如果你的目标是构建一个更好的对话式信息检索系统,你需要能够量化‘更好的系统’意味着什么。目前,还没有一个与用户满意度高度相关、专门为对话式信息检索设计、可供人们优化的良好指标。”
当然,最终目标是构建一个更好的对话式信息检索系统。
“我认为这就是该领域的发展方向,”Yilmaz说,“系统会根据其对用户需求的理解,尽其所能地提供服务,并且在不确定时提出问题。” 在信息检索领域,Yilmaz说,“有很多关于系统如何提出澄清问题以改善其可提供支持的研究。也有关于系统如何在响应用户的同时提供解释的研究。模型可能会说,‘我推荐这家餐厅是因为我认为你喜欢川菜。’用户可能会说,‘嗯,我现在不想吃川菜,我想吃意大利面。’在过去的几年里,大量研究致力于构建这样的系统,但我们仍处于非常初期的阶段。”FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。