首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >大语言模型评估任务 中MC1、MC2、MC3 指标是什么

大语言模型评估任务 中MC1、MC2、MC3 指标是什么

作者头像
zhangjiqun
发布2025-08-07 08:29:40
发布2025-08-07 08:29:40
3940
举报
文章被收录于专栏:计算机工具计算机工具

大语言模型评估任务 中MC1、MC2、MC3 指标是什么

在学术研究尤其是大语言模型评估任务中,MC1、MC2、MC3通常指多项选择任务(Multiple Choice Task)的不同子任务或评估维度,具体定义需结合具体数据集或研究场景。

以事实性评估常用的基准为例(如TruthfulQA、MMLU等),这类任务常将问题设计为多项选择形式,而MC1、MC2、MC3可能分别对应:

  • MC1:单选项正确的基础多项选择任务(如“下列哪项表述正确?”);
  • MC2:涉及事实辨析的复杂选项任务(如包含相似事实干扰项);
  • MC3:跨领域或多步推理的多项选择任务(如结合常识与专业知识的综合判断)。

在学术研究尤其是模型评估任务中,MC 通常是 “Multiple Choice”(多项选择题)的缩写,指通过提供多个选项让模型选择正确答案的评估形式。

这里的 MC 应指代多项选择任务的评估指标(如准确率),表格中的数值可能对应模型在 MC 任务上的表现得分。之前提到的 MC1、MC2、MC3 则是该类任务下的具体子任务或不同难度 / 类型的细分场景。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-08-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 大语言模型评估任务 中MC1、MC2、MC3 指标是什么
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档