MoEMeta提出:通过MoE 元学习框架,在仅有少量训练样本的情况下进行知识图谱关系推理;平衡全局泛化(通过全局共享原型)和局部适应性(通过任务特定上下文)。
Slicing and Dicing表明:在大数据分析任务中,MoE 可以通过增加总参数来持续提升性能,而无需按比例增加计算成本;专注于专家数量和粒度,可以简化大数据分析模型的架构设计。