论文链接:https://arxiv.org/abs/2305.15334 研究人员使用LLaMA-7 B基础模型,并对来自Torch Hub、TensorFlow Hub和HuggingFace的1645
PandaLM由LLaMA-7 B[136]调优得到,利用大语言模型的泛化能力,能够通过对指令的设计更好地抓住不同生成任务上对评测需求的微妙差异,如简洁性、清晰度、全面性、正式性等。