11月,NVIDIA发布了HelpSteer,一个对齐微调数据集,根据几个标准提供提示、相关模型响应和所述答案的等级,而Microsoft Research发布了Orca-2模型,是一个在新的合成推理数据集上微调的
achieved the best tradeoff with 35.5% hallucination rate and low error rate, while models like LLAMA-2 and Orca