首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >faq机器人的gpt-3微调

faq机器人的gpt-3微调
EN

Stack Overflow用户
提问于 2022-12-04 20:14:04
回答 1查看 14关注 0票数 -2

我想了解一下gpt-3的微调原理。

我想构建一个基于这个数据https://www.hamburg.de/contentblob/16038508/680281fe853523c4a66199077247d0ce/data/faq.pdf的聊天机器人。

为此,我将数据以JSON格式(只有一项)放置,但您可以理解

代码语言:javascript
复制
{"prompt":"Was ist die Grundsteuer ->","completion":" Die Grundsteuer ist eine Objektsteuer, die ohne Berücksichtigung der persönlichen Verhältnisse und der subjektiven Leistungsfähigkeit des Steuerschuldners an den Grundbesitz anknüpft. Das Aufkommen an Grundsteuer steht in voller Höhe Hamburg (als Gemeinde) zu.\n"}

在这次测试中,我总共有70对左右的问答对。但是,精调模型的性能比默认的DaVinci差。

我现在有三个问题:

我如何监控/审查或验证fine-tuning?

  • is 70问题答案对的成功与否,而无法看到任何结果?
  1. 是否有必要以某种方式增加数据,将问题答案对重新定义几次以获得更多的培训数据?

谢谢你的建议!

EN

回答 1

Stack Overflow用户

发布于 2022-12-04 20:18:42

总的来说,这个问题太模糊了,缺乏必要的细节,不能被认为是很适合的--更多的是基于意见的。

但这是我的"3“美分:)

  1. 为了监控微调的成功,你可以在一个被搁置的测试集上评估模型。这个测试集应该由模型在培训期间没有看到的示例组成,这样您就可以看到模型能够很好地推广到新的数据。要评估模型,可以使用诸如准确性、精确性和召回性等指标。

  1. 70问答对可能不足以从微调中看到显着的改进,特别是如果数据不是很多样化或代表您想要执行的任务。一般来说,在微调语言模型时尽可能多地使用高质量的培训数据是个好主意。

  1. 通过几次对问题回答对的重新措辞来增强数据,可能有助于提高精调模型的性能。这是因为它将增加培训数据的数量和多样性,这可以帮助模型学习您要执行的任务的更健壮的表示。但是,重要的是要确保增强后的数据仍然是高质量的,并且准确地反映您要执行的任务。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74680520

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档