首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用GPT-3对长的文本进行总结

如何使用GPT-3对长的文本进行总结
EN

Data Science用户
提问于 2023-01-12 09:15:03
回答 1查看 6.5K关注 0票数 8

总结超过4096标记限制的长文本(例如播客文本)的最佳方法是什么?据我所知,我需要将文本分成几个部分进行总结,然后将结果连在一起并对这些结果进行总结。是否已经有一个流行的开源脚本来做到这一点?

我能正确理解GPT-3是最好的模式吗?我看过一些关于使用BERT进行采掘总结的文章,但是结果质量很低。

EN

回答 1

Data Science用户

回答已采纳

发布于 2023-01-17 04:53:40

是否已经有一个流行的开源脚本来做到这一点?

Python GPT指数 (麻省理工学院许可证)可以用GPT-3概括大型文档或文档集合。

来自文档

索引=GPTTreeIndex(文档) response = index.query("",mode=“汇总”)基于树的查询的“默认”模式是从图的顶部向下遍历到叶节点。为了更精确的总结目的,我们想要使用更高级的mode="summarize"。摘要查询可能类似于以下内容之一:

  • “这个文本集合的摘要是什么?”
  • “请给我总结一下X人在公司的经验。”

文档包括一个带有完整示例的笔记本:https://github.com/jerryjliu/gpt_索引/blob/主/示例/paul_格雷厄姆_论文/TestEssay.ipynb

另一个Python库:https://github.com/hwchase17/langchain (麻省理工学院许可证)。来自文档

代码语言:javascript
复制
from langchain.chains.summarize import load_summarize_chain
chain = load_summarize_chain(llm, chain_type="map_reduce")
chain.run(docs)

FYI {1,2}是两篇研究GPT-3性能以进行总结的伟大论文,但他们只看简短的文本。

更新2023-02-23:下一版本的GPT可能允许32k令牌:

参考文献:

票数 5
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/117716

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档