首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ManifoldCF和Postgresql将抓取150万个文档

ManifoldCF和Postgresql将抓取150万个文档
EN

Stack Overflow用户
提问于 2019-02-08 19:02:00
回答 1查看 93关注 0票数 0

我们使用ManifoldCF和PostgreSQL9.6来抓取我们的网站。在500.000个文档之前,爬行的速度很好(大约为20.000个文档/小时)。在性能下降之后,我们可以看到爬行的长时间冻结(非常长)。我们怀疑postgresql重新构建了内部链接表的索引。有没有可能禁止这样做?通过postgresql的设置?

谢谢你,丹

EN

回答 1

Stack Overflow用户

发布于 2019-06-20 23:46:27

您使用的MCF版本是什么?尝试最新版本: 2.13

大多数情况下,数据库会拖累性能。更好地调整PG会得到更好的结果

根据MCF指南:https://manifoldcf.apache.org/release/release-2.13/en_US/performance-tuning.html

你应该关闭PG自动清理,看看有没有帮助。

在调优过程中还有许多其他因素需要尝试。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54591027

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档