我正在对三个索引引擎(MeiliSearch - Apache Solr - ElasticSearch)进行技术研究,当我在这三个引擎中索引时,我有一个不同的行为,MeiliSearch仅索引50,000个文档中的1,017个,Apache Solr仅索引800个文档,而Elastic不表示任何东西。你能帮我了解一下发生了什么吗,并建议一些解决方案,比如更改配置或其他什么。
我知道这可能是由于资源消耗,所以请毫不犹豫地建议硬件配置,这些配置必须用于索引这50,000个PDF文档。
提前谢谢你。
发布于 2021-03-04 18:16:52
这个问题的解决方案是因为一个库(Debenu),它在解析大量文档(50000个文档)时崩溃,所以要小心使用哪个解析库,在我的例子中,我已经将它改为另一个名为spatie-pdf- to -text的解析库。
https://stackoverflow.com/questions/65776403
复制相似问题