我有将近10000个XML (小)文件,我通过MLCP将它们放入MarkLogic中。在摄入的时候,我正在做一些转变,主要的转变是字典的更新。我正在从XML的输入更新字典。
我收到警告了。这一警告的意义和原因是什么?
WARN mapreduce.ContentWriter: XDMP-XDQPNOSESSIONMLCP正在非常缓慢地摄取文件。我认为这是因为字典的更新。是否有任何方法可以增强MLCP java堆内存,或者任何其他方法可以在ML服务器上快速摄取这些文档。
请建议一下。
发布于 2015-02-18 12:46:48
XDMP-XDQPNOSESSION的文档引用了一个影响MarkLogic 5.0-2及之前和4.2-9及之前的bug。如果您使用的是其中一个版本,那么修复方法似乎是通过它们进行升级。
您提到了基于XML元素的字典更新。MLCP在并行化输入方面做得很好,但是对于每个输入文档,您都要在字典文档上获取一个写锁。不确定你想用字典来完成什么,但也许你可以用一个词汇来代替。这将在插入文档时自动更新,而不需要对单个文件设置写锁。
https://stackoverflow.com/questions/28577288
复制相似问题