我在mysql中有一个包含60000项的数据集,我正在尝试将其插入到neo4j中。插入正在进行,但需要很长时间(大约每3秒10-15 )。有没有什么办法可以加快速度呢?还有,我有没有办法在neo4j中给出一些东西,比如唯一键,这样复制索引就不会被索引了?我是neo4j的新手。
我使用的是带有neo4j Everyman驱动程序的PHP1.8。
发布于 2012-12-04 00:49:38
Max De Marzi有一个很好的演示文稿,是关于ETL到Neo4j的。
请参阅:http://www.slideshare.net/maxdemarzi/etl-into-neo4j
这取决于你想要使用哪种语言,通过jruby嵌入的java和通过ruby、php、python远程嵌入的大量选项。
您可能希望在适当大小的事务中批处理您的请求(例如,每个tx有10k个项目)。
可以使用我的batch-importer或通过Neo4j服务器的BATCH REST API将CSV文件直接导入数据库文件。
发布于 2013-01-16 00:26:10
如上所述,首选选项是batch importer。
如果您需要使用PHP客户端,这里我提供了一个使用REST批处理api的示例:http://phpfiddle.org/main/code/mu3-sgk
您可以测试最适合您的系统的行/批。我的笔记本电脑是750,我的测试服务器是1250。发生的json_decode对CPU来说是沉重的负担。
https://stackoverflow.com/questions/13686850
复制相似问题