文章/答案/技术大牛

发布

社区首页 >问答首页 >Neo4j永无止境的缓慢节点创建

问Neo4j永无止境的缓慢节点创建
EN

Stack Overflow用户

提问于 2015-03-11 08:46:00

回答 1查看 132关注 0票数 0

具有格式的.csv文件中的数据集

"title"|year|"word"
"Into the Wild"|2007|"abandoned-bus"
"Into the Wild"|2007|"adolescence"
"Into the Wild"|2007|"adoption"

这个文件有超过400万行。

我有数据库运行在远程超级计算机上，我用ssh隧道连接.我创建了两个指数：

CREATE INDEX ON :MOVIE(title)
CREATE INDEX ON :KEYWORD(word)

然后执行查询：

USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:c:/Users/.../Data/rels.csv" AS csv
FIELDTERMINATOR '|'
MERGE (m:MOVIE {title:csv.title })
ON CREATE SET m.year = toInt(csv.year)
MERGE (k:KEYWORD {word:csv.word})

经过一段时间后，我不知道一个小时，有关查询执行的信息消失或出现一个未知的错误。但是当我进入localhost:7474/webadmin在统计中时，节点数的增长非常缓慢--大约10秒内有5-8个节点。

执行查询时：(我可以，因为没有显示正在运行的查询)

match (m)
return count(m)

大约有79K个节点。但数量正在增加超过21小时。我需要创建大约120万个节点，而不是在它们之间建立大约400万个关系。当我进行基本计算时，创建120万个节点将持续大约13天。我真的不想知道，要建立400万的恋爱关系会持续多久。

发生了什么事？怎么系好呢？我能做什么？，请帮忙。

注：

过去，我已经创建了电影和关键字的节点，它是从只包含电影或关键字的单独csv文件中创建的，没有使用定期提交，但手动选择了大约60K行并对其执行查询。但我删除了它们，使它在两个查询中，也与关系，没有工作的划分csv文件。无法想象手动将4M行文件划分为60K行文件。

performance

neo4j

spring-data-neo4j

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-03-12 08:12:15

我稍微改变了一下程序。

从只包含关键字(几毫秒)的关键字csv加载所有160 K关键字 USING PERIODIC COMMIT 1000 LOAD CSV WITH HEADERS FROM 'file:c:/.../kw.csv' as csv CREATE (:KEYWORD {word:csv.word})
加载所有200万电影从电影csv只包含电影标题和年份(几秒钟) USING PERIODIC COMMIT 1000 LOAD CSV WITH HEADERS FROM 'file:c:/.../mov.csv' as csv CREATE (:MOVIE {title:csv.title, year: toInt(csv.year)})
创建电影索引和关键字 CREATE INDEX ON :MOVIE(title) CREATE INDEX ON :MOVIE(year) CREATE INDEX ON :KEYWORD(word)
从csv加载包含电影标题、年份和关键字的关系(这需要几个小时，但速度相当快，可以看到webadmin界面的进展) USING PERIODIC COMMIT 1000 LOAD CSV WITH HEADERS FROM 'file:c:/.../rels.csv' as csv MATCH (m:MOVIE {title:csv.title, year: toInt(csv.year)}) MATCH (k:KEYWORD {word:csv.word}) MERGE (m)-[:HAS {weight:1}]->(k)

希望这能对将来的人有所帮助。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28981964

复制

相似问题

问Neo4j永无止境的缓慢节点创建
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Neo4j永无止境的缓慢节点创建EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Neo4j永无止境的缓慢节点创建
EN