我是RDf新手,我正在寻找一个具有出色读取性能的开源RDF数据库。每秒大约有100亿次triples和100+ SPARQL查询。现在,我不需要同时读写数据库。
我已经看过维基百科(http://en.wikipedia.org/wiki/SPARQL#SPARQL_implementations)上的数据库,但我想要一些专家的建议,关于哪个是经过时间测试最多的系统。它应该有Apache许可或者同等许可的许可。
发布于 2013-03-16 20:03:52
Jena和Sesame可能是唯一符合您的许可标准的数据库,但它们都不能扩展到您需要的大小。使用TDB的Jena可能会,但我不确定在这种规模下性能会是什么样子。芝麻原生当然不是为这个规模而设计的。
还有其他开源数据库,但它们是GPLed,比如4store,这可能符合您的性能标准。但是最好的办法是使用商业数据库(大多数都有免费的评估版本);这是获得所需的规模和读取吞吐量的最好方法。但这意味着你可能不得不为某人的辛勤工作付钱,我知道。
https://stackoverflow.com/questions/15446746
复制相似问题