我正在用Java编写我自己的文件管理系统 (可用的那些不能满足我的需求)。
这些文件应由合格的DublinCore元数据标准描述。在我看来,最简单的方法是使用XML表示将RDF模型中的键值对打包起来。
为了存储所有文档的元数据,我有两个想法(文档文件将存储在文件系统中):
由于(许多)文件相互连接,第一种方法可能更适合分析数据,但第二种方法可能要快得多。
你推荐哪种解决方案?还是有更好的解决方案?
斯特凡
发布于 2011-01-12 18:38:37
我不知道您的分析是如何工作的,但是如果您需要内存中的完整图来进行分析,那么就使用variante 1(将所有文档的所有元数据存储在一个XML文件中),因为在这个场景中,您将不会从variante 2中获得任何收益(但只是额外的工作)。
添加了
如果变体2的额外工作不多,那么我就重新编写变体2,因为它可以更可调节。
发布于 2011-01-12 18:39:10
你考虑过使用MongoDB和GridFS吗?http://www.mongodb.org/display/DOCS/GridFS+Specification
您可以将文档直接以二进制形式存储在MongoDB中,甚至可以以任何您想要的格式存储该特定文件的相关元数据。即使文档具有相同的名称,它也能够存储文档,并且它将生成自己的唯一ID。
发布于 2011-01-12 18:43:33
顺便说一句:即使它不属于你的问题:看看JCR ()实现,比如JackRabbit。您可以使用它来存储文档,也可以存储元数据。
https://stackoverflow.com/questions/4672536
复制相似问题