我将很快实现日志查看实用程序。但我坚持了DB的选择。我的要求如下:
我知道,如果我分割表,PostgreSQL就会工作。但是我能把这个表演写在上面吗。正如我所理解的,NoSQL是日志存储的更好选择,因为日志不是非常结构化的。我看到了下面这样的例子,使用hadoop-hbase:http://blog.mgm-tp.com/2010/03/hadoop-log-management-part1/似乎很有希望。
但在决定之前,我想问一下,以前是否有人做过这样的选择,并能给我一个主意。哪个DBMS最适合这个任务?
发布于 2012-11-19 09:05:29
我的日志非常结构化:)
我想说你不需要数据库,你需要搜索引擎:
@JustBob的更新:大多数提到的解决方案都可以使用影响性能的平面文件w/o。所有这些都需要倒排索引,这是最难建立或维护的部分。您可以以批处理模式或联机方式更新索引。索引可以存储在RDBMS、NoSQL或自定义“平面文件”存储格式中(由搜索引擎应用程序维护)。
发布于 2012-11-19 08:35:42
你可以在这里找到很多信息:
http://kkovacs.eu/cassandra-vs-mongodb-vs-couchdb-vs-redis
看看哪一个适合你的需要。
无论如何,对于这样的任务,NoSQL是正确的选择。
您还应该考虑学习曲线MongoDB / CouchDB,即使它们没有执行诸如Cassandra或Hadoop这样的操作,但它们更容易学习。
Craigslist使用MongoDB存储旧档案:http://www.10gen.com/presentations/mongodb-craigslist-one-year-later
https://stackoverflow.com/questions/13449943
复制相似问题