我对诸如Hadoop、Cassandra等分布式NoSQL数据库很陌生。我有几个问题需要寻求专家的建议:
以上问题听起来可能是愚蠢和基本的,但请专家们详细回答以上问题,并尽他们最大的能力。
发布于 2011-01-03 16:50:48
我可以给出一些想法:
1:使用Hadoop和相关项目,文档和示例一直是我的项目的主要挑战。与MySQL相比,通常很难找到哪些特性可用,以及如何使用它们。邮寄名单在这方面起了很大的帮助。学习从批处理和“全表扫描”的角度来思考也是一种调整,而习惯Map reduce编程也不是一件容易的事情,尽管有许多工具可以帮助您避免编写原始地图减少。
2: Hadoop & friends的大部分代码库仍然基本上是字母表,有时版本之间的变化很大。您肯定希望一个测试集群先进行升级,看看会发生什么变化。在升级过程中,API的急剧变化并不是意料之外的。
3:我没有专门使用memcached,我使用Hadoop进行后端ETL处理,而不是呈现页面。在这帮不了你。
4:理解项目的最好方法是获取代码并开始查看它。练习使用它一段时间,最终你会发现一些你认为可以做得更好的东西,或者你想要的特性。这地方和其他地方一样好。一定要注册开发人员邮件列表,并注意现有的bug列表和功能请求,看看是否有人已经在做类似的事情。这些项目中的大多数,您需要找一个拥有提交权限的人将您的代码放入其中,但这并不难。阅读您感兴趣的特定项目,以获得更具体的信息。
发布于 2011-01-04 06:15:48
我的经验是:
https://stackoverflow.com/questions/4579317
复制相似问题