最近,我在Hadoop上玩了一圈,它对MapReduce作业的调度、管理和报告给我留下了深刻印象。它似乎使新作业的分配和执行非常无缝,使开发人员能够集中精力实现他们的作业。
我想知道在Java域中是否存在不容易表示为MapReduce问题的作业的分布式执行?例如:
那么,是否有一个提供这样一个分布式计算环境的Java框架/平台呢?或者,使用Hadoop可以接受/实现这类事情吗?如果是这样的话,对于这类工作是否有任何模式/指导方针?
发布于 2010-01-04 15:40:55
此后,我发现了弹簧批和弹簧批量集成,它们似乎满足了我的许多需求。我会告诉你我是怎么相处的。
发布于 2009-12-17 14:28:51
看看石英。我认为它支持远程管理作业和集群几台机器来运行作业。
发布于 2009-12-16 14:21:53
我猜您正在寻找一个用于CPU密集型任务的工作流引擎(也知道“科学工作流”,例如http://www.extreme.indiana.edu/swf-survey)。但我不知道你希望它有多大的分布。通常所有的工作流引擎都有一个“单一的故障点”。
https://stackoverflow.com/questions/1914884
复制相似问题