我们的架构有几百个服务器,大约200个进程(都是内部开发的)分布在这些服务器上,一些进程由crontab控制,一些进程作为守护进程运行。一些服务器位于“组”中,其中所有服务器的配置都相同,而其他服务器则具有自定义配置。我的任务是集中控制这些任务。
一种用例是,通过ssh进入任何机器的用户必须能够以接近实时的方式控制网络上的任何进程,方法是启动和停止相关守护进程,或者重新构建和重新安装crontab。已经有各种零碎的东西被创建用来从数据库中驱动所有这些东西,但整体架构还没有经过深思熟虑。
我希望我将编写一个守护进程,该守护进程将在每个服务器上运行,并在对等网络、数据库以及守护进程和crontab之间进行协调。
我正在调查哪些技术可以帮助和支持这个项目。
我想我正在寻找点对点可靠的通信技术。尽管我不能百分之百确定这就是我需要的。在我的雷达上的东西包括传播,JXTA,Zookeeper和JMS。
人们使用这些技术的经验是什么?我还应该检查哪些其他技术?在我看来,我将拥有非常低的数据速率(每小时最多几千字节)。但是可靠性和成熟的API很重要。
发布于 2009-07-02 06:30:45
很抱歉,这并不是对你的任何问题的直接回答,但是你描述的东西听起来很像你最终会做很多重复的工作-特别是如果仅仅是考虑到"user ssh's into one box“部分。(双关语无意,但现在我注意到了,耶!=)
你有没有看过像http://www.cfengine.org或http://www.theether.org/pssh/这样的项目?
https://stackoverflow.com/questions/1072419
复制相似问题