我们希望使用pan.sh来执行多个水壶转换。在研究了这个脚本之后,我发现它内部调用了运行在PDI中的spoon.sh脚本。现在的问题是,每当一个新的转换启动时,它都会创建一个单独的JVM来执行它的执行(通过一个.bat文件调用),但是我想将它们分组,以使用单个JVM来克服多个JVM在批处理服务器上设置的内存约束。
有人能指导我如何做到这一点或与我共享文档/资源吗?
谢谢你做得很好。
发布于 2016-02-10 11:05:26
使用Carte。这正是这是为了什么。您可以启动服务器(如果您愿意,可以在本地框上),然后将作业提交给它。一个JVM,一个堆,共享资源。
这样做的好处是可伸缩性,所以当您的框变得太忙时,只需添加另一个,也可以使用点菜,然后开始向另一个服务器发送一些作业。
这里有一个古老但仍在流行的博客:
http://diethardsteiner.blogspot.co.uk/2011/01/pentaho-data-integration-remote.html
以及五旬节网站上的多科。
启动服务器非常简单,如下所示:
carte.sh <hostname> <port>还有一个状态页面,您可以使用它来查询您的点菜服务器,所以如果您有一个服务器集群,您可以选择一个安静的页面发送您的作业。
https://stackoverflow.com/questions/35275791
复制相似问题