我正在UIMA DUCC中设计一个文本挖掘管道,如下所示:
|-----------------|
| | ==CAS_1==> Pipeline A ==> Consumer A
| CAS Multiplier | ==CAS_2==> Pipeline B ==> Consumer B
| | ==CAS_3==> Pipeline C ==> Consumer C
|-----------------|我打算并行运行压线A,B和C。我相信这可以用流量控制器来完成。我的身份正确吗?如果是,我如何定义多个CCs。职务描述文件中的process_descriptor_CC字段只接受一个使用者。我们如何才能通过多个消费者和它的压线分析?
发布于 2015-04-22 13:51:46
如果意图是处理大量高吞吐量的文档集合,那么这三个管道(每个管道都包括其CAS使用者)都在AE (process_descriptor_AE)中,AE将包括一个定制的流控制器,以便根据需要路由CASes。AE中的CASes可以一次运行一个,但是多个CM+AE线程可以通过指定大于1的JP线程数(process_thread_count)并行运行。
发布于 2015-04-24 17:16:46
首先,您需要了解流控制器,并使用flow contoller创建聚合描述符,并添加cas使用者描述符,就像流控制器中的分析引擎描述符一样。
在此之后,您的场景有两个用例:
发布于 2015-04-22 08:37:54
创建一个流程控制器,并添加cas使用者作为委托分析引擎。通过这种方式,您可以添加任意数量的。然后在部署描述符中给出流程控制器的路径,并在作业规范中给出流程控制器的路径。
https://stackoverflow.com/questions/29764534
复制相似问题