如何在RUTA中使用刀具概念。我已经看过文档了,但我不是clear.Can,任何人都可以简单地解释一下。
发布于 2017-02-03 21:28:14
RutaCutter是一个简单的分析引擎,用于修改归档存储中的文档文本。文档文本不能被修改,因此创建了一个新的视图,其中将存储修改。有三个配置参数:输入视图的名称,例如_InitialView (您的文本),输出视图的名称,例如cutted (结果将被存储的位置),以及完整的类型名称。只有该类型的注释所覆盖的文本才会存储在输出视图中。所有其他文本跨度将被“剪切”。其余文本中注释的偏移量将被更新。
下面是一个代码示例:
// setup
JCas jcas = JCasFactory.createJCas();
AnalysisEngine cutter = AnalysisEngineFactory.createEngine(RutaCutter.class, RutaCutter.PARAM_KEEP, TruePositive.class.getName());
jcas.setDocumentText("Some text.");
Ruta.apply(jcas.getCas(), "SW{-> TruePositive};");
cutter.process(jcas);
// testing
Collection<TruePositive> select = JCasUtil.select(jcas, TruePositive.class);
Assert.assertEquals(1, select.size());
TruePositive truePositive = select.iterator().next();
Assert.assertEquals(5, truePositive.getBegin());
JCas cuttedView = jcas.getView("cutted");
Assert.assertEquals("text", cuttedView.getDocumentText());
select = JCasUtil.select(cuttedView, TruePositive.class);
Assert.assertEquals(1, select.size());
truePositive = select.iterator().next();
Assert.assertEquals(0, truePositive.getBegin());
jcas.release();
cutter.destroy();免责声明:我是UIMA Ruta的开发者
https://stackoverflow.com/questions/41972738
复制相似问题