我在沃森资源管理器内容分析中为我们的UIMA管道编写一个自定义java注释器。
有两个地方(我知道)可以尝试获取当前正在处理的文档的URL或Filename。
初始化
public class CustomAnnotator extends JCasAnnotator_ImplBase {
@Override
public void initialize(UimaContext aContext)
throws ResourceInitializationException {
super.initialize(aContext);
.... HERE MAYBE ? ....或
过程
@Override
public void process(JCas jcas) throws AnalysisEngineProcessException {
try {
.... HERE ....我尝试了几种选择:
我也找到了SourceDocumentInformation,但这是一个例子,虽然getUri()方法看起来很有前途,但我依赖于IBM来实现setUri(String)方法.
但到目前为止我还没有成功,我希望我忽略了一些.
发布于 2017-09-29 06:04:00
我在上也问了同样的问题。简而言之,当管道在Watson Explorer服务器中运行时,您可以访问多个视图。对于元数据,我们需要检查_InitialView,而不是rlw视图,它是一个包含您在中创建的定制管道创建的所有注释的视图,在这里可以找到更多详细信息,还可以查看reponses!Analytics?lang=en
https://stackoverflow.com/questions/44548049
复制相似问题