我是一个Java初学者,我需要做以下事情:-我有一个txt文件作为输入,我想在GATE中分析文本;-我想让GATE自动启动,并在这个文本上运行它的语言分析(语料库管道)。
我的想法是在Java中打开并读取txt文件,然后将其转换为GATE文档,但我有以下疑问:
1)如何将文本转换为闸机单据?
2)如何让GATE自动启动?
谢谢你帮我的忙。
发布于 2014-07-02 14:01:56
在GATE中,你不必担心读取和转换常见的文件,如.txt,.pdf,.html等。GATE会自动完成这些工作。
像这样初始化GATE:
private static void initGateApplication(String gateXgappFileLoc, String gateHome) {
try {
try {
if (Gate.getGateHome() == null)
Gate.setGateHome(new File(gateHome));
}
catch (Exception ex) {
ex.printStackTrace(System.out);
}
try {
if (!Gate.isInitialised())
Gate.init();
}
catch (GateException e) {
e.printStackTrace(System.out);
}
System.out.println("Initializing gate application...");
gappFile = new File(gateXgappFileLoc);
gateApplication = (CorpusController) PersistenceManager.loadObjectFromFile(gappFile);
}
catch (Exception e) {
e.printStackTrace(System.out);
}
}并使用您的文本文件运行GATE管道:
public void extract(String inputFileName, String docID, CorpusController gateApplication) throws GateException, IOException
{
CorpusController application = gateApplication;
Corpus corpus = Factory.newCorpus("Sample Corpus");
application.setCorpus(corpus);
File docFile = new File(inputFileName);
System.out.print("Processing document " + docFile + "...");
Document doc = Factory.newDocument(docFile.toURL(), encoding);
// add document to the corpus
corpus.add(doc);
// run the application
application.execute();
System.out.println("Done running GATE pipeline...");
// Now use get annotations from 'doc' object
}https://stackoverflow.com/questions/24512443
复制相似问题