我最近发现(阅读下面的问题),我可以使用NNDependencyParser通过斯坦福解析器获得德语依赖项。
Dependencies are null with the German Parser from Stanford CoreNLP
我的问题是,我解析的依赖关系总是句子中简单的相邻单词,没有真正的树结构。解析"Die Sonne scheint am Himmel“我会得到成对的("Die","Sonne"),("Sonne","scheint"),("scheint","am")等作为依赖项,即使使用折叠依赖项。
String modelPath = "edu/stanford/nlp/models/parser/nndep/UD_German.gz";
String taggerPath = "edu/stanford/nlp/models/pos-tagger/german/german-hgc.tagger";
String text = "Ich sehe den Mann mit dem Fernglas.";
MaxentTagger tagger = new MaxentTagger(taggerPath);
DependencyParser parser = DependencyParser.loadFromModelFile(modelPath);
DocumentPreprocessor tokenizer = new DocumentPreprocessor(new StringReader(text));
for (List<HasWord> sentence : tokenizer) {
List<TaggedWord> tagged = tagger.tagSentence(sentence);
GrammaticalStructure gs = parser.predict(tagged);
for (TypedDependency td : gs.typedDependenciesCollapsed()) {
System.out.println(td.toString());
}发布于 2016-08-26 06:40:02
是的,我们的德语依赖解析模型目前已经失效(不知何故,法语模型包含在版本中,而我们目前似乎没有工作的德语模型)。
但是,您可以使用Universal Dependencies project中的数据训练自己的模型。您可以找到一些关于如何在其project page上训练解析器的信息。
https://stackoverflow.com/questions/39132797
复制相似问题