我的想法是,给出一个单词变体和另一个单词的基形式,在基本形式中再现单词变体的特征。
我已经能够从给定一组特性的基本形式中生成一个单词变体,我的问题在于从原始的单词变体中收集这些特性。
到目前为止,我的解决办法是使用Stanford并过滤单词variant的POS标记,从而恢复一些(但不是大多数)特性。然后,使用SimpleNLG,我可以创建新的单词变体。
为Java提供这些功能的任何其他工具或库也是受欢迎的。
提前感谢
发布于 2016-07-18 13:52:29
SimpleNLG顾名思义.很简单。您可能想看看处理语言的库在一个更语义的层次上。值得注意的例子有OpenCCG (http://openccg.sourceforge.net/)。不过,这将是一项小小的工作。
https://stackoverflow.com/questions/37345278
复制相似问题