我有一些关于自然语言处理的想法。我需要一些语法
S -> NP VP为了和他们一起玩而变得多样化。
如果我试图自己写这些规则,这将是一个乏味和容易出错的事情。曾经为英语和其他自然语言输入并发布过全面的规则集?最好是用BNF、Prolog或类似的语法编写。
我的项目只涉及上下文无关的语法,我对统计方法或机器学习不感兴趣--我需要系统地制作英语类和Foobarian类句子。
如果你知道在哪里能找到这些物资,我会非常感激的。
发布于 2011-07-06 14:27:01
据我所知,英语最全面的无语境语法是:
题名/责任者: H. .1985年。广义短语结构语法牛津:布莱克韦尔。
还有几种基于规则但非上下文无关的语法可以在网上免费使用,例如宾夕法尼亚大学( Penn XTAG语法 )或HPSG 英语资源语法。
发布于 2011-07-06 08:42:51
您可能想看看Attempto控制英语及其基于Prolog的工具。
自从统计分析在90年代初流行以来,语法通常不被分发,除了特定的问题域,而是派生于分布式语料库,如Penn Treebank。如果您能够理解它(我相信样本是与NLTK一起分发的),您可以通过查看所有树片段并将它们转换为规则来“滚动”您自己的语法。(例如,如果你发现一个带有子标记NP和VP的节点S,你知道应该有一个规则S -> NP VP )。修剪不经常发生的规则是个好主意。)
发布于 2011-07-30 08:07:04
看看语法框架。它是一种用于多语言语法应用的函数式编程语言,它附带了30种语言的库,其中包括英语。
https://stackoverflow.com/questions/6583160
复制相似问题