我正在编写一个web应用程序,在这个应用程序中我需要分析单词(现在只是用英语,但将来可能在任何语言中)。我试图编写一个框架来完成这项工作,但很快就证明了这是一件非常困难的事情。找到词干,理解词类,找到辅音,确定形态模式等等。随着每一个新的要求,它真的变得越来越难。
是否有任何框架(最好与.NET或PHP兼容)可用于使用人类语言(例如英语)?这种框架的一些共同方法可以是:
List<Synonym> synonyms = SynonymFinder.FindSynonyms("Help");
Stem stem = MorphologyAnalyzer.GetStem("Determining");
Pronunciation pronunciation = Phonetics.Transcribe("Speech");发布于 2011-09-14 11:26:00
也许您可以使用NLTK (自然语言工具包)和IronPython的组合
NLTK是一个用于构建Python程序以处理人类语言数据的领先平台。它为50多个语料库和词汇资源(如WordNet )提供了易于使用的接口,以及一套用于分类、标记化、词干、标记、解析和语义推理的文本处理库。由于一份介绍编程基础和计算语言学主题的实际指南,NLTK适用于语言学家、工程师、学生、教育工作者、研究人员和行业用户。NLTK可用于Windows、Mac和Linux。最棒的是,NLTK是一个免费的、开源的、社区驱动的项目.
https://softwareengineering.stackexchange.com/questions/103872
复制相似问题