文章/答案/技术大牛

发布

问最佳开源/免费NLP引擎
EN

Stack Overflow用户

提问于 2013-09-16 20:46:58

回答 2查看 3.2K关注 0票数 5

假设我有一串众所周知的短语，比如：{“我爱你”，“你的母亲是一个.”，“我想我怀孕了”……让我们来说说1000这样的话吧。现在，我希望用户在文本框中输入免费的文本，并放入某种NLP引擎来消化文本，并从“拉”中找到与文本相关的10个最相关的短语。

我认为最简单的实现可能是从文字上看。每次挑选一个单词，并寻找相似之处。不知道哪一个？
最让我害怕的是我必须支持的词汇量。我是某种演示的开发人员，我不喜欢在桌子上填写单词的想法.
我正在寻找一个免费的NLP引擎。我不知道它是用哪种语言写的，但它必须是免费的--而不是某种通过API调用收费的在线服务。

nlp

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-09-17 10:17:07

看来TextBlob和ConeptNet已经足够解决这个问题了！

票数 3

Stack Overflow用户

发布于 2013-09-17 02:47:20

TextBlob是一个用于Python的易于使用的NLP库，它是免费和开放源码的(许可使用麻省理工学院许可)。它为优秀的NLTK和模式库提供了一个很好的包装。

解决问题的一个简单方法是从给定的文本中提取名词短语。

下面是来自TextBlob文档的一个例子。

from text.blob import TextBlob

text = '''
The titular threat of The Blob has always struck me as the ultimate movie
monster: an insatiably hungry, amoeba-like mass able to penetrate
virtually any safeguard, capable of--as a doomed doctor chillingly
describes it--"assimilating flesh on contact.
Snide comparisons to gelatin be damned, it's a concept with the most
devastating of potential consequences, not unlike the grey goo scenario
proposed by technological theorists fearful of
artificial intelligence run rampant.
'''

blob = TextBlob(text)
print(blob.noun_phrases)
# => ['titular threat', 'blob', 'ultimate movie monster', ...]

这可能是个起点。在那里，您可以尝试其他方法，如注释或TF-以色列国防军中提到的相似方法。TextBlob还使名词短语提取的互换模型变得容易。

完全披露:我是TextBlob的作者。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18837021

复制

相似问题

问最佳开源/免费NLP引擎
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问最佳开源/免费NLP引擎EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问最佳开源/免费NLP引擎
EN