文章/答案/技术大牛

发布

问使用NLP识别文本
EN

Stack Overflow用户

提问于 2017-06-21 02:20:59

回答 2查看 119关注 0票数 1

我正在尝试使用一些NLP技术在下面的文本行中查找课程。

from nltk import word_tokenize, pos_tag, ne_chunk
sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering"    
print ne_chunk(pos_tag(word_tokenize(sentence)))

输出结果是

(S
  (ORGANIZATION SDGI/NNP)
  is/VBZ
  offering/VBG
  courses/NNS
  like/IN
  Electronics/NNS
  ,/,
  Mechatronics/NNS
  ,/,
  (PERSON Physics/NNPS)
  ,/,
  (PERSON Mechanical/NNP Engineering/NNP))

有什么方法可以从这行中提取课程吗？

在我的实际项目中，我将获得如此多的文档，我需要从这些文档中获取课程名称。

如有任何帮助，我们不胜感激！

python

nlp

nltk

opennlp

回答 2

Stack Overflow用户

发布于 2017-07-08 17:04:19

从给定的文本中提取所有名词。
创建一组单词特征集，并使用标记数据训练课程集。
似乎课程大多在逗号(，)之前或之后。二元组或三元组方法可以给出准确的结果。

票数 0

Stack Overflow用户

发布于 2017-08-05 04:27:14

这可能太简单了，但是，如果现有课程名称的数量有限，那么只需创建一个大的查找表，对输入进行标记并尝试查找每个单词，可能会更容易。会有一些边缘情况，但我不确定您是否需要采用ML/NLP方法来解决此问题。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44660433

复制

相似问题

问使用NLP识别文本
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用NLP识别文本EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用NLP识别文本
EN