首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用NLP识别文本

使用NLP识别文本
EN

Stack Overflow用户
提问于 2017-06-21 02:20:59
回答 2查看 119关注 0票数 1

我正在尝试使用一些NLP技术在下面的文本行中查找课程。

代码语言:javascript
复制
from nltk import word_tokenize, pos_tag, ne_chunk
sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering"    
print ne_chunk(pos_tag(word_tokenize(sentence)))

输出结果是

代码语言:javascript
复制
(S
  (ORGANIZATION SDGI/NNP)
  is/VBZ
  offering/VBG
  courses/NNS
  like/IN
  Electronics/NNS
  ,/,
  Mechatronics/NNS
  ,/,
  (PERSON Physics/NNPS)
  ,/,
  (PERSON Mechanical/NNP Engineering/NNP))

有什么方法可以从这行中提取课程吗?

在我的实际项目中,我将获得如此多的文档,我需要从这些文档中获取课程名称。

如有任何帮助,我们不胜感激!

EN

回答 2

Stack Overflow用户

发布于 2017-07-08 17:04:19

  1. 从给定的文本中提取所有名词。
  2. 创建一组单词特征集,并使用标记数据训练课程集。
  3. 似乎课程大多在逗号(,)之前或之后。二元组或三元组方法可以给出准确的结果。
票数 0
EN

Stack Overflow用户

发布于 2017-08-05 04:27:14

这可能太简单了,但是,如果现有课程名称的数量有限,那么只需创建一个大的查找表,对输入进行标记并尝试查找每个单词,可能会更容易。会有一些边缘情况,但我不确定您是否需要采用ML/NLP方法来解决此问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44660433

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档