我正在尝试使用一些NLP技术在下面的文本行中查找课程。
from nltk import word_tokenize, pos_tag, ne_chunk
sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering"
print ne_chunk(pos_tag(word_tokenize(sentence)))输出结果是
(S
(ORGANIZATION SDGI/NNP)
is/VBZ
offering/VBG
courses/NNS
like/IN
Electronics/NNS
,/,
Mechatronics/NNS
,/,
(PERSON Physics/NNPS)
,/,
(PERSON Mechanical/NNP Engineering/NNP))有什么方法可以从这行中提取课程吗?
在我的实际项目中,我将获得如此多的文档,我需要从这些文档中获取课程名称。
如有任何帮助,我们不胜感激!
发布于 2017-07-08 17:04:19
发布于 2017-08-05 04:27:14
这可能太简单了,但是,如果现有课程名称的数量有限,那么只需创建一个大的查找表,对输入进行标记并尝试查找每个单词,可能会更容易。会有一些边缘情况,但我不确定您是否需要采用ML/NLP方法来解决此问题。
https://stackoverflow.com/questions/44660433
复制相似问题