我正在做一些NLP,我要找出病人什么时候被诊断为多发性硬化症。
我想用nltk告诉我句子中的名词是多发性硬化症。问题是,医生经常将多发性硬化症称为多发性硬化症,nltk将其作为专有名词。
例如,这句话“他的多发性硬化症是在1999年被诊断出来的。”标记为:[('His', 'PRP$'), ('MS', 'NNP'), ('was', 'VBD'), ('diagnosed', 'VBN'), ('in', 'IN'), ('1999', 'CD'), ('.', '.')]
MS在这里应该是名词。有什么建议吗?
发布于 2017-09-01 23:23:24
总而言之,您有以下选项:
<代码>G29
https://stackoverflow.com/questions/34911264
复制相似问题