首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有没有办法告诉NLTK,某个词不是专有名词,而是名词?

有没有办法告诉NLTK,某个词不是专有名词,而是名词?
EN

Stack Overflow用户
提问于 2016-01-21 05:48:30
回答 1查看 407关注 0票数 5

我正在做一些NLP,我要找出病人什么时候被诊断为多发性硬化症。

我想用nltk告诉我句子中的名词是多发性硬化症。问题是,医生经常将多发性硬化症称为多发性硬化症,nltk将其作为专有名词。

例如,这句话“他的多发性硬化症是在1999年被诊断出来的。”标记为:[('His', 'PRP$'), ('MS', 'NNP'), ('was', 'VBD'), ('diagnosed', 'VBN'), ('in', 'IN'), ('1999', 'CD'), ('.', '.')]

MS在这里应该是名词。有什么建议吗?

EN

回答 1

Stack Overflow用户

发布于 2017-09-01 23:23:24

总而言之,您有以下选项:

  1. 在后处理过程中更正标签--虽然有点难看,但却很简单。
  2. 使用了一个外部名称实体识别器(斯坦福大学的校友@鲍勃·迪伦曾深思熟虑地建议过)--这个更复杂,特别是因为斯坦福校友使用的是java,而且速度不是特别快。
  3. 对特定领域的数据重新训练词义标记器(您是否有足够大的带注释的数据集来使用它?)
  4. 使用WSD (词义消歧)方法--首先,您需要有一个好的领域词典才能使用。

<代码>G29

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34911264

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档