我对MUC数据集有问题。我想对此执行NER,但此数据集中的所有单词都是大写字母,因此当运行pos_tagger时,它会将所有错误的单词检测为名词。为了解决这个问题,整个文本最初都变成了小写。然而,这种方式带来了另一个问题;如果文本是小写字母,则NER不能正常工作,并且从字面上找不到“人、组织或位置”。因此,保留了整个文本到小写的转换,以便能够成功地pos_tag,然后执行每个单词的手动大写,以将它们提供给NER模块。但另一个问题出现了,这一次NER检测到的一切都是位置。下面是我的代码:from nltk.tokenize import word_tokenize, s