我正在尝试使用NLTK库从病人的医疗报告中提取表示医疗症状的关键词。例如,我有一份医疗报告如下:
S:一位33岁的女结晶师会出现轻微的眩晕,轻微的头痛,尤其是在后脑勺和早上x2周。pt还报告慢性轻度偶尔头晕。O:身高160 cm,体重53.8kg,温度37.3℃,脉搏76℃,SystolicBP 146,DiastolicBP 93,呼吸15,心脏=心脏底部收缩期杂音2/6,胸部听诊B/L清楚,无罗音或喘息,四肢=无水肿或棍棒,心脏=正常S1,S2,RRR a:高血压: E/M水平2级(确定患者)-完成,并规定氢氯噻嗪- 50 mg po qd,胆固醇有序。
在这里,我想找到所有的关键字或图表,代表医学症状。在上面的文章中,这些关键词是“轻微眩晕”、“轻微头痛”、“头晕”等。
为此,我需要一些代表症状的术语集合,这样我就可以在我的医疗报告中检测到类似的术语。是否有与医学术语相关的NLTK语料库?如果我找到一张表示医疗症状的单词清单,我就可以把我在医疗报告中发现的单词与语料库中的单词进行比较。
谢谢。
发布于 2021-03-02 00:39:42
欢迎来到生物医学领域,这是NLP中为数不多的有太多资源可供选择的领域之一:)
我认为这是我所知道的所有主要的.到目前为止。
根据您的描述,在我看来,您可能只需要cTakes或SciSpacy。如果您要开始使用Medline或PMC,请注意这些数据集很大(几百GB)。
https://datascience.stackexchange.com/questions/90092
复制相似问题