如何使用scispacy标记实体?
当我试图使用scispacy进行NER时,它用Entity标记生物医学实体,但没有将它们标记为基因/蛋白质,等等。那么,如何使用scispacy来实现这一点呢?或者scispacy不能标记数据?图片附呈,以供参考:jupyter笔记本片段
发布于 2020-03-24 15:46:24
en_core_sci_sm、en_core_sci_md和en_core_sci_lg模型没有命名它们的实体。如果要标记实体,请使用模型
每个实体都有自己的类型,参见:-
https://allenai.github.io/scispacy/
了解更多信息
发布于 2020-06-01 17:35:14
你可以用“GENE_OR_GENE_PRODUCT”过滤标签,得到所有的基因名称。
import spacy
import scispacy
import en_ner_bionlp13cg_md
document = "We aimed to prospectively compare the risk of early progression according to circulating ESR1 mutations, CA-15.3, and circulating cell-free DNA in MBC patients treated with a first-line aromatase inhibitor (AI)"
nlp = spacy.load("en_ner_bionlp13cg_md")
for X in nlp(document).ents:
if X.label_=='GENE_OR_GENE_PRODUCT':
print(X.text)https://stackoverflow.com/questions/59265404
复制相似问题