首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >生物医学的亲缘关系命名实体识别(NER)

生物医学的亲缘关系命名实体识别(NER)
EN

Stack Overflow用户
提问于 2019-12-10 10:43:30
回答 2查看 1.3K关注 0票数 1

如何使用scispacy标记实体?

当我试图使用scispacy进行NER时,它用Entity标记生物医学实体,但没有将它们标记为基因/蛋白质,等等。那么,如何使用scispacy来实现这一点呢?或者scispacy不能标记数据?图片附呈,以供参考:jupyter笔记本片段

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-03-24 15:46:24

en_core_sci_smen_core_sci_mden_core_sci_lg模型没有命名它们的实体。如果要标记实体,请使用模型

  • en_ner_craft_md
  • en_ner_jnlpba_md
  • en_ner_bc5cdr_md
  • en_ner_bionlp13cg_md

每个实体都有自己的类型,参见:-

https://allenai.github.io/scispacy/

了解更多信息

票数 2
EN

Stack Overflow用户

发布于 2020-06-01 17:35:14

你可以用“GENE_OR_GENE_PRODUCT”过滤标签,得到所有的基因名称。

代码语言:javascript
复制
import spacy
import scispacy
import en_ner_bionlp13cg_md

document = "We aimed to prospectively compare the risk of early progression according to circulating ESR1 mutations, CA-15.3, and circulating cell-free DNA in MBC patients treated with a first-line aromatase inhibitor (AI)"

nlp = spacy.load("en_ner_bionlp13cg_md")
for X in nlp(document).ents:
    if X.label_=='GENE_OR_GENE_PRODUCT':
        print(X.text)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59265404

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档