文章/答案/技术大牛

发布

社区首页 >问答首页 >SpaCy，在管道期间应用扩展

问SpaCy，在管道期间应用扩展
EN

Stack Overflow用户

提问于 2018-08-25 18:35:49

回答 1查看 234关注 0票数 0

在SpaCy中，您可以像这样设置文档的扩展名：

Doc.set_extension('chapter_id', default='')

doc = nlp('This is my text')
doc._.chapter_id = 'This is my ID'

但是，我有数以千计的文本文件需要由NLP处理。SpaCy建议使用pipe实现这一点：

docs = nlp.pipe(array_of_texts)

如何在pipe期间应用我的扩展值

python

nlp

spacy

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-25 21:48:48

您可能希望在nlp.pipe上启用as_tuples关键字参数，该参数允许您传入(text, context)元组列表，并将生成(doc, context)元组。所以你可以这样做：

data = [('Some text', 1), ('Some other text', 2)]

def process_text(data):
    for doc, chapter_id in nlp.pipe(data, as_tuples=True):
        doc._.chapter_id = chapter_id
        yield doc

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52016425

复制

相似问题

问SpaCy，在管道期间应用扩展
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SpaCy，在管道期间应用扩展EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SpaCy，在管道期间应用扩展
EN