首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >SpaCy,在管道期间应用扩展

SpaCy,在管道期间应用扩展
EN

Stack Overflow用户
提问于 2018-08-25 18:35:49
回答 1查看 234关注 0票数 0

在SpaCy中,您可以像这样设置文档的扩展名:

代码语言:javascript
复制
Doc.set_extension('chapter_id', default='')

doc = nlp('This is my text')
doc._.chapter_id = 'This is my ID'

但是,我有数以千计的文本文件需要由NLP处理。SpaCy建议使用pipe实现这一点:

代码语言:javascript
复制
docs = nlp.pipe(array_of_texts)

如何在pipe期间应用我的扩展值

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-25 21:48:48

您可能希望在nlp.pipe上启用as_tuples关键字参数,该参数允许您传入(text, context)元组列表,并将生成(doc, context)元组。所以你可以这样做:

代码语言:javascript
复制
data = [('Some text', 1), ('Some other text', 2)]

def process_text(data):
    for doc, chapter_id in nlp.pipe(data, as_tuples=True):
        doc._.chapter_id = chapter_id
        yield doc
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52016425

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档