def get_continuous_chunks(text): continuous_chunkwas the first black female editor in fiction at Random House in New York City."
>>> get_continuous_chunks
正如子j行所述,我正在尝试根据noun_chunks的各个POS标记提取它们的元素。noun_chunk的元素似乎无法访问全局语句POS标记。noun_chunks]AttributeError: 'spacy.tokens.span.Span' object has no attribute 'pos_' for c in chunks
我在fs.chunks中有10 GB的数据,我想删除所有不在fs.files上的文档。我已经删除了fs.files中所有我不想要的条目,所以fs.files中的每个id都是我想要保留的文件。因此,我想要类似于db.fs.chunks.remove({"_id": {$nin: fs.files._id}})或“删除fs.chunks中不存在于fs.files中的所有条目”之类的东西。编辑:我正在寻找相当于SQL delete from fs_chunks where id not in (select
我使用spacy en_core_web_trf和doc.noun_chunks来获取名词块。以前,它运行得很好,我可以正确地得到名词块。status of a parcel can be traced uniquely "# ---------------------get initial noun chunks--------------------- print(chunks)