我想从一个给定的文本中提取银行名称,比如wells,chase....is,那里有一个python库吗?我知道有实体标签在空间和天赋,但他们只识别实体(org/person)
发布于 2020-12-16 08:12:53
正如注释中提到的,您可以使用regex,但是您需要为它定义一组规则。您可以尝试使用受过法律文档培训的LexNLP,并使用它提取数据类型,如地址、公司和人员。
发布于 2020-12-16 15:44:53
它可以通过名称实体识别来解决。
这是一个使用spacy的例子。我强烈建议您检查它的文档。
这种方法的缺点是计算成本高且耗时。
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")
for ent in doc.ents:
print(ent.text, ent.start_char, ent.end_char, ent.label_)
https://datascience.stackexchange.com/questions/86659
复制相似问题