请帮助我理解命名实体识别和命名实体提取的区别。
发布于 2014-05-06 03:04:15
命名实体识别是对实体(人、地点、组织)的表面形式的识别,即在此文本字符串中,“乔治·布什”或“巴拉克·奥巴马”是“人”实体。
实体提取将从文本字符串中提取附加信息作为属性。例如,在“乔治·W·布什在奥巴马之前是总统”这句话中,认识到“奥巴马”是一个具有"title=president“属性的人。
但是,如果你观察一下软件,你会发现两者之间的区别通常是模糊的。
发布于 2014-05-06 16:14:58
没有命名实体提取这回事。
更好地解释这句话,我会说命名实体提取很简单,具体提取以前识别的命名实体的过程。因此,在某种意义上,没有与这项任务相关的真正的理论知识,只是定义机械操作的问题。
相反,如果我们对从一段文本中提取所有特定实体或有关它们的附加信息感兴趣,那么我们必须查看信息或knowledge extraction。
例如,对于信息提取,您可以要求提取出现在文档语料库中的所有城市名称或电子邮件地址。对于这样的任务,可以使用命名实体提取。您甚至可以更通用,简单地要求提取一般知识,例如以关系的形式(关系提取)。
有关更多细节,我推荐Artificial Intelligence: A Modern Approach一书中的自然语言处理一章。
https://stackoverflow.com/questions/23455485
复制相似问题