我正在测试从给定网站提取公司名称的AlchemyAPI。在大多数情况下,我都能得到正确的信息。我还需要将结果归类到业务中。我从AlchemyAPI得到的是最一般的分类,但我需要一个更具体的答案。例如,在他们的演示链接中,如果我输入www.ford.com,它将返回作为recreation的类别。DMOZ还将福特归类为最高级别的娱乐。我需要把福特归类为商务车辆。我有没有办法做到这一点?AlchemyAPI是否使用DMOZ进行分类?如果是,如何实现更具体的分类?
另一个例子是百事可乐。百事公司被归类为企业。我需要把它归类为商务-->食品和饮料。
发布于 2013-08-08 23:02:55
这听起来像是在使用AlchemyAPI的文本分类端点。该调用将尝试将整个文档分类为12个类别中的一个(“业务”和“娱乐”是其中的两个)。
文本分类调用的目的是说“这个文档通常是关于X的”。如果您想要从文档中提取特定的公司名称并确定公司所在的类别,请尝试使用实体提取调用(更多信息请访问:http://www.alchemyapi.com/api/entity-extraction/)。该调用将查找文档中的所有公司,并返回每个公司的“类型”。实体提取调用支持数百种类型,而不是另一个调用中的12个类别。这应该会让你的分类更精确。
发布于 2013-08-23 04:19:31
AlchemyAPI的ranked named entity extraction将categorize一个命名实体,如果你启用了歧义消除,它将给你一个更具体的分类(例如,福特=公司-> AutomobileCompany)。
https://stackoverflow.com/questions/16275164
复制相似问题