对于NER (名称实体识别)工具,如DBpedia、Zemanta、OpenCalais、Alchemy等,它们使用的算法是什么,是否有首选或通用的算法可供使用?
发布于 2011-05-09 21:35:33
Check Soundex -一个非常好的和众所周知的名字匹配算法(因为他们是在英语中听到的)。
发布于 2011-05-10 00:57:49
我最后一次使用的是Double Metaphone,它使用启发式方法来尝试猜测名称所属的原始语言以及它应该导致的发音。
然而,最终,这种认可并不像人们预期的那样好。大多数语言都有将其音译为拉丁语的规则(在韩语中也称为罗马化),因此您可能需要先检查一下。
https://stackoverflow.com/questions/5937582
复制相似问题