我想在一组关键字(主要是兴趣爱好、最新新闻等人们可能感兴趣的话题)上实现一个基于python的语义搜索。我想知道是否存在用于相同和开源搜索算法/实现的本体数据库。
例如:我的集合={说话,喝水,发推特,卡特里娜凯夫,卡特里娜旋风,收集岩石,收集硬币}
因此,在搜索“积累”时,我可能会得到收集岩石和收集硬币作为输出。
编辑:术语可以有多个单词。那就是“美国总统奥巴马”是一个有效的疑问。
发布于 2012-01-17 00:30:52
你可能想要使用“随机索引”。它可以做你需要的事情,它计算每个单词的特征向量,并定义两个单词之间的语义相似度度量。
您所需要做的就是获取一份An Introduction to Random Indexing和一个semanticvectors包,以便开始使用……
我希望这对你有所帮助,如果你需要进一步的建议,请评论…
发布于 2012-01-21 07:46:33
我希望但不确定这对你是否有帮助。
Gnowsys
https://stackoverflow.com/questions/8823112
复制相似问题