我已经使用维基百科的内容和php构建了一个答案引擎。它只返回与特定查询最相关的维基百科文章,在大多数情况下,这是useles.The用户倾向于以“韦恩·鲁尼的身高是多少”这样的问题形式提出的,我想给出鲁尼的确切身高,这可以在他的维基百科文章中找到。如果我使用nltk,我能解决这个问题吗?敬请指教。
发布于 2011-10-12 05:29:24
一般来说:是的,这是可能的,但构建这样一个程序是一项非常困难的任务。
你正在尝试建立的搜索引擎被称为“语义搜索引擎”(参见wikipedia),有很多研究正在进行,我们如何构建一个“语义网”,以及如何提取网页信息,以便计算机可以回答你提到的问题,而不仅仅是提供相关文档的链接。但结果仍然远非完美。
更好的语义搜索引擎之一似乎是trueknowledge,当然还有前面提到的wolframalpha (它在科学上有自己的优势)。
如果您真的想构建这样一个语义搜索引擎,nltk可能会提供一些有用的基本工具,但不要期望这是一项简单的任务。
https://stackoverflow.com/questions/7731981
复制相似问题