我是一家主要旅行社的程序员。我很有经验,但现在我遇到了一个需要建立人工智能的问题。我知道这类脚本无处不在,但我似乎找不到任何有用的东西。
基本上我们是在构建一个FAQ脚本。我们每天都会收到同样类型问题的电子邮件,所以我们想要建立一个联系方式,就像我写这篇文章的时候一样:在右边,它呈现了许多已经回答的问题,这些问题在某种程度上与我现在所写的类似。在我写主题的时候也会发生同样的事情。
好吧,谈正事。我正在做一份联系表格,但是当客户正在写主题和/或信息时,我希望在他们写的时候为他们提供一些预定义的问答。我相信我不能使用soundex,因为FAQ将使用丹麦语,因此听起来不像英语。
所以..。我将如何:
基本上我是在研究,所以我非常感谢仅仅是简单的SQL查询以及为此目的而设计的完整脚本!一切都是有用的。
发布于 2013-03-20 10:23:03
查看Levenshtein距离
发布于 2013-03-20 10:33:09
本来打算把这句话加到赞恩的评论上,但它写得太长了:
取决于丹麦语语法,你可能需要一些相当大的截断点的Levenshtein距离,以找到可能的匹配。
如果你有更多的时间花在这个问题上,你可能会想要在单词的边界上分开,把单个单词分开,然后将这些词干的计数与数据库中的数据进行比较。http://pecl.php.net/package/stem上似乎有一个词干库(我从未使用过它,但它似乎支持丹麦语)。
由于看来果胶茎没有我能找到的正式文档(嗯,我很好奇),所以在安装了pecl软件包之后,您会像这样使用它:
$stem = stem($myInputWord, STEM_DANISH);而且,由于我正在仔细阅读PHP手册,所以我最好补充一下,对于更大的应用程序(我不会仅仅为您的情况介绍它),您可能想看看用于设置Solr等的PHP手册的搜索引擎科。但在你的案子里,这可能是过火了。
https://stackoverflow.com/questions/15520803
复制相似问题