我正在建设一个android应用程序注册用户投诉任何特定的政府相关问题。我想让我的数据库中没有任何歧义的投诉是独特的。我使用的是php和mysql数据库。我想使用像wordnet这样的软件来匹配投诉之间的相似性,以便消除相同的投诉,并给用户建议编辑。那么我该怎么做呢?是否只有wordnet或其他可靠的方法?
发布于 2016-03-23 05:39:01
不允许在Stack Overflow上使用建议(您请求的类型,而不是您正在构建的类型),我希望这个问题可以解决。希望我能在那之前完成这件事。
虽然单例和模棱两可的东西看起来像是你想要摆脱的东西,但记录人们用他们说话的方式说的每一句话有很大的价值。这是真的,即使在Stack Overflow上,问题可能会以重复的形式关闭,但我们不会删除它们,我们会保留它们,这样如果有人以这种方式输入问题并从google登录到这里,我们仍然可以捕捉到他们对问题的理解。
你面临的问题更多的是产品设计而不是算法。无论您选择哪种匹配算法来确定相似性(其中有许多),您仍然需要决定声明足够相似的内容对用户的影响。这可能会指导你决定如何确定相似性。(例如,是单词相似度、字符n元语法相似度、概念相似度等)
一旦你选择了一个相似性,并遇到了一个特定的问题,得到了你想要的效果(这意味着你可以描述你的输入和你期望的输出),这就是你可以在这里提出的问题。
https://stackoverflow.com/questions/36159681
复制相似问题