我一直在开发一个程序,该程序将搜索字符串中的重复模式。查找和计算每个模式类型的匹配项是很容易的部分,我可以根据找到的匹配项数量从最高得分到最低得分进行排序。选择保留哪些重叠的匹配项比较困难,我应该删除最左边的还是最右边的?
假设我找到了第一个匹配项,删除了最右侧重叠的匹配项,依此类推。当我转到下一个模式类型时,问题出现了,我发现从上面的模式类型per中删除最左边的匹配会更好。这将允许这个模式适合空间,等等。然而,当我谈到下一组模式时,可能会发现让事情保持原样会有好处,等等……
这种来回摆动可能会对整个文件重复。
我的问题是:有没有什么算法或技术可以计算出每个单一模式的最佳匹配度,同时将重复次数最多的模式保持在列表的顶部?
如有任何建议,我们将不胜感激;) Ed
发布于 2016-09-10 21:11:29
试着举个例子
你唯一应该做的就是(在我看来):
删除最左边或最右边的-Instead,尝试将它们全部保存,在分析完所有匹配后,您应该决定要做什么。不确定地删除不是一个好的选择。
https://stackoverflow.com/questions/39426171
复制相似问题