我正在尝试破解验证码图像,但我找不到分割字符的方法。
我有这样的图像:

我应用了一些过滤器和阈值,产生了这个图像:

现在我需要分割图像,以便在分类器中使用,例如SVM或ANN。
问题是有些字符是连接在一起的,我找不到一种方法来将它们分开。
更多图片示例:



有没有人有办法分割图像并获取字符?
发布于 2014-06-13 21:31:08
在我看来,你的字符有最大的笔画宽度。每当您发现水平的黑色像素行宽于此宽度时,就表示此处连接了两个字符。
所以
对于比斑点每行单个字符更宽的每个连接的斑点,_
的中心的X坐标更长的所有不间断的黑色像素水平线
- cluster the found X-coordinates
- split the block at the center of each cluster with more than N coordinates.
- (you can either simply split vertically, or try to fit a line through the points in the cluster)
发布于 2014-06-13 20:59:49
你的方法对我来说似乎太自下而上了。
字符的数量是恒定的,它们看起来是单间距的
因此,只需按宽度拆分图像,并确保检索到的特征是旋转/缩放不变的。
然后可以将其输入到ANN中。我不明白你为什么要分割角色。
发布于 2014-06-16 18:13:06
这是一个最小化问题。棘手的部分是选择正确的指标,并使其快速。
附言:这可能很有趣:https://code.google.com/p/captchacker/
https://stackoverflow.com/questions/24150431
复制相似问题