我试图从图片中提取单词的图像,这些图片大多有不同类型字体的句子。例如,考虑这个场景:

现在,我想要提取克林顿、街道等词的个别图像,比如:

我试着用二元展开法,但是白色和黑色区域之间的距离几乎可以忽略不计。但是,当我第一次将原始图像中的空白区域裁剪出来,然后用较低的F1值重新对裁剪的图像进行二进制扩展时,就取得了一些成功。
什么是最好的和高精度的方法来区分图像的文字和这张图片?
Ps:我正在关注这个博客帖子,以帮助我完成任务。
谢谢
芬尼克
发布于 2017-01-17 08:24:31
扩张一下,我就明白了:

这是不是对你不满意,因为线可能太近,合并与扩张(就像它发生在最后两条线)?
其他的东西,从我的头顶开始:
-clustering。
-low级方法,其中您计数每一行中的像素数,以找出线条所在的位置,然后计数每列中的像素,以确定每行中单词的位置。
https://stackoverflow.com/questions/41691092
复制相似问题