我尝试使用自适应阈值和Thesh_Binary_Inv将图像转换为灰度
gray = cv2.cvtColor(img1,cv2.COLOR_BGR2GRAY)
adapt1 = cv2.adaptiveThreshold(gray,130,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY_INV,153,40)我尝试使用pytesser来获取车牌,但得到了一些随机值作为输出
有没有人可以帮我从图像中提取文本,以及在哪里可以找到如何使用kmeans或任何其他算法进行训练的教程
发布于 2017-02-27 05:54:38
从图像中提取文本时,请尝试查看图像,就好像您试图尽可能清楚地看到文本一样。我的教授曾经说过:如果人类能看到它,计算机也能看到它。你要做的基本上是执行基本的预处理算法,如对比度增强,如果需要的话,颜色空间转换等。在阈值处理之前,你想要获得的是一幅尽可能清晰的图像,其中字符没有任何疑问,字符和白色背景之间的边缘尽可能明显。
您需要对阈值操作进行实验。在开始的时候,我推荐使用带有跟踪条的简单的固定阈值函数,这样你就不必在每次想要改变值的时候都重新运行代码。您可以在我的GitHub存储库中的here上找到代码。当然,这只是其中的一个步骤。你仍然需要找到你和角色感兴趣的区域。对于这些步骤,您需要查看的可能是contour finding。
训练部分将更加棘手。K-means here上有一个很漂亮的入门级教程,但我猜你不太确定该怎么做。我不确定在这里推荐什么,因为在你掌握基础知识之前,机器学习对你来说可能有点太难了。无论如何,如果我要做这件事,我可能会选择深度学习,但你需要知道测试数据和你如何准备它在这个过程中是至关重要的。这是一个very simple tutorial,它可能会让你对发生了什么有一个概念。
Raaj,请记住,如果你希望别人努力帮助你,首先要努力去请求,这是有礼貌的。你必须更好地解释你尝试了什么,你在哪里寻找,你得到了什么结果,以及你对我们的期望。图像,我想说,在你的情况下是必须的,而你甚至没有费心去提供这些。祝好运!
https://stackoverflow.com/questions/42472877
复制相似问题