首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从任何消费产品的图像中检测文本/标识-细节?

如何从任何消费产品的图像中检测文本/标识-细节?
EN

Stack Overflow用户
提问于 2019-02-11 06:39:23
回答 1查看 199关注 0票数 0

我正试图从它的packaging.For eg-玛吉(我想检测-麦琪幸福是自制的)的图片中检测出任何消费品的名称。

我尝试过应用图像吸引(如侵蚀,开放,关闭等)。然后将预处理后的图像提供给pytesseract(OCR)。我计划使用图像魔术工具,如果它可以做任何帮助。

仅仅对图像进行预处理就足够了,如果没有,我该怎么办?(任何代码、软件都行)

PS-我不想使用Google或任何类似的API

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-11 19:02:40

在Imagemagick 6中,您可以执行以下操作来分离"kelloggs“。

代码语言:javascript
复制
fill back to replace everything but the red color
fill white to replace the red color

convert kellogg.jpg -fuzz 15% \
-fill black +opaque "rgb(240,0,0)" \
-fill white -opaque "rgb(240,0,0)" \
result.png

对于你的“玛吉”形象来说,这要复杂一些,因为你的“玛吉”是黄色的,其他地方是黄色的。

代码语言:javascript
复制
fill yellow color to replace the white in the corners
fill yellow color to replace black
floodfill the outside yellow with black
fill black to replace everything but yellow
fill white to replace yellow

convert maggie.jpg \
-fuzz 15% -fill "rgb(254,242,0)" -opaque white \
-fuzz 20% -fill "rgb(254,242,0)" -opaque black \
-fuzz 15% -fill black -draw "color 10,10 floodfill" -alpha off \
-fuzz 15% -fill black +opaque "rgb(254,242,0)" \
-fuzz 15% -fill white -opaque "rgb(254,242,0)" \
result2.png

但还有商标留下。因此,为了去除,我们添加连接组件处理,以过滤出最小的白色区域。

代码语言:javascript
复制
convert maggie.jpg \
-fuzz 15% -fill "rgb(254,242,0)" -opaque white \
-fuzz 20% -fill "rgb(254,242,0)" -opaque black \
-fuzz 15% -fill black -draw "color 10,10 floodfill" -alpha off \
-fuzz 15% -fill black +opaque "rgb(254,242,0)" \
-fuzz 15% -fill white -opaque "rgb(254,242,0)" \
-define connected-components:area-threshold=50 \
-define connected-components:mean-color=true \
-connected-components 4 \
result3.png

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54625126

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档