我想使用云视觉来识别和隔离图片中的“主要”文本(例如,包装上最大的文字)。我假设cloud vision能够通过查看字体大小/每个字母占用多少像素在后端做到这一点,但我不确定API中是否有相应的输出。
我对这些信息在文档中的位置的最佳猜测是在以下链接中,但我看不到任何与此相关的内容:https://cloud.google.com/natural-language/reference/rest/v1beta1/documents/annotateText
发布于 2016-08-01 09:07:06
TEXT_DETECTION Vision接口(https://cloud.google.com/vision/docs/samples#detecting_text_in_images)可以返回(string + boundingPoly)数组。
json表示AnnotateImageResponse如下所示。
"textAnnotations": [
{
object(EntityAnnotation)
}
]EntityAnnotation https://cloud.google.com/vision/reference/rest/v1/images/annotate#EntityAnnotation
您可以从BoundingPoly https://cloud.google.com/vision/reference/rest/v1/images/annotate#BoundingPoly获取字体大小(以像素为单位
https://stackoverflow.com/questions/38678837
复制相似问题