我使用此代码检测所有文本并绘制所有采购框:
from paddleocr import PaddleOCR,draw_ocr
ocr = PaddleOCR(lang='en') # need to run only once to download and load model into memory
img_path = 'PaddleOCR/doc/imgs_en/img_12.jpg'
result = ocr.ocr(img_path, cls=False)
for line in result:
print(line)
# draw result
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='/path/to/PaddleOCR/doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')现在,我有了一个图像,所有检测到的采购箱。我想分离所有的采购箱,以便我可以从他们的信息提取与pytesseract。我想这样做是因为paddleocr更适合检测,但是Pytesserat更适合提取(德语)。那么,我如何才能将所有的采购箱分离出来,从每一个盒子中提取文本呢?谢谢
发布于 2022-08-16 15:38:24
每个检测框中的四个点的顺序是左上角、右上、右下角和左下角。
由于PP中的检测算法是由行检测的,如果要从检测框坐标中获取每个单词的具体坐标,就会更加困难。
https://stackoverflow.com/questions/72840785
复制相似问题