我从tesseract中提取了一个图像文档,它提取成功。但我无法理解所提取的文件的坐标。它显示坐标,但让我知道,这些坐标代表像素或其他东西。他们代表的是什么立场 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/
cascades that are likelv to be introduced in the next revision of this specification." "3https://api.dartlang.org/" ] }
我的第一个想法是使用Detectron2和库(如和 ),使用OCR技术(尤其是OCR技术),使用深度学习来执行布局检测。我只