我即将开始使用tesseract,确切地说,是tess4j,并且我正在阅读api文档。我还没有遇到任何从网页上阅读的方法。
基本上,该程序打开的网页只是一个图像。我希望tess4j从页面读取图像,并将其转换为单词。如果tess4j不能做到这一点,有没有其他java ocr会有帮助,最好不要下载图像?
感谢你的帮助。
发布于 2013-05-27 14:19:43
阅读和下载是同义词。如果你想在不打开网页的情况下从网页中读取图片,我建议你看看"curl“命令,它在Java中是等效的。在使用上述命令获取图像后,可以使用Tesseract对其进行解析。
发布于 2018-07-11 14:06:43
试试这个:
String imageURL = "<Remote URL of image>";
String result = "";
URL url = new URL(imageURL);
BufferedImage img = ImageIO.read(url);
Tesseract instance = new Tesseract();
instance.setDatapath("<your tessdata path>");
result = instance.doOCR(img);https://stackoverflow.com/questions/16755065
复制相似问题