我在网上银行的纸面上有一份清单如下:
001 123456 015 123456 029 123456 043 123456 ...
002 123456 ...
...我扫描了它,现在我想使用OCR来获取文本。
我试过,山羊和楔形。
所有的程序都不能取得好的效果。我怎样才能把课文录下来?
背景:我想把谭表存储在keepass里。Keepass确实支持图像,但只支持PC版本。Android版本没有。所以我才要短信。文本更好,因为,你可以使用复制和粘贴。
发布于 2015-01-15 06:12:43
我自己找到了这个解决方案:
读-tan-list.py.tan:
import sys
i=0
tans=[]
for line in open(sys.argv[1]):
line=line.strip()
if not line:
continue
tans.append(line)
for i, tan in enumerate(tans):
print('%03d %s' % (i+1, tan)),
if i%5==4:
print('\n'),
else:
print(' '),发布于 2015-01-14 08:54:29
原始图像的质量往往是ocr中的一个关键资源。(试试600 dpi之类的东西)
我建议你试试。
tesseract imagename outputbase [-l lang] (在处理银行业务时,要非常小心地选择存储在设备中的内容.)
https://askubuntu.com/questions/573579
复制相似问题