首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >网上银行业务(网上银行)

网上银行业务(网上银行)
EN

Ask Ubuntu用户
提问于 2015-01-14 06:29:45
回答 2查看 185关注 0票数 0

我在网上银行的纸面上有一份清单如下:

代码语言:javascript
复制
001 123456   015 123456  029 123456  043 123456 ...
002 123456   ...
...

我扫描了它,现在我想使用OCR来获取文本。

我试过,山羊和楔形。

所有的程序都不能取得好的效果。我怎样才能把课文录下来?

背景:我想把谭表存储在keepass里。Keepass确实支持图像,但只支持PC版本。Android版本没有。所以我才要短信。文本更好,因为,你可以使用复制和粘贴。

EN

回答 2

Ask Ubuntu用户

回答已采纳

发布于 2015-01-15 06:12:43

我自己找到了这个解决方案:

  1. 扫描TAN列表
  2. 用Gimp删除序列ID。只剩下泰恩了。需要,因为在我的例子中使用了两种不同的字体,这似乎混淆了OCR。
  3. gocr -C 0123456789 tans.png
  4. 终端中的矩形选择: ctrl+alt用鼠标选择
  5. copy+paste到tans.txt
  6. 读-tan-list.py tans.txt。
  7. 将结果插入到keepass或其他密码应用程序。

读-tan-list.py.tan:

代码语言:javascript
复制
import sys
i=0
tans=[]
for line in open(sys.argv[1]):
    line=line.strip()
    if not line:
        continue
    tans.append(line)
for i, tan in enumerate(tans):
    print('%03d %s' % (i+1, tan)),
    if i%5==4:
        print('\n'),
    else:
        print('   '),
票数 0
EN

Ask Ubuntu用户

发布于 2015-01-14 08:54:29

原始图像的质量往往是ocr中的一个关键资源。(试试600 dpi之类的东西)

我建议你试试。

代码语言:javascript
复制
tesseract imagename outputbase [-l lang] 

(在处理银行业务时,要非常小心地选择存储在设备中的内容.)

票数 0
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/573579

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档