首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Pytesser中使用多种语言

在Pytesser中使用多种语言
EN

Stack Overflow用户
提问于 2016-04-20 22:25:30
回答 1查看 10.1K关注 0票数 4

我已经开始使用Pytesser了,它对英文和中文都很好用,但是有没有办法同时使用两种语言呢?我需要创建自己的训练数据文件吗?我的代码是:

代码语言:javascript
复制
import Image
from pytesser import *
print image_to_string(Image.open("chinese_and_english.jpg"), lang="eng")
#also want to have chinese be recognized 

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-17 02:21:19

我对Pytesser不是很确定,但是使用tesserocr你可以指定多种语言。例如:

代码语言:javascript
复制
import tesserocr

with tesserocr.PyTessBaseAPI(lang='eng+chi_tra') as api:
    api.SetImageFile('eSXSz.jpg')
    print api.GetUTF8Text()

# or simply
print tesserocr.file_to_text('eSXSz.jpg', lang='eng+chi_tra')

图像的输出示例:

代码语言:javascript
复制
In [8]: print tesserocr.file_to_text('eSXSz.jpg', lang='eng+chi_tra')
Character, Chmese 動m川爬d
胸肌岫馴伽 H枷﹏ P﹏… …

〔Manda‥﹝ 二 Standard C…爬虯



一

口

X慣ng怕ng

请注意,像第一个示例一样初始化一次接口,然后通过调用SetImageFile (或使用PIL.Image对象的SetImage )对多个镜像重复使用,可以避免每次都重新初始化接口,效率更高。

票数 9
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36746902

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档