我正在开发一个Android OCR项目。在我的项目中,我使用tess-two。但我在初始化tess-two的tessdata文件夹中的训练数据时遇到了问题。
我在grandle里安装了tess-two
dependencies {
compile 'com.rmtheis:tess-two:6.0.2'
}然后,我尝试从位图中检测文本,如下所示
public String detectText(Bitmap bitmap) {
TessBaseAPI tessBaseAPI = new TessBaseAPI();
tessBaseAPI.setDebug(true);
tessBaseAPI.init(DATA_PATH, "eng"); //Init the Tess with the trained data file, with english language
//For example if we want to only detect numbers
tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "1234567890");
tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-qwertyuiop[]}{POIU" +
"YTREWQasdASDfghFGHjklJKLl;L:'\"\\|~`xcvXCVbnmBNM,./<>?");
tessBaseAPI.setImage(bitmap);
String text = tessBaseAPI.getUTF8Text();
tessBaseAPI.end();
return text;
}在单击按钮时触发的。我的活动只包含该函数。问题出在数据路径变量上。
这是我的项目结构

是的,我添加了两个tessdata文件夹来演示两个场景。
第一次尝试。我将DATA_PATH设置如下
DATA_PATH = Environment.getRootDirectory().getPath()+"/data/";这给了我“数据路径不存在!”错误。所以我找到了这些解决方案Tesseract OCR Android tessdata directory not found和Get path of data directory(android)。
所以我试着这样设置DATA_PATH
DATA_PATH = Environment.getRootDirectory().getPath();它告诉我“数据路径必须包含子文件夹tessdata!”错误。
然后我试了一下
DATA_PATH = Environment.getRootDirectory().getPath()+"/data/tessdata/";然后,我又给出了这个错误"Data path I not exist!“。
然后我试着用这种方法
DATA_PATH = Environment.getRootDirectory().getPath()+"/tessdata/";它给我这个错误“数据路径不存在!”。
所以我试过的所有方法都不起作用。如何正确初始化tessdata文件夹?我不知道如何为它设定路径。
发布于 2016-08-18 02:19:00
将tessdata目录复制到内部存储或手机内存中。然后将您的DATA_PATH变量设置为
DATA_PATH = Environment.getExternalStorageDirectory() + "/";然后试着运行它。我最近发现,Environment.getExternalStorageDirectory()可能并不总是指向您的SD卡或外部存储。在我的例子中,它实际上指向了我的内部存储器,因此用上面的DATA_PATH复制我的内部存储器中的tessdata文件夹对我来说很好。因此,这应该直接指向包含tessdata文件夹的内部存储器。
发布于 2018-03-17 17:58:40
您可以将文件放在assets文件夹中,然后使用AssetManager将它们复制到/storage/emulated/0/tesseract/tessdata/等位置。
https://stackoverflow.com/questions/38068980
复制相似问题