首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我如何训练我的数据集

我如何训练我的数据集
EN

Stack Overflow用户
提问于 2020-08-28 19:54:01
回答 1查看 1K关注 0票数 0

我有一个拥有大约1000个文件的大量gt.txt和tiff文件的数据集,我尝试使用tesstrain项目并运行下面的命令make training MODEL_NAME=cmc7 MODEL_NAME=cmc7--这个命令成功地运行了,但是当我尝试使用培训数据时,它并不像预期的那样工作。我的问题是,什么是正确的形式来训练我的数据集的tesseract?谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-29 23:23:28

为了用图像训练数据集,我使用两种类型的文件对图像进行校正:

  • gt.txt文件与预期的
  • 文件生成的图像之间的变化,我想用

来训练模型

我将所有3个文件放置在tesstrain /data/my-model-接地- the中,并从tesstra设文件夹中运行以下命令:

代码语言:javascript
复制
make training MODEL_NAME=my-model START_MODEL=eng TESSDATA=../tessdata_best

这是假设您想要在eng.traineddata的基础上从tessdata_best存储库中进行培训:https://github.com/tesseract-ocr/tessdata_best

生成my. That的命令/数据文件夹。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63640134

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档