我有几个关于微调过程的问题。我正在构建一个应用程序,它能够识别以下文档中的数据:
他们都有不同的字体(特别是收据),很难匹配完全相同的字体,我将不得不在许多相似的字体上训练模型。
所以我的问题是:
eng模型是好的吗?tesstrain.sh生成大约4k页。关于如何生成最接近实际输入数据的培训数据,可能有任何建议。例如,如果我使用的字体具有较高的错误率,并且我希望目标是98% - 99%的准确率。
另外,也许你们中的一些人有处理这类文档的经验,也许您知道一些用于这些文档的常见字体?
我知道护照和身份证中的MRZ使用的是OCR-B字体,但是文件的其余部分呢?
提前感谢!
发布于 2020-11-14 19:16:45
Ans 1你可以训练一个单一的模型来达到同样的目的,但是如果你想检测不同的语言,那么我认为你需要不同的模型。
Ans 2如果您正在寻找一些数据集,那么请看一下这个Mnist Png数据集,它有来自各种计算机字体的数字和字母表。这里有一个指向一些初学者代码的链接,以使用在Py火炬中实现的数据集。
Ans 3您可以使用白金枪鱼为您的模型找到最好的参数集,但是您需要一些
看看这些
他们正在努力完成类似的任务。希望它能回答你的问题!
发布于 2020-11-15 02:27:25
发布于 2020-11-15 12:49:25
假设您所指的是一个ML数据模型,它可能用于使用计算机视觉执行ocr,我建议:
如果您只需要对您的应用程序进行一些自动化操作,或者进行需要从图像中转换OCR的数据输入,那么一个很好的开源解决方案就是使用通过PSImaging模块(Powershell)自动收集信息的方法,使用从png中检索到的置信度,并针对当前的数据集运行它们,以提高您的字符匹配精度。您可以找到相关的链接这里。
https://stackoverflow.com/questions/64332859
复制相似问题