正如我在我的previous question中所问的那样,我面临的问题是我有数百张手写笔记的图片。它们是从不同的人编写的,但它们是按顺序编写的,因此您知道,例如,person1编写了img1.jpg -> img100.jpg。笔迹的风格因人而异,但笔记的某些部分总是固定不变的(也许这有助于算法的实现)。
我遵循一个用户建议使用tesseract,但它无法识别任何文本。文本不在engligh中,但我确实使用了适当的语言数据文件。
我对ai的了解是有限的,但是从搜索和查看一些论文来看,这似乎可以用CNN来完成。有人能指点我以后该怎么做吗?我想继续这个项目,但我也没有太多的时间去学习神经网络。实现一个解决这个任务的方法有多大的挑战性?
发布于 2019-10-28 09:59:46
我不会用手写体识别。您可以为手写识别训练tesseract,但它可以很好地用于打印文本和许多字体和语言。
以下是两个如何自己训练它的链接:
对于亚马逊的识别,我有一个更好的结果:https://aws.amazon.com/en/recognition,我想为它创建一个离线java库,但是还没有找到任何一个。我的下一步将是尝试ABBYY服务,因为它们还可以专注于分离的手写字符:https://abbyy.technology/en:features:ocr:icr。
https://stackoverflow.com/questions/58418928
复制相似问题