首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在大图像上应用MNIST训练的NN

如何在大图像上应用MNIST训练的NN
EN

Stack Overflow用户
提问于 2021-01-31 23:03:18
回答 1查看 53关注 0票数 0

我有一个用MNIST训练的deeplearning4j神经网络(NN),用来识别图像上的数字。由于MNIST集包含28x28像素的图像,因此我能够使用此神经网络预测28x28图像的类别。

我正在尝试找出如何将此神经网络应用于手写页面的图片?如何将图像中的文本转换为实际的文本(OCR)?基本上,需要什么样的预处理,以及如何找出图像中文本所在的部分?如何派生图像的较小部分以单独应用NN?

EN

回答 1

Stack Overflow用户

发布于 2021-01-31 23:16:28

您可能希望使用Tensorflow (手写文本识别)来探索HTR。有一些有趣的实现已经可用,并被广泛用作相同的基线模型。其中之一就是here

上面的架构详细说明了如何设计这样的系统。当然,您可以进一步修改它以满足您的需求。

如果您正在处理数据的组合,或者试图了解此类图像的预处理步骤,here是一个可以指导您的链接。

主要的预处理步骤是检测和裁剪单词,以便这些单词可以通过底层的TensorFlow、HTR或tesseract架构进行管理。

您可能想看看cropyble,它将裁剪和单词提取打包在一起。您可以专门使用它来裁剪图像,以便为其他下游任务提取单词序列

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65980596

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档