首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >具有有效滑动窗口的MNIST CNN实时检测

具有有效滑动窗口的MNIST CNN实时检测
EN

Stack Overflow用户
提问于 2020-02-24 12:58:59
回答 1查看 281关注 0票数 2

我想训练一个CNN,它可以实时地对大分辨率图像进行推理。CNN必须阅读由5位数字组成的手写数字。

到目前为止,我在MNIST上训练了LeNet-5、Overfeat和Yolo .

LeNet-5给了我一个很好的精度,但是通过一种简单的滑动窗口方法,我在FullHD图像上得到了4000个窗口(虽然有很大的进步),这还不够快。(CPU上的一个窗口为10 on >40 per每幅图像)

所以我研究了一些更有效的滑动窗口的方法,并遇到了Overfeat。它将整个图像转换为类维输出数组windowsX、windowsY和类.这里的好处是,不需要多次计算重叠区域。现在,我正试图在slim的帮助下训练和评估这个网络。

最后,关于我的问题:

是否有更好的方法或CNN来解决这个问题?

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-04-02 10:42:54

你可以建立一个CRNN模型来提高精度。它由卷积神经网络(CNN)层、递归神经网络(RNN)层和最终连接的时间分类(CTC)层组成。

CRNN Github参考

CRNN模型的建立

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60376444

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档