文章/答案/技术大牛

发布

社区首页 >问答首页 >具有有效滑动窗口的MNIST CNN实时检测

问具有有效滑动窗口的MNIST CNN实时检测
EN

Stack Overflow用户

提问于 2020-02-24 12:58:59

回答 1查看 281关注 0票数 2

我想训练一个CNN，它可以实时地对大分辨率图像进行推理。CNN必须阅读由5位数字组成的手写数字。

到目前为止，我在MNIST上训练了LeNet-5、Overfeat和Yolo .

LeNet-5给了我一个很好的精度，但是通过一种简单的滑动窗口方法，我在FullHD图像上得到了4000个窗口(虽然有很大的进步)，这还不够快。(CPU上的一个窗口为10 on >40 per每幅图像)

所以我研究了一些更有效的滑动窗口的方法，并遇到了Overfeat。它将整个图像转换为类维输出数组windowsX、windowsY和类.这里的好处是，不需要多次计算重叠区域。现在，我正试图在slim的帮助下训练和评估这个网络。

最后，关于我的问题：

是否有更好的方法或CNN来解决这个问题？

谢谢!

tensorflow

deep-learning

neural-network

conv-neural-network

mnist

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-04-02 10:42:54

你可以建立一个CRNN模型来提高精度。它由卷积神经网络(CNN)层、递归神经网络(RNN)层和最终连接的时间分类(CTC)层组成。

CRNN Github参考

CRNN模型的建立

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60376444

复制

相似问题

问具有有效滑动窗口的MNIST CNN实时检测
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问具有有效滑动窗口的MNIST CNN实时检测EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问具有有效滑动窗口的MNIST CNN实时检测
EN