Hy,我目前正在研究我的论文,就是为乌尔都语建立OCR。我有文字,写在图片上。在CNN中,我知道有复杂的和汇集的层来学习模式或(提取特征)。我所读到的关于RNN的是,它学习序列。我想问一下RNN如何提取特征来知道,图像中是什么?
发布于 2018-11-26 06:43:58
神经网络在训练阶段基本上需要一些特征和标签来学习数据中的序列。在数值数据不存在任何问题的情况下,我们简单地将数据集划分为特征(X)和目标值(Y)。但对于图像数据,我们采用了和RNN( CNN -RNN)相结合的方法。这里,在RNN层(、LSTM或GRU、)的顶部,采用卷积层从图像中提取特征,然后将这些特征提供给RNN层。
发布于 2018-10-08 20:24:53
RNN网络使用的隐藏层,随着时间的推移而更新。在减少误差(或损失)的基础上,采集样本并预测下一个样本。LSTM是一种克服了长期依赖关系的RNN类型.也许这种类型会对你的论文有用。
https://stackoverflow.com/questions/52696478
复制相似问题