有没有一个关于Tensorflow的全面反恐委员会损失的例子?tensorflow.contrib.ctc的文档中没有足够的信息给我。我知道有一个堆叠溢流柱,但我不能让它工作。
也许有人有一个完整的(双向的) LSTM示例,他/她可以共享样本数据。谢谢。
发布于 2016-07-13 13:15:03
参见这里关于双向LSTM和CTC实现的例子,在TIMIT语料库上训练音素识别模型。如果您不能访问TIMIT或其他音素转录的数据集,您可能无法获得任何良好的表现与这样的单层模型,但基本的结构应该保持。
更新:,如果您无法访问TIMIT,或者您只希望在不格式化输入的情况下运行TIMIT,以使代码正常工作,我添加了一个8样本玩具数据集,您可以非常适合于查看实际操作中的培训。
发布于 2016-07-12 21:31:10
发布于 2021-08-08 06:34:22
Chris为CTC和RNN的语音识别提供了一个很好的例子。他的模型使用音素识别语音。所使用的反恐委员会损失是tf.keras.backend.ctc_batch_cost。
代码位于https://github.com/chrisdinant/speech,对所做工作的解释可以在https://towardsdatascience.com/kaggle-tensorflow-speech-recognition-challenge-b46a3bca2501上找到。
https://stackoverflow.com/questions/38333348
复制相似问题