我是tensorflow的新手,正在尝试根据教程实现"seq2seq“模型。我不确定函数"embedding_attention_seq2seq“的一个参数"num_heads”(default=1)。它代表了什么?我没有在相关的文件中找到它。
发布于 2017-05-19 14:28:14
如果你读过像this one这样的解码器的源代码,你就会知道它代表了关注的数量。
有时会有几个注意事项(层次注意),例如this paper中的这个(如下所示)。
第一个是单词,第二个是句子。
请查看此图表:

https://stackoverflow.com/questions/38113303
复制相似问题