我有个大麻烦。我不懂变压器。我理解嵌入,rnn,GAN,甚至注意。但我不懂变压器。大约两个月前,我决定避免使用变压器,因为我发现它们很难使用。但我不能再逃避变压器了。求你帮帮我。我想使用和理解变压器的工作。我怎样才能开始与他们合作呢?过去,我想了解他们的总体想法,我也想用keras/tensorflow来编写/实现他们--当然,我是和一些教程联系在一起的。但我还是不明白。
发布于 2021-02-03 17:58:44
以下是你在评论中指出的具体疑问的答案:
<s>。https://datascience.stackexchange.com/questions/88823
复制相似问题