我正在读一篇关于变压器机器学习模型应用于金融的文章。我试图理解架构背后的数学,但我未能理解这部分:


特别是,我不明白为什么操作之间的尺寸不匹配。根据我的理解:
以下是研究的全部内容:

我想,我在用这个符号表示什么

或者用“非线性投影矩阵M到u”的句子。
有人能给我一点启发吗?
基于
变压器的股票走势预测注意网,2022年,张秋月,赵琴,张云峰,方旭宝,CaimingZhang,刘佩德,刘培德
发布于 2022-06-26 08:08:24
如果你没有代码,或者你找到了作者,用这段文字,我们必须猜测错误在哪里。
我猜
另一个假设是,他们有描述的方程式,他们有一个有效的代码,当他们写论文时,他们不正确地计算出矩阵的维数。
我不知道我是否会相信一篇论文的出版日期在未来,和零引用。
https://www.sciencedirect.com/science/article/abs/pii/S0957417422006170#!

https://stackoverflow.com/questions/72714050
复制相似问题