我把我的数据作为DataFrame
dOpen dHigh dLow dClose dVolume day_of_week_0 day_of_week_1 ... month_6 month_7 month_8 month_9 month_10 month_11 month_12
639 -0.002498 -0.000278 -0.005576 -0.002228 -0.002229 0 0 ... 0 0 1 0 0 0 0
640 -0.004174 -0.005275 -0.005607 -0.005583 -0.005584 0 0 ... 0 0 1 0 0 0 0
641 -0.002235 0.003070 0.004511 0.008984 0.008984 1 0 ... 0 0 1 0 0 0 0
642 0.006161 -0.000278 -0.000281 -0.001948 -0.001948 0 1 ... 0 0 1 0 0 0 0
643 -0.002505 0.001113 0.005053 0.002788 0.002788 0 0 ... 0 0 1 0 0 0 0
644 0.004185 0.000556 -0.000559 -0.001668 -0.001668 0 0 ... 0 0 1 0 0 0 0
645 0.002779 0.003056 0.003913 0.001114 0.001114 0 0 ... 0 0 1 0 0 0 0
646 0.000277 0.004155 -0.002227 -0.002782 -0.002782 1 0 ... 0 0 1 0 0 0 0
647 -0.005540 -0.007448 -0.003348 0.001953 0.001953 0 1 ... 0 0 1 0 0 0 0
648 0.001393 -0.000278 0.001960 -0.003619 -0.003619 0 0 ... 0 0 1 0 0 0 0我的输入将是10行(已经进行了一个热编码)。我想要创建一个n维的自动编码表示。因此,据我所知,我的输入和输出应该是相同的。
我已经看过一些例子来构造它,但是仍然停留在第一步。我的训练数据只是做一个矩阵的大量样本吗?然后呢?
我为这个问题的一般性质道歉。任何问题,只要问,我会在评论中澄清。
谢谢。
发布于 2020-01-31 08:33:36
从这个问题上看,你想要实现什么还不太清楚。基于您所写的内容,您希望创建一个具有相同输入和输出的自动编码器,当我看到您的数据集时,这一点对我来说不太合理。在常见情况下,自动编码器的编码器部分创建一个模型,该模型基于一大组输入特征产生一个小的输出向量,而解码器正在执行基于全部输出和输入特征的合理输入特征重建的逆操作。使用自动编码器的结果被增强(在某种意义上,比如去除噪音等)输入。
您可以通过第三个用例找到一些示例这里,为序列数据提供代码,学习随机数生成模型。下面是另一个示例,它看起来更接近您的应用程序。构造了一种序列模型,对具有信息丢失的大数据集进行编码。如果这是您想要实现的,您将在那里找到代码。
如果目标是序列预测(比如未来的股价),那么这和那示例似乎更合适,因为您可能只想预测数据序列中的几个值(比如dHigh和dLow),并且不需要预测day_of_week_n或month_n (尽管由于模式非常清楚,自动编码器模型的这一部分可能会更可靠)。这种方法将允许您预测单个后续输出特性值(明天的dHigh和dLow)
如果希望预测未来的输出序列,可以使用输出序列,而不是模型中的单个输出。
一般来说,输入和输出的结构完全取决于你
https://stackoverflow.com/questions/59863263
复制相似问题