我将使用Pytorch实现RNN。但是,在此之前,我在理解问题中提出的字符一级热编码方面有一些困难。
请在下面找到问题
例如,我在python上读过一本小说。唯一字符总数为97个。人物总数在30万左右。
那么,我的输入是97x256一个热编码矩阵吗?
或者是30万x 256一个热编码矩阵?
发布于 2018-04-21 13:48:13
一个热假设你的每一个向量应该是不同的在一个地方。因此,如果你有97个独特的字符,那么我认为你应该使用一个1-热向量的大小( 97 +1= 98)。额外的向量将所有未知字符映射到该向量。但是你也可以使用256长度的向量。所以你的输入是:
batch (B=批次大小,N=字符的no,V=一个热向量大小)。
但是,如果您使用的是库,它们通常会询问词汇表中的字符索引,并将索引处理为一个热点转换。希望这能有所帮助。
https://stackoverflow.com/questions/49954852
复制相似问题