段落向量纸的作者用以下方式描述PV:
2.3。不带词序的段落向量:上述方法考虑了段落向量与单词向量的连接,以预测文本窗口中的下一个单词。另一种方法是忽略输入中的上下文词,而是强制模型预测输出中段落中随机抽取的单词。实际上,这意味着在随机梯度下降的每一次迭代中,我们采样一个文本窗口,然后从文本窗口中抽取一个随机单词,并在给定段落向量的情况下形成一个分类任务。
我有几个问题:
[(1, "cat"), (1, "sat"), ..., (1, "mat"), (2, "humpty"), (2, "dumpty"), ... (2, "wall"), ...]的列表中随机抽样,其中每个元组中的第一个项目代表段落?发布于 2019-08-06 07:03:02
https://datascience.stackexchange.com/questions/48426
复制相似问题