类似于下面链接的问题,我想访问输入和输出矩阵WI和WO。但是,我使用的是Word2Vec的Blazingtext实现。
拟合后的model.tar.gz中庭包含: vectors.txt,对应于WI;二进制model.bin,用于托管。
有人知道如果使用blazingtext是否可以访问WO矩阵吗?
How can I access output embedding(output vector) in gensim word2vec?
提前感谢
发布于 2022-06-21 16:30:12
通过对BlazingText文档和示例笔记本的快速浏览,我看不到亚马逊选择公开对“输出”向量权重的任何访问,也没有看到任何间接显示它们在哪里的示例。
它们可能是在vectors.bin中的某个地方编码的,但是似乎没有这种格式的文档。如果BlazingText的源代码(甚至有几个关键部件可用),就可以很简单地找出(& )这些部件是否存储在.但似乎没有可用的源代码。
因此,只有拥有专有信息的亚马逊工程师才能回答这个问题。
你确定你需要使用亚马逊的BlazingText,而不是更好的文档化的、源代码可用的替代实现吗?
它的主要好处似乎是训练速度,这可能是决定性的超大训练集,或情况下,短期延迟重新索引经常发生。(如果一次使用大型历史语料库进行一次训练,然后将向量用于许多下游目的,那么一次“午餐”或“通宵”的训练就足够快了)。
https://stackoverflow.com/questions/72698389
复制相似问题