问将max_len添加到二维数组中，使其成为三维数组
EN

Stack Overflow用户

提问于 2022-06-12 05:52:29

回答 1查看 24关注 0票数 0

我有二维文本特征(1096,100)，我需要结合我的文本功能和我的音频功能，其中的文本功能需要在3D。形状应为(1096，50,100)，其中50为max_seq_len。

我该怎么做？

def get_average_word2vec(tokens_list, vector, generate_missing=False, k=100):
    if len(tokens_list)<1:
        return np.zeros(k)
    if generate_missing:
        vectorized = [vector[word] if word in vector else np.random.rand(k) for word in tokens_list]
    else:
        vectorized = [vector[word] if word in vector else np.zeros(k) for word in tokens_list]
    length = len(vectorized)
    summed = np.sum(vectorized, axis=0)
    averaged = np.divide(summed, length)
    return averaged

def get_word2vec_embeddings(vectors, clean_text, generate_missing=False):
    embeddings = clean_text['tokens'].apply(lambda x: get_average_word2vec(x, vectors, 
                                                                                generate_missing=generate_missing))
    return list(embeddings)
    
text_embeddings = get_word2vec_embeddings (word2vec, df, generate_missing=True)
text_embeddings = np.asarray(text_embeddings)
text_embeddings.shape
(1096, 100)

python

reshape

word2vec

回答 1

Stack Overflow用户

发布于 2022-06-29 02:53:08

好的。经过几天的学习，我发现我可以通过伯特从文本中获得三维特征。一些参考资料是(只是为了分享)；

伯特去营救！ Bert的情感分析

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72589801

复制

相似问题

问将max_len添加到二维数组中，使其成为三维数组
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将max_len添加到二维数组中，使其成为三维数组EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将max_len添加到二维数组中，使其成为三维数组
EN