首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将max_len添加到二维数组中,使其成为三维数组

将max_len添加到二维数组中,使其成为三维数组
EN

Stack Overflow用户
提问于 2022-06-12 05:52:29
回答 1查看 24关注 0票数 0

我有二维文本特征(1096,100),我需要结合我的文本功能和我的音频功能,其中的文本功能需要在3D。形状应为(1096,50,100),其中50为max_seq_len。

我该怎么做?

代码语言:javascript
复制
def get_average_word2vec(tokens_list, vector, generate_missing=False, k=100):
    if len(tokens_list)<1:
        return np.zeros(k)
    if generate_missing:
        vectorized = [vector[word] if word in vector else np.random.rand(k) for word in tokens_list]
    else:
        vectorized = [vector[word] if word in vector else np.zeros(k) for word in tokens_list]
    length = len(vectorized)
    summed = np.sum(vectorized, axis=0)
    averaged = np.divide(summed, length)
    return averaged

def get_word2vec_embeddings(vectors, clean_text, generate_missing=False):
    embeddings = clean_text['tokens'].apply(lambda x: get_average_word2vec(x, vectors, 
                                                                                generate_missing=generate_missing))
    return list(embeddings)
    
text_embeddings = get_word2vec_embeddings (word2vec, df, generate_missing=True)
text_embeddings = np.asarray(text_embeddings)
text_embeddings.shape
(1096, 100)
EN

回答 1

Stack Overflow用户

发布于 2022-06-29 02:53:08

好的。经过几天的学习,我发现我可以通过伯特从文本中获得三维特征。一些参考资料是(只是为了分享);

伯特去营救! Bert的情感分析

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72589801

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档