我有一些顺序数据(例如音频、视频、文本等)。我用这种方法对序列进行分类。我确信它有个名字,但我想不起来:
vectors =
t1,[v1_0....v1_n]
t2,[v2_0....v2_n]
:
:
tm,[vm_0....vm_n]其中,t1..tm是时间偏移,VM是特征向量。
从这些数据中,我使用不同的window_size和step_size创建过采样
[t0,win_size,step_size, np.median(vectors[frame_id:frame_id+win_size],axis=0)]
win_size = the size of the window to mean/median ahead
step_size = how many columns to move with each step
np.median(vectors[frame_id:frame_id+win_size],axis=0) = column0wise mean or median across the array as a resultant of the vectors并使用上述方法训练分类器,并应在多个尺度(例如,大窗口大小)上生成预测。
编辑:对于预测,从查询剪辑中提取出一组相似的向量,然后以某种方式聚合预测以生成“共识”。
发布于 2020-06-28 23:24:02
我会叫它多头卷积模型。
https://datascience.stackexchange.com/questions/76812
复制相似问题